Fala e Transcrição
(71)Mcporter
Uso do mcporter CLI para listar, configurar, autenticar e chamar servidores/ferramentas MCP diretamente (HTTP ou stdio), incluindo servidores ad-hoc, edições de configuração e geração de CLI/type.
/mcporterOpenClaw YouTube Transcript
OpenClaw YouTube Transcript: Transcreva vídeos do YouTube para texto extrayendo legendas e subtítulos diretamente da URL do vídeo usando yt-dlp sem processamento de áudio.
/openclaw-youtube-transcriptSag
Sag: Text-to-speech da ElevenLabs com UX de fala no estilo Mac.
YouTube Transcript
Transcrição do YouTube: Recupere e resuma transcrições de vídeos do YouTube. Use quando solicitado a resumir, transcrever ou extrair conteúdo de vídeos do YouTube. Manipula a recuperação de transcrições via proxy de IP residencial para contornar os bloqueios de IP da nuvem do YouTube.
/youtube-transcriptLocal Whisper
Local Whisper: Voz para texto local usando OpenAI Whisper. Funciona completamente offline após o download do modelo. Transcrição de alta qualidade com múltiplos tamanhos de modelo.
/local-whisperelevenlabs-voices
Síntese de voz de alta qualidade com 18 personagens, 32.
/elevenlabs-voiceselevenlabs-tts
ElevenLabs TTS - a melhor integração do ElevenLabs para OpenClaw.
/elevenlabs-ttsVoice Transcribe
Transcreva arquivos de áudio usando o modelo gpt-4o-mini-transcribe da OpenAI com dicas de vocabulário e substituições de texto. Requer uv (https://docs.astral.sh/uv/).
/voice-transcribejarvis-voice
Persona de voz AI metálica com estilo de transcrição visual e TTS.
/jarvis-voicekokoro-tts
Gerar áudio falado a partir de texto usando o motor de TTS local Kokoro.
/kokoro-ttsElevenLabs Speech-to-Text
ElevenLabs Speech-to-Text: Transcreva arquivos de áudio usando o ElevenLabs Speech-to-Text (Scribe v2).
/elevenlabs-sttMlx Whisper
Fala Local com Mlx Whisper: Conversão de fala para texto local com Mlx Whisper (otimizado para Apple Silicon, sem chave de API).
/mlx-whisperTranscribe audio files via OpenRouter using audio-capable models
Transcrever arquivos de áudio através do OpenRouter usando modelos com capacidade de áudio: Transcrever arquivos de áudio através do OpenRouter usando modelos com capacidade de áudio (Gemini, GPT-4o-audio, etc).
/openrouter-transcribeGemini STT
Transcreva arquivos de áudio usando a API Gemini da Google ou Vertex AI
/gemini-sttTts
Tts: Converta texto para fala usando a API do Hume AI (ou OpenAI). Use quando o usuário pedir uma mensagem de áudio, uma resposta por voz ou para ouvir algo 'de viva voz'.
Local Whisper
Whisper Local: Fala para texto local gratuito para Telegram e WhatsApp usando MLX Whisper em Apple Silicon. Privado, sem custos de API.
/whisper-mlx-localTranscribe
Transcrever arquivos de áudio para texto usando Whisper local (Docker). Use quando receber mensagens de voz, arquivos de áudio (.mp3, .m4a, .ogg, .wav, .webm), ou quando for solicitado para transcrever conteúdo de áudio.
/transcribeassemblyai-transcribe
Transcrever áudio/vídeo com AssemblyAI.
/assemblyai-transcribeLocal STT (Nvidia Parakeet + Whisper Support)
STT Local (Suporte Nvidia Parakeet + Whisper): STT local com backends selecionáveis - Parakeet (melhor precisão) ou Whisper (mais rápido, multilíngue).
/local-sttaudio-gen
Gerar áudios de livros, podcasts ou conteúdo educacional de áudio.
/audio-gencritical-article-writer
Gerar artigos provisórios e esboços
/critical-article-writerit will help you to send voice messages to your AI Assistant and also can make it talk
Vai ajudar você a enviar mensagens de voz para seu Assistente de IA e também pode fazê-lo falar: Texto para Voz e Voz para Texto usando a IA do ElevenLabs. Use quando o usuário quiser converter texto para voz, transcrever mensagens de voz ou trabalhar com voz em múltiplas línguas. Suporta vozes de IA de alta qualidade e transcrição precisa.
/elevenlabs-voiceelevenlabs-transcribe
Transcrever áudio em texto usando ElevenLabs.
/elevenlabs-transcribeParakeet Stt
Parakeet Stt: Voz para Texto Local com NVIDIA Parakeet TDT 0.6B v3 (ONNX no CPU). 30x mais rápido que o Whisper, 25 idiomas, deteção automática, API compatível com a OpenAI. Use ao transcrever arquivos de áudio, converter fala para texto ou processar gravações de voz localmente sem APIs na nuvem.
/parakeet-sttdeepgram
interface de linha de comando para o reconhecimento de voz do Deepgram
/deepgramannouncer
Anunciar texto por toda a casa através de alto-falantes AirPlay usando Airfoil +.
/announcerSpeech To Text
Transcreva áudio para texto com modelos Whisper via CLI inference.sh. Modelos: Fast Whisper Large V3, Whisper V3 Large. Capacidades: transcrição, tradução,...
/speech-to-textVoice
Voz: Converta texto para fala usando o motor TTS do Microsoft Edge com vozes personalizáveis, reprodução direta e limpeza automática de arquivos temporários.
/voiceaddis-assistant-stt
Fornece Reconhecimento de Voz (STT) e texto.
/addis-assistant-sttPocket Tts
Pocket Tts: Gere fala inglesa de alta qualidade offline no CPU usando 8 vozes integradas ou clonagem de voz personalizada com o modelo Pocket TTS da Kyutai.
/pocket-ttsVoicenotes
Sincronize e acesse notas de voz do Voicenotes.com. Use quando o usuário deseja recuperar suas gravações de voz, transcrições e resumos de IA do Voicenotes. Suporta busca de notas, sincronização para markdown e busca de transcrições.
/voicenotesclaw-voice
Você está conectado a uma sessão de usuário ao vivo via voz.
/claw-voiceTranscribe Audio with Parakeet MLX
Transcrever Áudio com Parakeet MLX: Voz para texto local com Parakeet MLX (ASR) para Apple Silicon (sem chave de API).
/parakeet-mlxchichi-speech
Um serviço RESTful de alta qualidade para texto para voz usando Qwen3.
/chichi-speechVoicenotes Official
Voicenotes Official: Este Skill oficial da equipe Voicenotes dá acesso a novos APIs e a capacidade de pesquisar semanticamente, recuperar transcrições completas, filtrar por t...
/voicenotes-officialtl;dw - YouTube Video Summarizer
tl;dw - Resumidor de Vídeos do YouTube: Extrai transcrições de vídeos do YouTube e fornece resumos concisos destacando pontos principais, argumentos e conclusões sem assistir ao vídeo completo.
/tldwOpenai Tts.Bak 2026 01 28T18:01:23+10:30
Openai Tts.Bak 2026 01 28T18:01:23+10:30: Text-to-speech via OpenAI Audio Speech API.
/openai-tts-bak-2026-01-28t18-01-23-10-30speech-recognition
Reconhecimento de Voz Geral. Suporta vários formatos de áudio (ogg/mp3/wav/m4a), usando a API SenseVoice API de silício fluido para conversão de voz para texto. Aciona quando o usuário envia mensagens de voz, arquivos de áudio ou precisa transcrever áudio.
/speech-recognitionfreshbooks-cli
CLI do FreshBooks para gerenciar faturas, clientes e cobranças.
/freshbooks-cliText To Speech
Texto para Voz: Converta texto para fala natural com DIA TTS, Kokoro, Chatterbox e mais via CLI inference.sh. Modelos: DIA TTS (conversacional), Kokoro TTS, Chatterbox, Hig...
/text-to-speechAssemblyAI Transcriber
AssemblyAI Transcriber: Transcreva arquivos de áudio com diarização de falantes (quem fala quando). Suporta 100+ idiomas, deteção automática de idioma e marcas de tempo. Use para reuniões, entrevistas, podcasts ou mensagens de voz. Requer chave da API do AssemblyAI.
/assemblyai-transcriberWhisper Transcribe
Transcricao Whisper: Transcreva arquivos de áudio para texto usando o OpenAI Whisper. Suporta reconhecimento de fala para texto com deteção automática de idioma, múltiplos formatos de saída (txt, srt, vtt, ), processamento em lote e seleção de modelo (pequeno a grande). Use quando transcrever gravações de áudio, podcasts, mensagens de voz, palestras, reuniões ou qualquer arquivo de áudio/vídeo para texto. Manipula formatos mp3, wav, m4a, ogg, flac, webm, opus, aac.
/whisper-transcribeeternal-haven-lore-pack
Conjunto de lore e pack de personagens míticos das Crônicas do Etéreo Refúgio.
/eternal-haven-lore-packagent-voice
Plataforma de blog por linha de comando para agentes de IA.
/agent-voiceakaunting
Interaja com o software de contabilidade open-source Akaunting via API REST.
/akauntingauto-whisper-safe
Transcrição de voz segura com auto-parteção — funciona em máquinas com 16GB de RAM sem travamentos.
/auto-whisper-safebrw-de-ai-ify
Remover jargão gerado por IA e restaurar voz humana para texto.
/brw-de-ai-ifydellight-cro-revenue-ops
DELLIGHT.AI é uma startup de IA localizada no DIFC, Dubai
/dellight-cro-revenue-opsdocuments-ai
API de OCR em tempo real e extração de dados pelo Veryfi
/documents-aidoubao-api-open-tts
Serviço de Texto para Voz usando Doubao (Motor Vulcão)
/doubao-api-open-ttseachlabs-voice-audio
TTS, STT, conversão de voz usando ElevenLabs, Whisper, RVC
/eachlabs-voice-audiofeishu-minutes
Busca informações, estatísticas, transcrições e mídias do Feishu.
/feishu-minutesgettr-transcribe-summarize
Baixar áudio de uma publicação no GETTR.
/gettr-transcribe-summarizehebrew-nikud
Referência de nikud (pontuação vocal) em hebraico para agentes de IA.
/hebrew-nikudmiranda-sag
Text-to-speech da ElevenLabs com interface de UX de estilo macOS.
/miranda-sagnorman-categorize-transactions
Revisar e categorizar transações bancárias não categorizadas, correspondê-las a faturas e verificar entradas contábeis.
/norman-categorize-transactionsnorman-monthly-reconciliation
Realizar uma conciliação financeira mensal completa - revisar todas as transações, correspondê-las a faturas e verificar o saldo em aberto.
/norman-monthly-reconciliationressemble
Integração de Texto para Voz e Voz para Texto usando a API HTTP do Resemble AI.
/ressemblesiliconflow-tts-gen
SiliconFlow-tts-gen: Text-to-Speech usando a API SiliconFlow (CosyVoice2)
/siliconflow-tts-gen