Início/Fala e Transcrição

🎙️

Fala e Transcrição

(71)

🎖️Destaque

41,621

Mcporter

Uso do mcporter CLI para listar, configurar, autenticar e chamar servidores/ferramentas MCP diretamente (HTTP ou stdio), incluindo servidores ad-hoc, edições de configuração e geração de CLI/type.

🎙️Fala e Transcrição/mcporter

🎖️Destaque

31,978

OpenClaw YouTube Transcript

OpenClaw YouTube Transcript: Transcreva vídeos do YouTube para texto extrayendo legendas e subtítulos diretamente da URL do vídeo usando yt-dlp sem processamento de áudio.

🎙️Fala e Transcrição/openclaw-youtube-transcript

🎖️Destaque

18,448

Sag

Sag: Text-to-speech da ElevenLabs com UX de fala no estilo Mac.

🎙️Fala e Transcrição/sag

🎖️Destaque

15,590

YouTube Transcript

Transcrição do YouTube: Recupere e resuma transcrições de vídeos do YouTube. Use quando solicitado a resumir, transcrever ou extrair conteúdo de vídeos do YouTube. Manipula a recuperação de transcrições via proxy de IP residencial para contornar os bloqueios de IP da nuvem do YouTube.

🎙️Fala e Transcrição/youtube-transcript

Local Whisper

Local Whisper: Voz para texto local usando OpenAI Whisper. Funciona completamente offline após o download do modelo. Transcrição de alta qualidade com múltiplos tamanhos de modelo.

🎙️Fala e Transcrição/local-whisper

elevenlabs-voices

Síntese de voz de alta qualidade com 18 personagens, 32.

🎙️Fala e Transcrição/elevenlabs-voices

faster-whisper

Fala local para texto usando o faster-whisper.

🎙️Fala e Transcrição/faster-whisper

elevenlabs-tts

ElevenLabs TTS - a melhor integração do ElevenLabs para OpenClaw.

🎙️Fala e Transcrição/elevenlabs-tts

Voice Transcribe

Transcreva arquivos de áudio usando o modelo gpt-4o-mini-transcribe da OpenAI com dicas de vocabulário e substituições de texto. Requer uv (https://docs.astral.sh/uv/).

🎙️Fala e Transcrição/voice-transcribe

jarvis-voice

Persona de voz AI metálica com estilo de transcrição visual e TTS.

🎙️Fala e Transcrição/jarvis-voice

kokoro-tts

Gerar áudio falado a partir de texto usando o motor de TTS local Kokoro.

🎙️Fala e Transcrição/kokoro-tts

ElevenLabs Speech-to-Text

ElevenLabs Speech-to-Text: Transcreva arquivos de áudio usando o ElevenLabs Speech-to-Text (Scribe v2).

🎙️Fala e Transcrição/elevenlabs-stt

Mlx Whisper

Fala Local com Mlx Whisper: Conversão de fala para texto local com Mlx Whisper (otimizado para Apple Silicon, sem chave de API).

🎙️Fala e Transcrição/mlx-whisper

Transcribe audio files via OpenRouter using audio-capable models

Transcrever arquivos de áudio através do OpenRouter usando modelos com capacidade de áudio: Transcrever arquivos de áudio através do OpenRouter usando modelos com capacidade de áudio (Gemini, GPT-4o-audio, etc).

🎙️Fala e Transcrição/openrouter-transcribe

Gemini STT

Transcreva arquivos de áudio usando a API Gemini da Google ou Vertex AI

🎙️Fala e Transcrição/gemini-stt

Tts

Tts: Converta texto para fala usando a API do Hume AI (ou OpenAI). Use quando o usuário pedir uma mensagem de áudio, uma resposta por voz ou para ouvir algo 'de viva voz'.

🎙️Fala e Transcrição/tts

Local Whisper

Whisper Local: Fala para texto local gratuito para Telegram e WhatsApp usando MLX Whisper em Apple Silicon. Privado, sem custos de API.

🎙️Fala e Transcrição/whisper-mlx-local

Transcribe

Transcrever arquivos de áudio para texto usando Whisper local (Docker). Use quando receber mensagens de voz, arquivos de áudio (.mp3, .m4a, .ogg, .wav, .webm), ou quando for solicitado para transcrever conteúdo de áudio.

🎙️Fala e Transcrição/transcribe

assemblyai-transcribe

Transcrever áudio/vídeo com AssemblyAI.

🎙️Fala e Transcrição/assemblyai-transcribe

elevenlabs-agents

Criar, gerenciar e implantar ElevenLabs.

🎙️Fala e Transcrição/elevenlabs-agents

Local STT (Nvidia Parakeet + Whisper Support)

STT Local (Suporte Nvidia Parakeet + Whisper): STT local com backends selecionáveis - Parakeet (melhor precisão) ou Whisper (mais rápido, multilíngue).

🎙️Fala e Transcrição/local-stt

audio-gen

Gerar áudios de livros, podcasts ou conteúdo educacional de áudio.

🎙️Fala e Transcrição/audio-gen

critical-article-writer

Gerar artigos provisórios e esboços

🎙️Fala e Transcrição/critical-article-writer

audio-reply

Gerar respostas em áudio usando TTS.

🎙️Fala e Transcrição/audio-reply-skill

it will help you to send voice messages to your AI Assistant and also can make it talk

Vai ajudar você a enviar mensagens de voz para seu Assistente de IA e também pode fazê-lo falar: Texto para Voz e Voz para Texto usando a IA do ElevenLabs. Use quando o usuário quiser converter texto para voz, transcrever mensagens de voz ou trabalhar com voz em múltiplas línguas. Suporta vozes de IA de alta qualidade e transcrição precisa.

🎙️Fala e Transcrição/elevenlabs-voice

elevenlabs-transcribe

Transcrever áudio em texto usando ElevenLabs.

🎙️Fala e Transcrição/elevenlabs-transcribe

Parakeet Stt

Parakeet Stt: Voz para Texto Local com NVIDIA Parakeet TDT 0.6B v3 (ONNX no CPU). 30x mais rápido que o Whisper, 25 idiomas, deteção automática, API compatível com a OpenAI. Use ao transcrever arquivos de áudio, converter fala para texto ou processar gravações de voz localmente sem APIs na nuvem.

🎙️Fala e Transcrição/parakeet-stt

deepgram

interface de linha de comando para o reconhecimento de voz do Deepgram

🎙️Fala e Transcrição/deepgram

announcer

Anunciar texto por toda a casa através de alto-falantes AirPlay usando Airfoil +.

🎙️Fala e Transcrição/announcer

Speech To Text

Transcreva áudio para texto com modelos Whisper via CLI inference.sh. Modelos: Fast Whisper Large V3, Whisper V3 Large. Capacidades: transcrição, tradução,...

🎙️Fala e Transcrição/speech-to-text

Voice

Voz: Converta texto para fala usando o motor TTS do Microsoft Edge com vozes personalizáveis, reprodução direta e limpeza automática de arquivos temporários.

🎙️Fala e Transcrição/voice

addis-assistant-stt

Fornece Reconhecimento de Voz (STT) e texto.

🎙️Fala e Transcrição/addis-assistant-stt

Pocket Tts

Pocket Tts: Gere fala inglesa de alta qualidade offline no CPU usando 8 vozes integradas ou clonagem de voz personalizada com o modelo Pocket TTS da Kyutai.

🎙️Fala e Transcrição/pocket-tts

inworld-tts

Texto para fala via API Inworld.ai.

🎙️Fala e Transcrição/inworld-tts

Voicenotes

Sincronize e acesse notas de voz do Voicenotes.com. Use quando o usuário deseja recuperar suas gravações de voz, transcrições e resumos de IA do Voicenotes. Suporta busca de notas, sincronização para markdown e busca de transcrições.

🎙️Fala e Transcrição/voicenotes

claw-voice

Você está conectado a uma sessão de usuário ao vivo via voz.

🎙️Fala e Transcrição/claw-voice

Transcribe Audio with Parakeet MLX

Transcrever Áudio com Parakeet MLX: Voz para texto local com Parakeet MLX (ASR) para Apple Silicon (sem chave de API).

🎙️Fala e Transcrição/parakeet-mlx

clonev

Clone qualquer voz e gere fala usando Coqui XTTS v2.

🎙️Fala e Transcrição/clonev

cult-of-carcinization

Dê uma voz e ouvidos ao seu agente

🎙️Fala e Transcrição/cult-of-carcinization

deepdub-tts

Gerar áudio de fala usando Deepdub e anexá-lo como MÍDIA

🎙️Fala e Transcrição/deepdub-tts

chichi-speech

Um serviço RESTful de alta qualidade para texto para voz usando Qwen3.

🎙️Fala e Transcrição/chichi-speech

lnbits

Gerenciar carteira Lightning LNbits (Saldo, Pagamento, Fatura).

🎙️Fala e Transcrição/lnbits

Voicenotes Official

Voicenotes Official: Este Skill oficial da equipe Voicenotes dá acesso a novos APIs e a capacidade de pesquisar semanticamente, recuperar transcrições completas, filtrar por t...

🎙️Fala e Transcrição/voicenotes-official

tl;dw - YouTube Video Summarizer

tl;dw - Resumidor de Vídeos do YouTube: Extrai transcrições de vídeos do YouTube e fornece resumos concisos destacando pontos principais, argumentos e conclusões sem assistir ao vídeo completo.

🎙️Fala e Transcrição/tldw

Openai Tts.Bak 2026 01 28T18:01:23+10:30

Openai Tts.Bak 2026 01 28T18:01:23+10:30: Text-to-speech via OpenAI Audio Speech API.

🎙️Fala e Transcrição/openai-tts-bak-2026-01-28t18-01-23-10-30

speech-recognition

Reconhecimento de Voz Geral. Suporta vários formatos de áudio (ogg/mp3/wav/m4a), usando a API SenseVoice API de silício fluido para conversão de voz para texto. Aciona quando o usuário envia mensagens de voz, arquivos de áudio ou precisa transcrever áudio.

🎙️Fala e Transcrição/speech-recognition

freshbooks-cli

CLI do FreshBooks para gerenciar faturas, clientes e cobranças.

🎙️Fala e Transcrição/freshbooks-cli

Text To Speech

Texto para Voz: Converta texto para fala natural com DIA TTS, Kokoro, Chatterbox e mais via CLI inference.sh. Modelos: DIA TTS (conversacional), Kokoro TTS, Chatterbox, Hig...

🎙️Fala e Transcrição/text-to-speech

AssemblyAI Transcriber

AssemblyAI Transcriber: Transcreva arquivos de áudio com diarização de falantes (quem fala quando). Suporta 100+ idiomas, deteção automática de idioma e marcas de tempo. Use para reuniões, entrevistas, podcasts ou mensagens de voz. Requer chave da API do AssemblyAI.

🎙️Fala e Transcrição/assemblyai-transcriber

Whisper Transcribe

Transcricao Whisper: Transcreva arquivos de áudio para texto usando o OpenAI Whisper. Suporta reconhecimento de fala para texto com deteção automática de idioma, múltiplos formatos de saída (txt, srt, vtt, ), processamento em lote e seleção de modelo (pequeno a grande). Use quando transcrever gravações de áudio, podcasts, mensagens de voz, palestras, reuniões ou qualquer arquivo de áudio/vídeo para texto. Manipula formatos mp3, wav, m4a, ogg, flac, webm, opus, aac.

🎙️Fala e Transcrição/whisper-transcribe