Início/Fala e Transcrição
🎙️

Fala e Transcrição

(71)
🎖️Destaque
41,621

Mcporter

Uso do mcporter CLI para listar, configurar, autenticar e chamar servidores/ferramentas MCP diretamente (HTTP ou stdio), incluindo servidores ad-hoc, edições de configuração e geração de CLI/type.

🎖️Destaque
31,978

OpenClaw YouTube Transcript

OpenClaw YouTube Transcript: Transcreva vídeos do YouTube para texto extrayendo legendas e subtítulos diretamente da URL do vídeo usando yt-dlp sem processamento de áudio.

🎙️Fala e Transcrição/openclaw-youtube-transcript
🎖️Destaque
18,448

Sag

Sag: Text-to-speech da ElevenLabs com UX de fala no estilo Mac.

🎖️Destaque
15,590

YouTube Transcript

Transcrição do YouTube: Recupere e resuma transcrições de vídeos do YouTube. Use quando solicitado a resumir, transcrever ou extrair conteúdo de vídeos do YouTube. Manipula a recuperação de transcrições via proxy de IP residencial para contornar os bloqueios de IP da nuvem do YouTube.

🎙️Fala e Transcrição/youtube-transcript

Local Whisper

Local Whisper: Voz para texto local usando OpenAI Whisper. Funciona completamente offline após o download do modelo. Transcrição de alta qualidade com múltiplos tamanhos de modelo.

elevenlabs-voices

Síntese de voz de alta qualidade com 18 personagens, 32.

🎙️Fala e Transcrição/elevenlabs-voices

faster-whisper

Fala local para texto usando o faster-whisper.

elevenlabs-tts

ElevenLabs TTS - a melhor integração do ElevenLabs para OpenClaw.

Voice Transcribe

Transcreva arquivos de áudio usando o modelo gpt-4o-mini-transcribe da OpenAI com dicas de vocabulário e substituições de texto. Requer uv (https://docs.astral.sh/uv/).

jarvis-voice

Persona de voz AI metálica com estilo de transcrição visual e TTS.

kokoro-tts

Gerar áudio falado a partir de texto usando o motor de TTS local Kokoro.

ElevenLabs Speech-to-Text

ElevenLabs Speech-to-Text: Transcreva arquivos de áudio usando o ElevenLabs Speech-to-Text (Scribe v2).

Mlx Whisper

Fala Local com Mlx Whisper: Conversão de fala para texto local com Mlx Whisper (otimizado para Apple Silicon, sem chave de API).

Transcribe audio files via OpenRouter using audio-capable models

Transcrever arquivos de áudio através do OpenRouter usando modelos com capacidade de áudio: Transcrever arquivos de áudio através do OpenRouter usando modelos com capacidade de áudio (Gemini, GPT-4o-audio, etc).

🎙️Fala e Transcrição/openrouter-transcribe

Gemini STT

Transcreva arquivos de áudio usando a API Gemini da Google ou Vertex AI

Tts

Tts: Converta texto para fala usando a API do Hume AI (ou OpenAI). Use quando o usuário pedir uma mensagem de áudio, uma resposta por voz ou para ouvir algo 'de viva voz'.

Local Whisper

Whisper Local: Fala para texto local gratuito para Telegram e WhatsApp usando MLX Whisper em Apple Silicon. Privado, sem custos de API.

🎙️Fala e Transcrição/whisper-mlx-local

Transcribe

Transcrever arquivos de áudio para texto usando Whisper local (Docker). Use quando receber mensagens de voz, arquivos de áudio (.mp3, .m4a, .ogg, .wav, .webm), ou quando for solicitado para transcrever conteúdo de áudio.

assemblyai-transcribe

Transcrever áudio/vídeo com AssemblyAI.

🎙️Fala e Transcrição/assemblyai-transcribe

elevenlabs-agents

Criar, gerenciar e implantar ElevenLabs.

🎙️Fala e Transcrição/elevenlabs-agents

Local STT (Nvidia Parakeet + Whisper Support)

STT Local (Suporte Nvidia Parakeet + Whisper): STT local com backends selecionáveis - Parakeet (melhor precisão) ou Whisper (mais rápido, multilíngue).

audio-gen

Gerar áudios de livros, podcasts ou conteúdo educacional de áudio.

critical-article-writer

Gerar artigos provisórios e esboços

🎙️Fala e Transcrição/critical-article-writer

audio-reply

Gerar respostas em áudio usando TTS.

🎙️Fala e Transcrição/audio-reply-skill

it will help you to send voice messages to your AI Assistant and also can make it talk

Vai ajudar você a enviar mensagens de voz para seu Assistente de IA e também pode fazê-lo falar: Texto para Voz e Voz para Texto usando a IA do ElevenLabs. Use quando o usuário quiser converter texto para voz, transcrever mensagens de voz ou trabalhar com voz em múltiplas línguas. Suporta vozes de IA de alta qualidade e transcrição precisa.

elevenlabs-transcribe

Transcrever áudio em texto usando ElevenLabs.

🎙️Fala e Transcrição/elevenlabs-transcribe

Parakeet Stt

Parakeet Stt: Voz para Texto Local com NVIDIA Parakeet TDT 0.6B v3 (ONNX no CPU). 30x mais rápido que o Whisper, 25 idiomas, deteção automática, API compatível com a OpenAI. Use ao transcrever arquivos de áudio, converter fala para texto ou processar gravações de voz localmente sem APIs na nuvem.

deepgram

interface de linha de comando para o reconhecimento de voz do Deepgram

announcer

Anunciar texto por toda a casa através de alto-falantes AirPlay usando Airfoil +.

Speech To Text

Transcreva áudio para texto com modelos Whisper via CLI inference.sh. Modelos: Fast Whisper Large V3, Whisper V3 Large. Capacidades: transcrição, tradução,...

Voice

Voz: Converta texto para fala usando o motor TTS do Microsoft Edge com vozes personalizáveis, reprodução direta e limpeza automática de arquivos temporários.

addis-assistant-stt

Fornece Reconhecimento de Voz (STT) e texto.

🎙️Fala e Transcrição/addis-assistant-stt

Pocket Tts

Pocket Tts: Gere fala inglesa de alta qualidade offline no CPU usando 8 vozes integradas ou clonagem de voz personalizada com o modelo Pocket TTS da Kyutai.

inworld-tts

Texto para fala via API Inworld.ai.

Voicenotes

Sincronize e acesse notas de voz do Voicenotes.com. Use quando o usuário deseja recuperar suas gravações de voz, transcrições e resumos de IA do Voicenotes. Suporta busca de notas, sincronização para markdown e busca de transcrições.

claw-voice

Você está conectado a uma sessão de usuário ao vivo via voz.

Transcribe Audio with Parakeet MLX

Transcrever Áudio com Parakeet MLX: Voz para texto local com Parakeet MLX (ASR) para Apple Silicon (sem chave de API).

clonev

Clone qualquer voz e gere fala usando Coqui XTTS v2.

cult-of-carcinization

Dê uma voz e ouvidos ao seu agente

🎙️Fala e Transcrição/cult-of-carcinization

deepdub-tts

Gerar áudio de fala usando Deepdub e anexá-lo como MÍDIA

chichi-speech

Um serviço RESTful de alta qualidade para texto para voz usando Qwen3.

lnbits

Gerenciar carteira Lightning LNbits (Saldo, Pagamento, Fatura).

Voicenotes Official

Voicenotes Official: Este Skill oficial da equipe Voicenotes dá acesso a novos APIs e a capacidade de pesquisar semanticamente, recuperar transcrições completas, filtrar por t...

🎙️Fala e Transcrição/voicenotes-official

tl;dw - YouTube Video Summarizer

tl;dw - Resumidor de Vídeos do YouTube: Extrai transcrições de vídeos do YouTube e fornece resumos concisos destacando pontos principais, argumentos e conclusões sem assistir ao vídeo completo.

Openai Tts.Bak 2026 01 28T18:01:23+10:30

Openai Tts.Bak 2026 01 28T18:01:23+10:30: Text-to-speech via OpenAI Audio Speech API.

🎙️Fala e Transcrição/openai-tts-bak-2026-01-28t18-01-23-10-30

speech-recognition

Reconhecimento de Voz Geral. Suporta vários formatos de áudio (ogg/mp3/wav/m4a), usando a API SenseVoice API de silício fluido para conversão de voz para texto. Aciona quando o usuário envia mensagens de voz, arquivos de áudio ou precisa transcrever áudio.

🎙️Fala e Transcrição/speech-recognition

freshbooks-cli

CLI do FreshBooks para gerenciar faturas, clientes e cobranças.

Text To Speech

Texto para Voz: Converta texto para fala natural com DIA TTS, Kokoro, Chatterbox e mais via CLI inference.sh. Modelos: DIA TTS (conversacional), Kokoro TTS, Chatterbox, Hig...

AssemblyAI Transcriber

AssemblyAI Transcriber: Transcreva arquivos de áudio com diarização de falantes (quem fala quando). Suporta 100+ idiomas, deteção automática de idioma e marcas de tempo. Use para reuniões, entrevistas, podcasts ou mensagens de voz. Requer chave da API do AssemblyAI.

🎙️Fala e Transcrição/assemblyai-transcriber

Whisper Transcribe

Transcricao Whisper: Transcreva arquivos de áudio para texto usando o OpenAI Whisper. Suporta reconhecimento de fala para texto com deteção automática de idioma, múltiplos formatos de saída (txt, srt, vtt, ), processamento em lote e seleção de modelo (pequeno a grande). Use quando transcrever gravações de áudio, podcasts, mensagens de voz, palestras, reuniões ou qualquer arquivo de áudio/vídeo para texto. Manipula formatos mp3, wav, m4a, ogg, flac, webm, opus, aac.

🎙️Fala e Transcrição/whisper-transcribe

eternal-haven-lore-pack

Conjunto de lore e pack de personagens míticos das Crônicas do Etéreo Refúgio.

🎙️Fala e Transcrição/eternal-haven-lore-pack

agent-voice

Plataforma de blog por linha de comando para agentes de IA.

akaunting

Interaja com o software de contabilidade open-source Akaunting via API REST.

auto-whisper-safe

Transcrição de voz segura com auto-parteção — funciona em máquinas com 16GB de RAM sem travamentos.

🎙️Fala e Transcrição/auto-whisper-safe

brw-de-ai-ify

Remover jargão gerado por IA e restaurar voz humana para texto.

dellight-cro-revenue-ops

DELLIGHT.AI é uma startup de IA localizada no DIFC, Dubai

🎙️Fala e Transcrição/dellight-cro-revenue-ops

documents-ai

API de OCR em tempo real e extração de dados pelo Veryfi

doubao-api-open-tts

Serviço de Texto para Voz usando Doubao (Motor Vulcão)

🎙️Fala e Transcrição/doubao-api-open-tts

duby

Converter texto para voz usando a API Duby.so

eachlabs-voice-audio

TTS, STT, conversão de voz usando ElevenLabs, Whisper, RVC

🎙️Fala e Transcrição/eachlabs-voice-audio

easyverein-api

Trabalhar com a API REST easyVerein v2.0.

elevenlabs-media

Geração de música com ElevenLabs.

feishu-minutes

Busca informações, estatísticas, transcrições e mídias do Feishu.

gettr-transcribe-summarize

Baixar áudio de uma publicação no GETTR.

🎙️Fala e Transcrição/gettr-transcribe-summarize

hebrew-nikud

Referência de nikud (pontuação vocal) em hebraico para agentes de IA.

her-voice

Dar uma voz ao seu agente.

miranda-sag

Text-to-speech da ElevenLabs com interface de UX de estilo macOS.

norman-categorize-transactions

Revisar e categorizar transações bancárias não categorizadas, correspondê-las a faturas e verificar entradas contábeis.

🎙️Fala e Transcrição/norman-categorize-transactions

norman-monthly-reconciliation

Realizar uma conciliação financeira mensal completa - revisar todas as transações, correspondê-las a faturas e verificar o saldo em aberto.

🎙️Fala e Transcrição/norman-monthly-reconciliation

ressemble

Integração de Texto para Voz e Voz para Texto usando a API HTTP do Resemble AI.

siliconflow-tts-gen

SiliconFlow-tts-gen: Text-to-Speech usando a API SiliconFlow (CosyVoice2)

🎙️Fala e Transcrição/siliconflow-tts-gen