Voz y transcripción
(71)Mcporter
Mcporter: Utiliza el CLI de mcporter para listar, configurar, autenticar y llamar servidores/herramientas MCP directamente (HTTP o stdio), incluyendo servidores ad-hoc, ediciones de configuración y generación de CLI/tipo.
/mcporterOpenClaw YouTube Transcript
Transcripción de videos de YouTube a texto mediante la extracción de subtítulos directamente desde la URL del video usando yt-dlp sin procesamiento de audio.
/openclaw-youtube-transcriptSag
Sag: once ElevenLabs text-to-speech con UX de estilo mac.
YouTube Transcript
Transcripción de YouTube: Recupera y resume transcripciones de videos de YouTube. Usa esto cuando se te pida resumir, transcribir o extraer contenido de videos de YouTube. Maneja la recuperación de transcripciones a través de un proxy IP residencial para evitar los bloques de IP en la nube de YouTube.
/youtube-transcriptLocal Whisper
Voz Local: Voz a texto local utilizando OpenAI Whisper. Funciona completamente sin conexión después de la descarga del modelo. Transcripción de alta calidad con múltiples tamaños de modelo.
/local-whisperelevenlabs-voices
Síntesis de voz de alta calidad con 18 personalidades, 32.
/elevenlabs-voiceselevenlabs-tts
TTS de ElevenLabs - la mejor integración de ElevenLabs para OpenClaw.
/elevenlabs-ttsVoice Transcribe
Transcripción de voz: Transcribe archivos de audio utilizando el modelo gpt-4o-mini-transcribe de OpenAI con sugerencias de vocabulario y sustituciones de texto. Requiere uv (https://docs.astral.sh/uv/).
/voice-transcribejarvis-voice
Voz de IA metálica con TTS y estilo de transcripción visual
/jarvis-voicekokoro-tts
Genera audio hablado a partir de texto utilizando el motor local Kokoro TTS
/kokoro-ttsElevenLabs Speech-to-Text
Transcribir archivos de audio utilizando ElevenLabs Speech-to-Text (Scribe v2)
/elevenlabs-sttMlx Whisper
Voz local a texto con MLX Whisper (optimizado para Apple Silicon, sin clave de API)
/mlx-whisperTranscribe audio files via OpenRouter using audio-capable models
Transcribir archivos de audio mediante OpenRouter utilizando modelos con capacidad de audio: Transcribir archivos de audio mediante OpenRouter utilizando modelos con capacidad de audio (Gemini, GPT-4o-audio, etc.)
/openrouter-transcribeGemini STT
Transcribir archivos de audio utilizando la API Gemini de Google o Vertex AI
/gemini-sttTts
Convertir texto en voz utilizando la API de Hume AI (o OpenAI). Utilizar cuando el usuario solicite un mensaje de audio, una respuesta en voz o para escuchar algo "de vive voz".
Local Whisper
Locutor Local: Lenguaje hablado local gratuito para Telegram y WhatsApp utilizando MLX Whisper en Apple Silicon. Privado, sin costos de API.
/whisper-mlx-localTranscribe
Transcribir: Transcribe archivos de audio a texto utilizando Whisper local (Docker). Utilizar cuando se reciben mensajes de voz, archivos de audio (.mp3, .m4a, .ogg, .wav, .webm) o cuando se solicite transcribir contenido de audio.
/transcribeassemblyai-transcribe
Transcribir audio/video con AssemblyAI
/assemblyai-transcribeLocal STT (Nvidia Parakeet + Whisper Support)
STT local (Nvidia Parakeet + soporte Whisper): STT local con backends seleccionables - Parakeet (mejor precisión) o Whisper (más rápido, multilingüe).
/local-sttcritical-article-writer
Generar artículos de borrador y resúmenes.
/critical-article-writerit will help you to send voice messages to your AI Assistant and also can make it talk
Te ayudará a enviar mensajes de voz a tu Asistente de IA y también puede hacer que hable: Texto a Voz y Voz a Texto utilizando el AI de ElevenLabs. Úsalo cuando el usuario quiera convertir texto a voz, transcribir mensajes de voz o trabajar con voz en múltiples idiomas. Soporta voces de IA de alta calidad y transcripción precisa.
/elevenlabs-voiceelevenlabs-transcribe
Transcripción de audio a texto utilizando ElevenLabs.
/elevenlabs-transcribeParakeet Stt
Speech-to-text local con NVIDIA Parakeet TDT 0.6B v3 (ONNX en CPU). 30 veces más rápido que Whisper, 25 idiomas, detección automática, API compatible con OpenAI. Utilice para transcribir archivos de audio, convertir voz a texto o procesar grabaciones de voz localmente sin APIs en la nube.
/parakeet-sttdeepgram
Interfaz de línea de comandos para Deepgram (transcripción de voz a texto).
/deepgramannouncer
Anunciar texto a través de los altavoces AirPlay utilizando Airfoil +
/announcerSpeech To Text
Transcripción de voz a texto con modelos Whisper mediante el CLI inference.sh. Modelos: Fast Whisper Large V3, Whisper V3 Large. Capabilities: transcripción, traducción,...
/speech-to-textVoice
Voz: Convertir texto en voz utilizando el motor TTS de Microsoft Edge con voces personalizables, reproducción directa y limpieza automática de archivos temporales.
/voiceaddis-assistant-stt
Proporciona Speech-to-Text (STT) y texto.
/addis-assistant-sttPocket Tts
Generar voz en inglés de alta calidad de manera offline en el CPU utilizando 8 voces integradas o clonación de voz personalizada con el modelo Pocket TTS de Kyutai.
/pocket-ttsVoicenotes
Sincroniza y accede a las notas de voz desde Voicenotes.com. Úsalo cuando el usuario desee recuperar sus grabaciones de voz, transcripciones y resúmenes de IA de Voicenotes. Soporta la recuperación de notas, la sincronización a markdown y la búsqueda de transcripciones.
/voicenotesTranscribe Audio with Parakeet MLX
Transcribir Audio con Parakeet MLX: Reconocimiento de voz local con Parakeet MLX (ASR) para Apple Silicon (sin clave de API).
/parakeet-mlxdeepdub-tts
Generar audio de habla utilizando Deepdub y adjuntarlo como MEDIO.
/deepdub-ttschichi-speech
Servicio RESTful para texto a voz de alta calidad utilizando Qwen3
/chichi-speechVoicenotes Official
Esta habilidad oficial de la equipo Voicenotes ofrece acceso a nuevas APIs y la capacidad de buscar semánticamente, recuperar transcripciones completas, filtrar por t...
/voicenotes-officialtl;dw - YouTube Video Summarizer
tl;dw - Resumen de Videos de YouTube: Extrae los transcritos de los videos de YouTube y proporciona resúmenes concisos que resaltan los puntos principales, argumentos y conclusiones sin tener que ver el video completo.
Openai Tts.Bak 2026 01 28T18:01:23+10:30
Texto a voz a través de la API de Voz de Audio de OpenAI
/openai-tts-bak-2026-01-28t18-01-23-10-30speech-recognition
Reconocimiento de voz general. Soporta varios formatos de audio (ogg/mp3/wav/m4a) y utiliza la API SenseVoice API basada en silicio para la conversión de voz a texto. Se activa cuando el usuario envía mensajes de voz, archivos de audio o necesita transcribir audio.
/speech-recognitionfreshbooks-cli
CLI de FreshBooks para gestionar facturas, clientes y facturación.
/freshbooks-cliText To Speech
Texto a Voz: Convierte texto en habla natural con DIA TTS, Kokoro, Chatterbox y más a través de CLI inference.sh. Modelos: DIA TTS (conversacional), Kokoro TTS, Chatterbox, Hig...
/text-to-speechAssemblyAI Transcriber
Asistente de Transcripción de AssemblyAI: Transcribe archivos de audio con diarización de oradores (quién habla cuándo). Soporta más de 100 idiomas, detección automática de idioma y marcas de tiempo. Úsalo para reuniones, entrevistas, podcasts o mensajes de voz. Requiere clave de API de AssemblyAI.
/assemblyai-transcriberWhisper Transcribe
Transcripción de Susurro: Transcribe audio files to text using OpenAI Whisper. Supports speech-to-text with auto language detection, multiple output formats (txt, srt, vtt, ), batch processing, and model selection (tiny to large). Use when transcribing audio recordings, podcasts, voice messages, lectures, meetings, or any audio/video file to text. Handles mp3, wav, m4a, ogg, flac, webm, opus, aac formats.
/whisper-transcribeeternal-haven-lore-pack
Packe de lore de Eternal Haven + packe mitológico.
/eternal-haven-lore-packagent-voice
Plataforma de blogging en línea de línea de comandos para agentes de IA.
/agent-voiceakaunting
Interactúa con el software de contabilidad de código abierto Akaunting a través de la API REST.
/akauntingauto-whisper-safe
Transcripción de voz segura para RAM con auto-chunking — funciona en máquinas de 16GB sin errores
/auto-whisper-safebrw-de-ai-ify
Eliminar jerga generada por IA y restaurar la voz humana al texto
/brw-de-ai-ifydellight-cro-revenue-ops
DELLIGHT.AI es una empresa emergente de IA en DIFC, Dubai.
/dellight-cro-revenue-opsdocuments-ai
API de OCR en tiempo real y extracción de datos por Veryfi.
/documents-aidoubao-api-open-tts
Servicio de Texto a Voz utilizando Doubao (Motor Volcán).
/doubao-api-open-ttseachlabs-voice-audio
TTS, STT, conversión de voz utilizando ElevenLabs, Whisper, RVC.
/eachlabs-voice-audiofeishu-minutes
Obtener información, estadísticas, transcripción y medios de Feishu.
/feishu-minutesgettr-transcribe-summarize
Descargar audio de un post en GETTR.
/gettr-transcribe-summarizehebrew-nikud
Referencia de nikud (puntos vocálicos) hebreos para agentes de IA.
/hebrew-nikudnorman-categorize-transactions
Revisión y categorización de transacciones bancarias sin clasificar, coincidencia con facturas y verificación de entradas contables
/norman-categorize-transactionsnorman-monthly-reconciliation
Realización de una reconciliación financiera mensual completa - revisión de todas las transacciones, coincidencia de facturas, verificación de saldos pendientes
/norman-monthly-reconciliationressemble
Integración de Text-to-Speech y Speech-to-Text utilizando la API HTTP de Resemble AI
/ressemblesiliconflow-tts-gen
Text-to-Speech utilizando la API SiliconFlow (CosyVoice2)
/siliconflow-tts-gen