Parole et transcription
(71)Mcporter
Mcporter : Utilisez la CLI mcporter pour lister, configurer, authentifier et appeler directement les serveurs/outils MCP (HTTP ou stdio), y compris les serveurs ad-hoc, les éditions de configuration et la génération CLI/type.
/mcporterOpenClaw YouTube Transcript
Transcription des vidéos YouTube en texte en extraignant les sous-titres et les légendes directement à partir de l'URL de la vidéo en utilisant yt-dlp sans traitement audio.
/openclaw-youtube-transcriptSag
Sag : ElevenLabs text-to-speech avec une interface utilisateur mac-style pour dire
YouTube Transcript
Transcription YouTube : Récupérez et résumez les transcriptions de vidéos YouTube. Utilisez cette fonctionnalité lorsqu'on vous demande de résumer, transcrire ou extraire du contenu des vidéos YouTube. Gère la récupération des transcriptions via un proxy IP résidentiel pour contourner les blocs IP nuage de YouTube.
/youtube-transcriptLocal Whisper
Local Whisper : Parole à texte local en utilisant OpenAI Whisper. Fonctionne intégralement hors ligne après le téléchargement du modèle. Transcription de haute qualité avec plusieurs tailles de modèles.
/local-whisperelevenlabs-voices
Synthèse vocale de haute qualité avec 18 personnalités, 32.
/elevenlabs-voicesfaster-whisper
Parole à texte local en utilisant faster-whisper.
/faster-whisperelevenlabs-tts
TTS ElevenLabs - la meilleure intégration ElevenLabs pour OpenClaw.
/elevenlabs-ttsVoice Transcribe
Voice Transcribe: Transcription de fichiers audio en utilisant le modèle gpt-4o-mini-transcribe d'OpenAI avec des indices de vocabulaire et des remplacements de texte. Exige uv (https://docs.astral.sh/uv/).
/voice-transcribejarvis-voice
Voix persona métallique d'IA avec TTS et mise en forme de transcription visuelle.
/jarvis-voicekokoro-tts
Génération d'audio vocal à partir de texte en utilisant le moteur local Kokoro TTS.
/kokoro-ttsElevenLabs Speech-to-Text
ElevenLabs Speech-to-Text : transcrire des fichiers audio en utilisant ElevenLabs Speech-to-Text (Scribe v2).
/elevenlabs-sttMlx Whisper
Parole à texte local avec MLX Whisper (optimisé pour Apple Silicon, sans clé API).
/mlx-whisperTranscribe audio files via OpenRouter using audio-capable models
Transcription de fichiers audio via OpenRouter en utilisant des modèles capables de traiter l'audio : Transcription de fichiers audio via OpenRouter en utilisant des modèles capables de traiter l'audio (Gemini, GPT-4o-audio, etc.).
/openrouter-transcribeGemini STT
Transcrivez les fichiers audio en utilisant l'API Gemini de Google ou Vertex AI
/gemini-sttTts
Convertir du texte en speech en utilisant l'API Hume AI (ou OpenAI). Utilisez-le lorsque l'utilisateur demande un message audio, une réponse vocale, ou pour entendre quelque chose d'"une voix vive".
Local Whisper
Local Whisper : Parole à texte local gratuite pour Telegram et WhatsApp en utilisant MLX Whisper sur Apple Silicon. Privé, sans coûts d'API.
/whisper-mlx-localTranscribe
Transcrire des fichiers audio en texte en utilisant Whisper local (Docker). Utiliser lors de la réception de messages vocaux, de fichiers audio (.mp3, .m4a, .ogg, .wav, .webm), ou lorsque l'on est demandé de transcrire du contenu audio.
/transcribeassemblyai-transcribe
Transcrivez de l'audio/video avec AssemblyAI.
/assemblyai-transcribeelevenlabs-agents
Création, gestion et déploiement d'agents ElevenLabs.
/elevenlabs-agentsLocal STT (Nvidia Parakeet + Whisper Support)
STT locale (Nvidia Parakeet + Whisper Support) : STT locale avec des backends sélectionnables - Parakeet (meilleure précision) ou Whisper (le plus rapide, multilingue).
/local-sttaudio-gen
Générez des livres audio, podcasts ou contenu audio éducatif.
/audio-gencritical-article-writer
Générer des articles de brouillon et des tableaux des matières.
/critical-article-writeraudio-reply
Générez des réponses audio en utilisant la TTS (Text-to-Speech).
/audio-reply-skillit will help you to send voice messages to your AI Assistant and also can make it talk
Il vous aidera à envoyer des messages vocaux à votre Assistant IA et peut également le faire parler : Texte à voix et Voix à texte en utilisant l'IA ElevenLabs. Utilisez-le lorsque l'utilisateur souhaite convertir du texte en speech, transcrire des messages vocaux ou travailler avec la voix dans plusieurs langues. Prend en charge des voix IA de haute qualité et une transcription précise.
/elevenlabs-voiceelevenlabs-transcribe
Transcription audio en texte en utilisant ElevenLabs.
/elevenlabs-transcribeParakeet Stt
Parakeet Stt : Parole à texte local avec NVIDIA Parakeet TDT 0.6B v3 (ONNX sur CPU). 30 fois plus rapide que Whisper, 25 langues, détection automatique, API compatible OpenAI. Utilisez cette compétence pour transcrire des fichiers audio, convertir la parole en texte ou traiter des enregistrements vocaux localement sans API dans le cloud.
/parakeet-sttdeepgram
Interface en ligne de commande pour Deepgram (transcription vocale).
/deepgramannouncer
Annoncez du texte à travers la maison via des haut-parleurs AirPlay en utilisant Airfoil +.
/announcerSpeech To Text
Transcrivez de l'audio en texte avec les modèles Whisper via l'interface CLI inference.sh. Modèles : Fast Whisper Large V3, Whisper V3 Large. Fonctionnalités : transcription, traduction,...
/speech-to-textVoice
Convertissez du texte en speech en utilisant le moteur TTS de Microsoft Edge avec des voix personnalisables, une lecture directe et un nettoyage automatique des fichiers temporaires.
addis-assistant-stt
Fournit la reconnaissance vocale (STT) et le texte.
/addis-assistant-sttPocket Tts
Pocket Tts : Générer un discours anglais de haute qualité en ligne de commande sur CPU en utilisant 8 voix intégrées ou en personnalisant la cloning de voix avec le modèle Pocket TTS de Kyutai.
/pocket-ttsVoicenotes
Synchronisation et accès aux notes vocales de Voicenotes.com. Utilisez cette fonctionnalité lorsque l'utilisateur souhaite récupérer ses enregistrements vocaux, les transcriptions et les résumés AI de Voicenotes. Prend en charge la récupération des notes, la synchronisation vers markdown et la recherche de transcriptions.
/voicenotesclaw-voice
Vous êtes connecté à une session utilisateur en direct via la voix.
/claw-voiceTranscribe Audio with Parakeet MLX
Transcription audio avec Parakeet MLX : Parole à texte local avec Parakeet MLX (ASR) pour Apple Silicon (sans clé API).
/parakeet-mlxclonev
Cloner n'importe quelle voix et générer de la parole en utilisant Coqui XTTS v2.
/clonevcult-of-carcinization
Donnez une voix à votre agent et des oreilles.
/cult-of-carcinizationdeepdub-tts
Générer de l'audio de parole en utilisant Deepdub et l'attacher en tant que MÉDIA.
/deepdub-ttschichi-speech
Service RESTful pour une conversion texte-à-parole de haute qualité en utilisant Qwen3.
/chichi-speechlnbits
Gestion du portefeuille Lightning LNbits (Solde, Paiement, Facture)
/lnbitsVoicenotes Official
Voicenotes Official : Cette compétence officielle de l'équipe Voicenotes donne à OpenClaw l'accès à de nouveaux API et la capacité de rechercher sémantiquement, de récupérer des transcriptions complètes, de filtrer par t...
/voicenotes-officialtl;dw - YouTube Video Summarizer
tl;dw - YouTube Video Summarizer : Extrait les transcriptions des vidéos YouTube et fournit des résumés concis mettant en avant les points principaux, les arguments et les conclusions sans regarder la vidéo complète.
Openai Tts.Bak 2026 01 28T18:01:23+10:30
Openai Tts.Bak 2026 01 28T18:01:23+10:30 : Texte à voix parlée via l'API de speech Audio d'OpenAI.
/openai-tts-bak-2026-01-28t18-01-23-10-30speech-recognition
Reconnaissance vocale universelle : Skill de reconnaissance vocale. Prend en charge de multiples formats audio (ogg/mp3/wav/m4a), utilise l'API SenseVoice fluide basée sur le silicium pour la conversion de texte en voix. Déclenché lorsque l'utilisateur envoie un message vocal, un fichier audio, ou nécessite la transcription d'un audio.
/speech-recognitionfreshbooks-cli
CLI FreshBooks pour la gestion des factures, clients et facturation.
/freshbooks-cliText To Speech
Conversion de texte en parole naturelle avec DIA TTS, Kokoro, Chatterbox et d'autres via l'interface CLI inference.sh. Modèles : DIA TTS (conversational), Kokoro TTS, Chatterbox, Hig...
/text-to-speechAssemblyAI Transcriber
AssemblyAI Transcriber : Transcrit des fichiers audio avec la diarisation des orateurs (qui parle quand). Prend en charge plus de 100 langues, détection automatique de la langue et horodatage. Utilisez-le pour des réunions, des entretiens, des podcasts ou des messages vocaux. Nécessite une clé API AssemblyAI.
/assemblyai-transcriberWhisper Transcribe
Transcription en sourdine : Transcrivez des fichiers audio en texte en utilisant OpenAI Whisper. Prend en charge la reconnaissance vocale avec détection automatique de la langue, plusieurs formats de sortie (txt, srt, vtt, ), le traitement par lots et le choix du modèle (de tiny à large). Utilisez cette fonctionnalité pour transcrire des enregistrements audio, des podcasts, des messages vocaux, des conférences, des réunions ou tout fichier audio/video en texte. Gère les formats mp3, wav, m4a, ogg, flac, webm, opus, aac.
/whisper-transcribeeternal-haven-lore-pack
Pack de lore et personnage mythique des Chroniques d'Eternal Haven.
/eternal-haven-lore-packakaunting
Interagissez avec le logiciel de comptabilité open-source Akaunting via l'API REST.
/akauntingauto-whisper-safe
Transcription vocale sécurisée pour RAM avec auto-chunking — fonctionne sur des machines de 16 Go sans plantage.
/auto-whisper-safebrw-de-ai-ify
Retirez le jargon généré par l'IA et restorez la voix humaine au texte.
/brw-de-ai-ifydellight-cro-revenue-ops
DELLIGHT.AI est une start-up IA située dans le DIFC, Dubaï.
/dellight-cro-revenue-opsdocuments-ai
API d'OCR en temps réel et d'extraction de données par Veryfi.
/documents-aidoubao-api-open-tts
Service de Texte à Parole en utilisant Doubao (Moteur Volcano).
/doubao-api-open-ttseachlabs-voice-audio
TTS, STT, conversion de voix en utilisant ElevenLabs, Whisper, RVC.
/eachlabs-voice-audiofeishu-minutes
Récupération d'informations, de statistiques, de transcriptions et de médias depuis Feishu.
/feishu-minutesgettr-transcribe-summarize
Téléchargement d'audio depuis un post GETTR.
/gettr-transcribe-summarizehebrew-nikud
Référence des nikud (points des voyelles) hébreux pour les agents IA.
/hebrew-nikudmiranda-sag
Texte à voix (TTS) ElevenLabs avec une interface utilisateur (UX) de style macOS.
/miranda-sagnorman-categorize-transactions
Révision et catégorisation des transactions bancaires non catégorisées, association avec des factures et vérification des entrées de comptabilité.
/norman-categorize-transactionsnorman-monthly-reconciliation
Effectuer une réconciliation financière mensuelle complète - réviser toutes les transactions, associer les factures, vérifier les montants impayés.
/norman-monthly-reconciliationressemble
Intégration Texte à Voix (TTS) et Voix à Texte (STT) en utilisant l'API HTTP de Resemble AI.
/ressemblesiliconflow-tts-gen
Texte à Voix (TTS) en utilisant l'API SiliconFlow (CosyVoice2).
/siliconflow-tts-gen