Accueil/Parole et transcription

🎙️

Parole et transcription

(71)

🎖️En vedette

41,621

Mcporter

Mcporter : Utilisez la CLI mcporter pour lister, configurer, authentifier et appeler directement les serveurs/outils MCP (HTTP ou stdio), y compris les serveurs ad-hoc, les éditions de configuration et la génération CLI/type.

🎙️Parole et transcription/mcporter

🎖️En vedette

31,978

OpenClaw YouTube Transcript

Transcription des vidéos YouTube en texte en extraignant les sous-titres et les légendes directement à partir de l'URL de la vidéo en utilisant yt-dlp sans traitement audio.

🎙️Parole et transcription/openclaw-youtube-transcript

🎖️En vedette

18,448

Sag

Sag : ElevenLabs text-to-speech avec une interface utilisateur mac-style pour dire

🎙️Parole et transcription/sag

🎖️En vedette

15,590

YouTube Transcript

Transcription YouTube : Récupérez et résumez les transcriptions de vidéos YouTube. Utilisez cette fonctionnalité lorsqu'on vous demande de résumer, transcrire ou extraire du contenu des vidéos YouTube. Gère la récupération des transcriptions via un proxy IP résidentiel pour contourner les blocs IP nuage de YouTube.

🎙️Parole et transcription/youtube-transcript

Local Whisper

Local Whisper : Parole à texte local en utilisant OpenAI Whisper. Fonctionne intégralement hors ligne après le téléchargement du modèle. Transcription de haute qualité avec plusieurs tailles de modèles.

🎙️Parole et transcription/local-whisper

elevenlabs-voices

Synthèse vocale de haute qualité avec 18 personnalités, 32.

🎙️Parole et transcription/elevenlabs-voices

faster-whisper

Parole à texte local en utilisant faster-whisper.

🎙️Parole et transcription/faster-whisper

elevenlabs-tts

TTS ElevenLabs - la meilleure intégration ElevenLabs pour OpenClaw.

🎙️Parole et transcription/elevenlabs-tts

Voice Transcribe

Voice Transcribe: Transcription de fichiers audio en utilisant le modèle gpt-4o-mini-transcribe d'OpenAI avec des indices de vocabulaire et des remplacements de texte. Exige uv (https://docs.astral.sh/uv/).

🎙️Parole et transcription/voice-transcribe

jarvis-voice

Voix persona métallique d'IA avec TTS et mise en forme de transcription visuelle.

🎙️Parole et transcription/jarvis-voice

kokoro-tts

Génération d'audio vocal à partir de texte en utilisant le moteur local Kokoro TTS.

🎙️Parole et transcription/kokoro-tts

ElevenLabs Speech-to-Text

ElevenLabs Speech-to-Text : transcrire des fichiers audio en utilisant ElevenLabs Speech-to-Text (Scribe v2).

🎙️Parole et transcription/elevenlabs-stt

Mlx Whisper

Parole à texte local avec MLX Whisper (optimisé pour Apple Silicon, sans clé API).

🎙️Parole et transcription/mlx-whisper

Transcribe audio files via OpenRouter using audio-capable models

Transcription de fichiers audio via OpenRouter en utilisant des modèles capables de traiter l'audio : Transcription de fichiers audio via OpenRouter en utilisant des modèles capables de traiter l'audio (Gemini, GPT-4o-audio, etc.).

🎙️Parole et transcription/openrouter-transcribe

Gemini STT

Transcrivez les fichiers audio en utilisant l'API Gemini de Google ou Vertex AI

🎙️Parole et transcription/gemini-stt

Tts

Convertir du texte en speech en utilisant l'API Hume AI (ou OpenAI). Utilisez-le lorsque l'utilisateur demande un message audio, une réponse vocale, ou pour entendre quelque chose d'"une voix vive".

🎙️Parole et transcription/tts

Local Whisper

Local Whisper : Parole à texte local gratuite pour Telegram et WhatsApp en utilisant MLX Whisper sur Apple Silicon. Privé, sans coûts d'API.

🎙️Parole et transcription/whisper-mlx-local

Transcribe

Transcrire des fichiers audio en texte en utilisant Whisper local (Docker). Utiliser lors de la réception de messages vocaux, de fichiers audio (.mp3, .m4a, .ogg, .wav, .webm), ou lorsque l'on est demandé de transcrire du contenu audio.

🎙️Parole et transcription/transcribe

assemblyai-transcribe

Transcrivez de l'audio/video avec AssemblyAI.

🎙️Parole et transcription/assemblyai-transcribe

elevenlabs-agents

Création, gestion et déploiement d'agents ElevenLabs.

🎙️Parole et transcription/elevenlabs-agents

Local STT (Nvidia Parakeet + Whisper Support)

STT locale (Nvidia Parakeet + Whisper Support) : STT locale avec des backends sélectionnables - Parakeet (meilleure précision) ou Whisper (le plus rapide, multilingue).

🎙️Parole et transcription/local-stt

audio-gen

Générez des livres audio, podcasts ou contenu audio éducatif.

🎙️Parole et transcription/audio-gen

critical-article-writer

Générer des articles de brouillon et des tableaux des matières.

🎙️Parole et transcription/critical-article-writer

audio-reply

Générez des réponses audio en utilisant la TTS (Text-to-Speech).

🎙️Parole et transcription/audio-reply-skill

it will help you to send voice messages to your AI Assistant and also can make it talk

Il vous aidera à envoyer des messages vocaux à votre Assistant IA et peut également le faire parler : Texte à voix et Voix à texte en utilisant l'IA ElevenLabs. Utilisez-le lorsque l'utilisateur souhaite convertir du texte en speech, transcrire des messages vocaux ou travailler avec la voix dans plusieurs langues. Prend en charge des voix IA de haute qualité et une transcription précise.

🎙️Parole et transcription/elevenlabs-voice

elevenlabs-transcribe

Transcription audio en texte en utilisant ElevenLabs.

🎙️Parole et transcription/elevenlabs-transcribe

Parakeet Stt

Parakeet Stt : Parole à texte local avec NVIDIA Parakeet TDT 0.6B v3 (ONNX sur CPU). 30 fois plus rapide que Whisper, 25 langues, détection automatique, API compatible OpenAI. Utilisez cette compétence pour transcrire des fichiers audio, convertir la parole en texte ou traiter des enregistrements vocaux localement sans API dans le cloud.

🎙️Parole et transcription/parakeet-stt

deepgram

Interface en ligne de commande pour Deepgram (transcription vocale).

🎙️Parole et transcription/deepgram

announcer

Annoncez du texte à travers la maison via des haut-parleurs AirPlay en utilisant Airfoil +.

🎙️Parole et transcription/announcer

Speech To Text

Transcrivez de l'audio en texte avec les modèles Whisper via l'interface CLI inference.sh. Modèles : Fast Whisper Large V3, Whisper V3 Large. Fonctionnalités : transcription, traduction,...

🎙️Parole et transcription/speech-to-text

Voice

Convertissez du texte en speech en utilisant le moteur TTS de Microsoft Edge avec des voix personnalisables, une lecture directe et un nettoyage automatique des fichiers temporaires.

🎙️Parole et transcription/voice

addis-assistant-stt

Fournit la reconnaissance vocale (STT) et le texte.

🎙️Parole et transcription/addis-assistant-stt

Pocket Tts

Pocket Tts : Générer un discours anglais de haute qualité en ligne de commande sur CPU en utilisant 8 voix intégrées ou en personnalisant la cloning de voix avec le modèle Pocket TTS de Kyutai.

🎙️Parole et transcription/pocket-tts

inworld-tts

Texte à voix via l'API Inworld.ai.

🎙️Parole et transcription/inworld-tts

Voicenotes

Synchronisation et accès aux notes vocales de Voicenotes.com. Utilisez cette fonctionnalité lorsque l'utilisateur souhaite récupérer ses enregistrements vocaux, les transcriptions et les résumés AI de Voicenotes. Prend en charge la récupération des notes, la synchronisation vers markdown et la recherche de transcriptions.

🎙️Parole et transcription/voicenotes

claw-voice

Vous êtes connecté à une session utilisateur en direct via la voix.

🎙️Parole et transcription/claw-voice

Transcribe Audio with Parakeet MLX

Transcription audio avec Parakeet MLX : Parole à texte local avec Parakeet MLX (ASR) pour Apple Silicon (sans clé API).

🎙️Parole et transcription/parakeet-mlx

clonev

Cloner n'importe quelle voix et générer de la parole en utilisant Coqui XTTS v2.

🎙️Parole et transcription/clonev

cult-of-carcinization

Donnez une voix à votre agent et des oreilles.

🎙️Parole et transcription/cult-of-carcinization

deepdub-tts

Générer de l'audio de parole en utilisant Deepdub et l'attacher en tant que MÉDIA.

🎙️Parole et transcription/deepdub-tts

chichi-speech

Service RESTful pour une conversion texte-à-parole de haute qualité en utilisant Qwen3.

🎙️Parole et transcription/chichi-speech

lnbits

Gestion du portefeuille Lightning LNbits (Solde, Paiement, Facture)

🎙️Parole et transcription/lnbits

Voicenotes Official

Voicenotes Official : Cette compétence officielle de l'équipe Voicenotes donne à OpenClaw l'accès à de nouveaux API et la capacité de rechercher sémantiquement, de récupérer des transcriptions complètes, de filtrer par t...

🎙️Parole et transcription/voicenotes-official

tl;dw - YouTube Video Summarizer

tl;dw - YouTube Video Summarizer : Extrait les transcriptions des vidéos YouTube et fournit des résumés concis mettant en avant les points principaux, les arguments et les conclusions sans regarder la vidéo complète.

🎙️Parole et transcription/tldw

Openai Tts.Bak 2026 01 28T18:01:23+10:30

Openai Tts.Bak 2026 01 28T18:01:23+10:30 : Texte à voix parlée via l'API de speech Audio d'OpenAI.

🎙️Parole et transcription/openai-tts-bak-2026-01-28t18-01-23-10-30

speech-recognition

Reconnaissance vocale universelle : Skill de reconnaissance vocale. Prend en charge de multiples formats audio (ogg/mp3/wav/m4a), utilise l'API SenseVoice fluide basée sur le silicium pour la conversion de texte en voix. Déclenché lorsque l'utilisateur envoie un message vocal, un fichier audio, ou nécessite la transcription d'un audio.

🎙️Parole et transcription/speech-recognition

freshbooks-cli

CLI FreshBooks pour la gestion des factures, clients et facturation.

🎙️Parole et transcription/freshbooks-cli

Text To Speech

Conversion de texte en parole naturelle avec DIA TTS, Kokoro, Chatterbox et d'autres via l'interface CLI inference.sh. Modèles : DIA TTS (conversational), Kokoro TTS, Chatterbox, Hig...

🎙️Parole et transcription/text-to-speech

AssemblyAI Transcriber

AssemblyAI Transcriber : Transcrit des fichiers audio avec la diarisation des orateurs (qui parle quand). Prend en charge plus de 100 langues, détection automatique de la langue et horodatage. Utilisez-le pour des réunions, des entretiens, des podcasts ou des messages vocaux. Nécessite une clé API AssemblyAI.

🎙️Parole et transcription/assemblyai-transcriber

Whisper Transcribe

Transcription en sourdine : Transcrivez des fichiers audio en texte en utilisant OpenAI Whisper. Prend en charge la reconnaissance vocale avec détection automatique de la langue, plusieurs formats de sortie (txt, srt, vtt, ), le traitement par lots et le choix du modèle (de tiny à large). Utilisez cette fonctionnalité pour transcrire des enregistrements audio, des podcasts, des messages vocaux, des conférences, des réunions ou tout fichier audio/video en texte. Gère les formats mp3, wav, m4a, ogg, flac, webm, opus, aac.

🎙️Parole et transcription/whisper-transcribe