Accueil/Parole et transcription
🎙️

Parole et transcription

(71)
🎖️En vedette
41,621

Mcporter

Mcporter : Utilisez la CLI mcporter pour lister, configurer, authentifier et appeler directement les serveurs/outils MCP (HTTP ou stdio), y compris les serveurs ad-hoc, les éditions de configuration et la génération CLI/type.

🎖️En vedette
31,978

OpenClaw YouTube Transcript

Transcription des vidéos YouTube en texte en extraignant les sous-titres et les légendes directement à partir de l'URL de la vidéo en utilisant yt-dlp sans traitement audio.

🎙️Parole et transcription/openclaw-youtube-transcript
🎖️En vedette
18,448

Sag

Sag : ElevenLabs text-to-speech avec une interface utilisateur mac-style pour dire

🎖️En vedette
15,590

YouTube Transcript

Transcription YouTube : Récupérez et résumez les transcriptions de vidéos YouTube. Utilisez cette fonctionnalité lorsqu'on vous demande de résumer, transcrire ou extraire du contenu des vidéos YouTube. Gère la récupération des transcriptions via un proxy IP résidentiel pour contourner les blocs IP nuage de YouTube.

Local Whisper

Local Whisper : Parole à texte local en utilisant OpenAI Whisper. Fonctionne intégralement hors ligne après le téléchargement du modèle. Transcription de haute qualité avec plusieurs tailles de modèles.

elevenlabs-voices

Synthèse vocale de haute qualité avec 18 personnalités, 32.

faster-whisper

Parole à texte local en utilisant faster-whisper.

elevenlabs-tts

TTS ElevenLabs - la meilleure intégration ElevenLabs pour OpenClaw.

Voice Transcribe

Voice Transcribe: Transcription de fichiers audio en utilisant le modèle gpt-4o-mini-transcribe d'OpenAI avec des indices de vocabulaire et des remplacements de texte. Exige uv (https://docs.astral.sh/uv/).

jarvis-voice

Voix persona métallique d'IA avec TTS et mise en forme de transcription visuelle.

kokoro-tts

Génération d'audio vocal à partir de texte en utilisant le moteur local Kokoro TTS.

ElevenLabs Speech-to-Text

ElevenLabs Speech-to-Text : transcrire des fichiers audio en utilisant ElevenLabs Speech-to-Text (Scribe v2).

Mlx Whisper

Parole à texte local avec MLX Whisper (optimisé pour Apple Silicon, sans clé API).

Transcribe audio files via OpenRouter using audio-capable models

Transcription de fichiers audio via OpenRouter en utilisant des modèles capables de traiter l'audio : Transcription de fichiers audio via OpenRouter en utilisant des modèles capables de traiter l'audio (Gemini, GPT-4o-audio, etc.).

🎙️Parole et transcription/openrouter-transcribe

Gemini STT

Transcrivez les fichiers audio en utilisant l'API Gemini de Google ou Vertex AI

Tts

Convertir du texte en speech en utilisant l'API Hume AI (ou OpenAI). Utilisez-le lorsque l'utilisateur demande un message audio, une réponse vocale, ou pour entendre quelque chose d'"une voix vive".

Local Whisper

Local Whisper : Parole à texte local gratuite pour Telegram et WhatsApp en utilisant MLX Whisper sur Apple Silicon. Privé, sans coûts d'API.

Transcribe

Transcrire des fichiers audio en texte en utilisant Whisper local (Docker). Utiliser lors de la réception de messages vocaux, de fichiers audio (.mp3, .m4a, .ogg, .wav, .webm), ou lorsque l'on est demandé de transcrire du contenu audio.

assemblyai-transcribe

Transcrivez de l'audio/video avec AssemblyAI.

🎙️Parole et transcription/assemblyai-transcribe

elevenlabs-agents

Création, gestion et déploiement d'agents ElevenLabs.

Local STT (Nvidia Parakeet + Whisper Support)

STT locale (Nvidia Parakeet + Whisper Support) : STT locale avec des backends sélectionnables - Parakeet (meilleure précision) ou Whisper (le plus rapide, multilingue).

audio-gen

Générez des livres audio, podcasts ou contenu audio éducatif.

critical-article-writer

Générer des articles de brouillon et des tableaux des matières.

🎙️Parole et transcription/critical-article-writer

audio-reply

Générez des réponses audio en utilisant la TTS (Text-to-Speech).

it will help you to send voice messages to your AI Assistant and also can make it talk

Il vous aidera à envoyer des messages vocaux à votre Assistant IA et peut également le faire parler : Texte à voix et Voix à texte en utilisant l'IA ElevenLabs. Utilisez-le lorsque l'utilisateur souhaite convertir du texte en speech, transcrire des messages vocaux ou travailler avec la voix dans plusieurs langues. Prend en charge des voix IA de haute qualité et une transcription précise.

elevenlabs-transcribe

Transcription audio en texte en utilisant ElevenLabs.

🎙️Parole et transcription/elevenlabs-transcribe

Parakeet Stt

Parakeet Stt : Parole à texte local avec NVIDIA Parakeet TDT 0.6B v3 (ONNX sur CPU). 30 fois plus rapide que Whisper, 25 langues, détection automatique, API compatible OpenAI. Utilisez cette compétence pour transcrire des fichiers audio, convertir la parole en texte ou traiter des enregistrements vocaux localement sans API dans le cloud.

deepgram

Interface en ligne de commande pour Deepgram (transcription vocale).

announcer

Annoncez du texte à travers la maison via des haut-parleurs AirPlay en utilisant Airfoil +.

Speech To Text

Transcrivez de l'audio en texte avec les modèles Whisper via l'interface CLI inference.sh. Modèles : Fast Whisper Large V3, Whisper V3 Large. Fonctionnalités : transcription, traduction,...

Voice

Convertissez du texte en speech en utilisant le moteur TTS de Microsoft Edge avec des voix personnalisables, une lecture directe et un nettoyage automatique des fichiers temporaires.

addis-assistant-stt

Fournit la reconnaissance vocale (STT) et le texte.

🎙️Parole et transcription/addis-assistant-stt

Pocket Tts

Pocket Tts : Générer un discours anglais de haute qualité en ligne de commande sur CPU en utilisant 8 voix intégrées ou en personnalisant la cloning de voix avec le modèle Pocket TTS de Kyutai.

inworld-tts

Texte à voix via l'API Inworld.ai.

Voicenotes

Synchronisation et accès aux notes vocales de Voicenotes.com. Utilisez cette fonctionnalité lorsque l'utilisateur souhaite récupérer ses enregistrements vocaux, les transcriptions et les résumés AI de Voicenotes. Prend en charge la récupération des notes, la synchronisation vers markdown et la recherche de transcriptions.

claw-voice

Vous êtes connecté à une session utilisateur en direct via la voix.

Transcribe Audio with Parakeet MLX

Transcription audio avec Parakeet MLX : Parole à texte local avec Parakeet MLX (ASR) pour Apple Silicon (sans clé API).

clonev

Cloner n'importe quelle voix et générer de la parole en utilisant Coqui XTTS v2.

cult-of-carcinization

Donnez une voix à votre agent et des oreilles.

🎙️Parole et transcription/cult-of-carcinization

deepdub-tts

Générer de l'audio de parole en utilisant Deepdub et l'attacher en tant que MÉDIA.

chichi-speech

Service RESTful pour une conversion texte-à-parole de haute qualité en utilisant Qwen3.

lnbits

Gestion du portefeuille Lightning LNbits (Solde, Paiement, Facture)

Voicenotes Official

Voicenotes Official : Cette compétence officielle de l'équipe Voicenotes donne à OpenClaw l'accès à de nouveaux API et la capacité de rechercher sémantiquement, de récupérer des transcriptions complètes, de filtrer par t...

🎙️Parole et transcription/voicenotes-official

tl;dw - YouTube Video Summarizer

tl;dw - YouTube Video Summarizer : Extrait les transcriptions des vidéos YouTube et fournit des résumés concis mettant en avant les points principaux, les arguments et les conclusions sans regarder la vidéo complète.

Openai Tts.Bak 2026 01 28T18:01:23+10:30

Openai Tts.Bak 2026 01 28T18:01:23+10:30 : Texte à voix parlée via l'API de speech Audio d'OpenAI.

🎙️Parole et transcription/openai-tts-bak-2026-01-28t18-01-23-10-30

speech-recognition

Reconnaissance vocale universelle : Skill de reconnaissance vocale. Prend en charge de multiples formats audio (ogg/mp3/wav/m4a), utilise l'API SenseVoice fluide basée sur le silicium pour la conversion de texte en voix. Déclenché lorsque l'utilisateur envoie un message vocal, un fichier audio, ou nécessite la transcription d'un audio.

freshbooks-cli

CLI FreshBooks pour la gestion des factures, clients et facturation.

Text To Speech

Conversion de texte en parole naturelle avec DIA TTS, Kokoro, Chatterbox et d'autres via l'interface CLI inference.sh. Modèles : DIA TTS (conversational), Kokoro TTS, Chatterbox, Hig...

AssemblyAI Transcriber

AssemblyAI Transcriber : Transcrit des fichiers audio avec la diarisation des orateurs (qui parle quand). Prend en charge plus de 100 langues, détection automatique de la langue et horodatage. Utilisez-le pour des réunions, des entretiens, des podcasts ou des messages vocaux. Nécessite une clé API AssemblyAI.

🎙️Parole et transcription/assemblyai-transcriber

Whisper Transcribe

Transcription en sourdine : Transcrivez des fichiers audio en texte en utilisant OpenAI Whisper. Prend en charge la reconnaissance vocale avec détection automatique de la langue, plusieurs formats de sortie (txt, srt, vtt, ), le traitement par lots et le choix du modèle (de tiny à large). Utilisez cette fonctionnalité pour transcrire des enregistrements audio, des podcasts, des messages vocaux, des conférences, des réunions ou tout fichier audio/video en texte. Gère les formats mp3, wav, m4a, ogg, flac, webm, opus, aac.

eternal-haven-lore-pack

Pack de lore et personnage mythique des Chroniques d'Eternal Haven.

🎙️Parole et transcription/eternal-haven-lore-pack

agent-voice

Plateforme de blogging en ligne pour les agents IA.

akaunting

Interagissez avec le logiciel de comptabilité open-source Akaunting via l'API REST.

auto-whisper-safe

Transcription vocale sécurisée pour RAM avec auto-chunking — fonctionne sur des machines de 16 Go sans plantage.

brw-de-ai-ify

Retirez le jargon généré par l'IA et restorez la voix humaine au texte.

dellight-cro-revenue-ops

DELLIGHT.AI est une start-up IA située dans le DIFC, Dubaï.

🎙️Parole et transcription/dellight-cro-revenue-ops

documents-ai

API d'OCR en temps réel et d'extraction de données par Veryfi.

doubao-api-open-tts

Service de Texte à Parole en utilisant Doubao (Moteur Volcano).

🎙️Parole et transcription/doubao-api-open-tts

duby

Conversion de texte en speech en utilisant l'API Duby.so.

eachlabs-voice-audio

TTS, STT, conversion de voix en utilisant ElevenLabs, Whisper, RVC.

🎙️Parole et transcription/eachlabs-voice-audio

easyverein-api

Travail avec l'API REST v2.0 de easyVerein.

elevenlabs-media

Génération de musique avec ElevenLabs.

feishu-minutes

Récupération d'informations, de statistiques, de transcriptions et de médias depuis Feishu.

gettr-transcribe-summarize

Téléchargement d'audio depuis un post GETTR.

🎙️Parole et transcription/gettr-transcribe-summarize

hebrew-nikud

Référence des nikud (points des voyelles) hébreux pour les agents IA.

her-voice

Donnez une voix à votre agent.

miranda-sag

Texte à voix (TTS) ElevenLabs avec une interface utilisateur (UX) de style macOS.

norman-categorize-transactions

Révision et catégorisation des transactions bancaires non catégorisées, association avec des factures et vérification des entrées de comptabilité.

🎙️Parole et transcription/norman-categorize-transactions

norman-monthly-reconciliation

Effectuer une réconciliation financière mensuelle complète - réviser toutes les transactions, associer les factures, vérifier les montants impayés.

🎙️Parole et transcription/norman-monthly-reconciliation

ressemble

Intégration Texte à Voix (TTS) et Voix à Texte (STT) en utilisant l'API HTTP de Resemble AI.

siliconflow-tts-gen

Texte à Voix (TTS) en utilisant l'API SiliconFlow (CosyVoice2).

🎙️Parole et transcription/siliconflow-tts-gen