Voce e trascrizione
(71)Mcporter
Mcporter: Utilizza il CLI mcporter per elencare, configurare, autenticare e chiamare server/tools MCP direttamente (HTTP o stdio), inclusi server ad hoc, modifiche alla configurazione e generazione CLI/type.
/mcporterOpenClaw YouTube Transcript
Trascrizione YouTube OpenClaw: Trascrive video YouTube in testo estrarre direttamente i sottotitoli e i caption dall'URL del video utilizzando yt-dlp senza elaborazione audio.
/openclaw-youtube-transcriptSag
Sag: ElevenLabs text-to-speech con interfaccia utente mac-style say.
YouTube Transcript
Trascrizione YouTube: Recupera e riassumi le trascrizioni dei video YouTube. Usa quando si chiede di riassumere, trascrivere o estrarre contenuti dai video YouTube. Gestisce il recupero delle trascrizioni tramite proxy IP residenziale per bypassare i blocchi IP cloud di YouTube.
/youtube-transcriptLocal Whisper
Linguaggio Locale: Traduzione della voce locale in testo utilizzando OpenAI Whisper. Funziona completamente offline dopo il download del modello. Trascrizione ad alta qualità con diverse dimensioni di modello.
/local-whisperelevenlabs-voices
Sintesi vocale di alta qualità con 18 personaggi, 32.
/elevenlabs-voiceselevenlabs-tts
TTS ElevenLabs - la migliore integrazione di ElevenLabs per OpenClaw
/elevenlabs-ttsVoice Transcribe
Trascrittura vocale: Trascrive file audio utilizzando il modello gpt-4o-mini-transcribe di OpenAI con suggerimenti lessicali e sostituzioni di testo. Richiede uv (https://docs.astral.sh/uv/).
/voice-transcribejarvis-voice
voce AI metallica con TTS e stile di trascrizione visiva
/jarvis-voicekokoro-tts
generazione di audio parlato dal testo utilizzando il motore locale Kokoro TTS
/kokoro-ttsElevenLabs Speech-to-Text
Trascrivi file audio utilizzando ElevenLabs Speech-to-Text (Scribe v2)
/elevenlabs-sttMlx Whisper
Parola locale con MLX Whisper (ottimizzato per Apple Silicon, senza chiave API).
/mlx-whisperTranscribe audio files via OpenRouter using audio-capable models
Trascrivere file audio tramite OpenRouter utilizzando modelli con capacità audio: Trascrivere file audio tramite OpenRouter utilizzando modelli con capacità audio (Gemini, GPT-4o-audio, ecc.)
/openrouter-transcribeGemini STT
Trascrive file audio utilizzando l'API Gemini di Google o Vertex AI
/gemini-sttTts
Convertire il testo in voce utilizzando l'API di Hume AI (o OpenAI). Utilizzare quando l'utente richiede un messaggio audio, una risposta vocale o per ascoltare qualcosa con una voce 'di vive voce'.
Local Whisper
Whisper locale: Libera trascrizione vocale in italiano per Telegram e WhatsApp utilizzando MLX Whisper su Apple Silicon. Privato, senza costi di API.
/whisper-mlx-localTranscribe
Trascrivi: Trascrivi file audio in testo utilizzando Whisper locale (Docker). Usa quando ricevi messaggi vocali, file audio (.mp3, .m4a, .ogg, .wav, .webm) o quando ti viene richiesto di trascrivere contenuti audio.
/transcribeassemblyai-transcribe
Trascrive audio/video utilizzando AssemblyAI.
/assemblyai-transcribeLocal STT (Nvidia Parakeet + Whisper Support)
STT locale (Nvidia Parakeet + Supporto Whisper): STT locale con backend selezionabile - Parakeet (massima accuratezza) o Whisper (più veloce, multilingue).
/local-sttaudio-reply
Genera risposte audio utilizzando TTS (Text-to-Speech).
/audio-reply-skillit will help you to send voice messages to your AI Assistant and also can make it talk
Ti aiuta a inviare messaggi vocali al tuo Assistente AI e può farlo anche parlare: Text-to-Speech e Speech-to-Text utilizzando l'AI di ElevenLabs. Usa quando l'utente vuole convertire il testo in voce, trascrivere messaggi vocali o lavorare con la voce in più lingue. Supporta voci AI ad alta qualità e trascrizioni accurate.
/elevenlabs-voiceelevenlabs-transcribe
Trascrittura audio in testo utilizzando ElevenLabs
/elevenlabs-transcribeParakeet Stt
Parakeet Stt: Speech-to-text locale con NVIDIA Parakeet TDT 0.6B v3 (ONNX su CPU). 30 volte più veloce di Whisper, 25 lingue, rilevamento automatico, API compatibile con OpenAI. Utilizzare per trascrivere file audio, convertire voce in testo o elaborare registrazioni vocali localmente senza API cloud.
/parakeet-sttannouncer
Annuncia il testo in tutta la casa tramite altoparlanti AirPlay utilizzando Airfoil +.
/announcerSpeech To Text
Trascrizione audio in testo con modelli Whisper tramite CLI inference.sh. Modelli: Fast Whisper Large V3, Whisper V3 Large. Funzionalità: trascrizione, traduzione,...
/speech-to-textVoice
Vocale: Converti il testo in voce utilizzando il motore TTS di Microsoft Edge con voci personalizzabili, riproduzione diretta e pulizia automatica dei file temporanei.
/voicePocket Tts
Generare speech in inglese di alta qualità offline utilizzando il CPU con 8 voci integrate o clonazione delle voci personalizzata con il modello Pocket TTS di Kyutai.
/pocket-ttsVoicenotes
Sincronizzazione e accesso alle note vocali da Voicenotes.com. Utilizzare quando l'utente desidera recuperare le loro registrazioni vocali, i trascritti e i sommari AI da Voicenotes. Supporta il recupero delle note, la sincronizzazione con markdown e la ricerca dei trascritti.
/voicenotesTranscribe Audio with Parakeet MLX
Trascrivi Audio con Parakeet MLX: Speech-to-text locale con Parakeet MLX (ASR) per Apple Silicon (nessuna chiave API).
/parakeet-mlxcult-of-carcinization
Dai una voce al tuo agente e ascoltalo.
/cult-of-carcinizationdeepdub-tts
Genera audio speech utilizzando Deepdub e allegalo come MEDIA.
/deepdub-ttschichi-speech
Servizio RESTful per un testo-a-vocale di alta qualità utilizzando Qwen3.
/chichi-speechlnbits
gestione del portafoglio Lightning LNbits (Saldo, Pagamento, Fattura)
/lnbitsVoicenotes Official
Voicenotes Official: Questa abilità ufficiale della squadra Voicenotes offre OpenClaw l'accesso a nuovi API e la capacità di cercare semanticamente, recuperare trascrizioni complete, filtrare per t...
/voicenotes-officialtl;dw - YouTube Video Summarizer
YouTube Video Summarizer: Estrae i trascritti dei video YouTube e fornisce riassunti concisi che evidenziano i punti principali, gli argomenti e le conclusioni senza guardare l'intero video.
Openai Tts.Bak 2026 01 28T18:01:23+10:30
Testo-parola tramite API di Speech Audio OpenAI
/openai-tts-bak-2026-01-28t18-01-23-10-30speech-recognition
Riconoscimento vocale universale. Supporta vari formati audio (ogg/mp3/wav/m4a) e utilizza l'API SenseVoice API basata su silicio per trasformare il testo in voce. Attivato quando l'utente invia messaggi vocali, file audio o necessita di trascrivere audio.
/speech-recognitionfreshbooks-cli
CLI di FreshBooks per la gestione delle fatture, clienti e fatturazione
/freshbooks-cliText To Speech
Converti il testo in speech naturale con DIA TTS, Kokoro, Chatterbox e altri tramite CLI inference.sh. Modelli: DIA TTS (conversazionale), Kokoro TTS, Chatterbox, Hig...
/text-to-speechAssemblyAI Transcriber
AssemblyAI Transcriber: Trascrive file audio con diarizzazione degli speaker (chi parla quando). Supporta 100+ lingue, rilevamento automatico della lingua e timestamp. Utilizzabile per riunioni, interviste, podcast o messaggi vocali. Richiede la chiave API di AssemblyAI.
/assemblyai-transcriberWhisper Transcribe
Trascrittura in Sussurro: Trascrive file audio in testo utilizzando OpenAI Whisper. Supporta la trascrizione dal parlato con rilevamento automatico della lingua, formati di output multipli (txt, srt, vtt, ), elaborazione in lotti e selezione del modello (da piccolo a grande). Usa quando trascrivi registrazioni audio, podcast, messaggi vocali, lezioni, riunioni o qualsiasi file audio/video in testo. Gestisce formati mp3, wav, m4a, ogg, flac, webm, opus, aac.
/whisper-transcribeeternal-haven-lore-pack
packe delle leggende di Eterna Tavola + packe mitico
/eternal-haven-lore-packagent-voice
Piattaforma di blogging da riga di comando per agenti AI
/agent-voiceakaunting
Interagisci con il software di contabilità open-source Akaunting tramite l'API REST
/akauntingauto-whisper-safe
Trascrizione vocale sicura RAM con chunking automatico — funziona su macchine con 16GB di RAM senza crash.
/auto-whisper-safebrw-de-ai-ify
Rimuovi gergo generato dall'AI e ripristina la voce umana nel testo.
/brw-de-ai-ifydellight-cro-revenue-ops
DELLIGHT.AI è una startup AI in DIFC, Dubai.
/dellight-cro-revenue-opsdocuments-ai
API di OCR e estrazione dati in tempo reale di Veryfi.
/documents-aidoubao-api-open-tts
Servizio di Text-to-Speech utilizzando Doubao (Motore Volcano).
/doubao-api-open-ttseachlabs-voice-audio
TTS, STT, conversione della voce utilizzando ElevenLabs, Whisper, RVC
/eachlabs-voice-audiofeishu-minutes
recupera informazioni, statistiche, trascrizioni e media da Feishu
/feishu-minutesgettr-transcribe-summarize
scarica audio da un post GETTR
/gettr-transcribe-summarizehebrew-nikud
riferimento ai nikud (punti vocalici) ebraici per agenti AI
/hebrew-nikudnorman-categorize-transactions
revisione e categorizzazione delle transazioni bancarie non categorizzate, abbinamento con fatture e verifica delle registrazioni contabili
/norman-categorize-transactionsnorman-monthly-reconciliation
esecuzione di una riconciliazione finanziaria mensile completa - revisione di tutte le transazioni, abbinamento delle fatture, verifica delle somme pendenti
/norman-monthly-reconciliationressemble
integrazione di Text-to-Speech e Speech-to-Text utilizzando l'API HTTP di Resemble AI
/ressemblesiliconflow-tts-gen
text-to-speech utilizzando l'API SiliconFlow (CosyVoice2)
/siliconflow-tts-gen