Home/Voce e trascrizione
🎙️

Voce e trascrizione

(71)
🎖️In evidenza
41,621

Mcporter

Mcporter: Utilizza il CLI mcporter per elencare, configurare, autenticare e chiamare server/tools MCP direttamente (HTTP o stdio), inclusi server ad hoc, modifiche alla configurazione e generazione CLI/type.

🎖️In evidenza
31,978

OpenClaw YouTube Transcript

Trascrizione YouTube OpenClaw: Trascrive video YouTube in testo estrarre direttamente i sottotitoli e i caption dall'URL del video utilizzando yt-dlp senza elaborazione audio.

🎙️Voce e trascrizione/openclaw-youtube-transcript
🎖️In evidenza
18,448

Sag

Sag: ElevenLabs text-to-speech con interfaccia utente mac-style say.

🎖️In evidenza
15,590

YouTube Transcript

Trascrizione YouTube: Recupera e riassumi le trascrizioni dei video YouTube. Usa quando si chiede di riassumere, trascrivere o estrarre contenuti dai video YouTube. Gestisce il recupero delle trascrizioni tramite proxy IP residenziale per bypassare i blocchi IP cloud di YouTube.

🎙️Voce e trascrizione/youtube-transcript

Local Whisper

Linguaggio Locale: Traduzione della voce locale in testo utilizzando OpenAI Whisper. Funziona completamente offline dopo il download del modello. Trascrizione ad alta qualità con diverse dimensioni di modello.

elevenlabs-voices

Sintesi vocale di alta qualità con 18 personaggi, 32.

🎙️Voce e trascrizione/elevenlabs-voices

faster-whisper

trascrizione locale utilizzando faster-whisper

elevenlabs-tts

TTS ElevenLabs - la migliore integrazione di ElevenLabs per OpenClaw

Voice Transcribe

Trascrittura vocale: Trascrive file audio utilizzando il modello gpt-4o-mini-transcribe di OpenAI con suggerimenti lessicali e sostituzioni di testo. Richiede uv (https://docs.astral.sh/uv/).

jarvis-voice

voce AI metallica con TTS e stile di trascrizione visiva

kokoro-tts

generazione di audio parlato dal testo utilizzando il motore locale Kokoro TTS

ElevenLabs Speech-to-Text

Trascrivi file audio utilizzando ElevenLabs Speech-to-Text (Scribe v2)

Mlx Whisper

Parola locale con MLX Whisper (ottimizzato per Apple Silicon, senza chiave API).

Transcribe audio files via OpenRouter using audio-capable models

Trascrivere file audio tramite OpenRouter utilizzando modelli con capacità audio: Trascrivere file audio tramite OpenRouter utilizzando modelli con capacità audio (Gemini, GPT-4o-audio, ecc.)

🎙️Voce e trascrizione/openrouter-transcribe

Gemini STT

Trascrive file audio utilizzando l'API Gemini di Google o Vertex AI

Tts

Convertire il testo in voce utilizzando l'API di Hume AI (o OpenAI). Utilizzare quando l'utente richiede un messaggio audio, una risposta vocale o per ascoltare qualcosa con una voce 'di vive voce'.

Local Whisper

Whisper locale: Libera trascrizione vocale in italiano per Telegram e WhatsApp utilizzando MLX Whisper su Apple Silicon. Privato, senza costi di API.

🎙️Voce e trascrizione/whisper-mlx-local

Transcribe

Trascrivi: Trascrivi file audio in testo utilizzando Whisper locale (Docker). Usa quando ricevi messaggi vocali, file audio (.mp3, .m4a, .ogg, .wav, .webm) o quando ti viene richiesto di trascrivere contenuti audio.

assemblyai-transcribe

Trascrive audio/video utilizzando AssemblyAI.

🎙️Voce e trascrizione/assemblyai-transcribe

elevenlabs-agents

Creare, gestire e distribuire ElevenLabs

🎙️Voce e trascrizione/elevenlabs-agents

Local STT (Nvidia Parakeet + Whisper Support)

STT locale (Nvidia Parakeet + Supporto Whisper): STT locale con backend selezionabile - Parakeet (massima accuratezza) o Whisper (più veloce, multilingue).

audio-gen

Genera audiolibri, podcast o contenuti audio educativi.

critical-article-writer

Genera articoli bozze e schemi.

🎙️Voce e trascrizione/critical-article-writer

audio-reply

Genera risposte audio utilizzando TTS (Text-to-Speech).

🎙️Voce e trascrizione/audio-reply-skill

it will help you to send voice messages to your AI Assistant and also can make it talk

Ti aiuta a inviare messaggi vocali al tuo Assistente AI e può farlo anche parlare: Text-to-Speech e Speech-to-Text utilizzando l'AI di ElevenLabs. Usa quando l'utente vuole convertire il testo in voce, trascrivere messaggi vocali o lavorare con la voce in più lingue. Supporta voci AI ad alta qualità e trascrizioni accurate.

elevenlabs-transcribe

Trascrittura audio in testo utilizzando ElevenLabs

🎙️Voce e trascrizione/elevenlabs-transcribe

Parakeet Stt

Parakeet Stt: Speech-to-text locale con NVIDIA Parakeet TDT 0.6B v3 (ONNX su CPU). 30 volte più veloce di Whisper, 25 lingue, rilevamento automatico, API compatibile con OpenAI. Utilizzare per trascrivere file audio, convertire voce in testo o elaborare registrazioni vocali localmente senza API cloud.

deepgram

Interfaccia a riga di comando per Deepgram speech-to-text.

announcer

Annuncia il testo in tutta la casa tramite altoparlanti AirPlay utilizzando Airfoil +.

Speech To Text

Trascrizione audio in testo con modelli Whisper tramite CLI inference.sh. Modelli: Fast Whisper Large V3, Whisper V3 Large. Funzionalità: trascrizione, traduzione,...

Voice

Vocale: Converti il testo in voce utilizzando il motore TTS di Microsoft Edge con voci personalizzabili, riproduzione diretta e pulizia automatica dei file temporanei.

addis-assistant-stt

Fornisce Speech-to-Text (STT) e testo

🎙️Voce e trascrizione/addis-assistant-stt

Pocket Tts

Generare speech in inglese di alta qualità offline utilizzando il CPU con 8 voci integrate o clonazione delle voci personalizzata con il modello Pocket TTS di Kyutai.

inworld-tts

text-to-speech tramite API di Inworld.ai

Voicenotes

Sincronizzazione e accesso alle note vocali da Voicenotes.com. Utilizzare quando l'utente desidera recuperare le loro registrazioni vocali, i trascritti e i sommari AI da Voicenotes. Supporta il recupero delle note, la sincronizzazione con markdown e la ricerca dei trascritti.

claw-voice

Connesso a una sessione utente in diretta tramite voce.

Transcribe Audio with Parakeet MLX

Trascrivi Audio con Parakeet MLX: Speech-to-text locale con Parakeet MLX (ASR) per Apple Silicon (nessuna chiave API).

clonev

Clona qualsiasi voce e genera speech utilizzando Coqui XTTS v2.

cult-of-carcinization

Dai una voce al tuo agente e ascoltalo.

🎙️Voce e trascrizione/cult-of-carcinization

deepdub-tts

Genera audio speech utilizzando Deepdub e allegalo come MEDIA.

chichi-speech

Servizio RESTful per un testo-a-vocale di alta qualità utilizzando Qwen3.

lnbits

gestione del portafoglio Lightning LNbits (Saldo, Pagamento, Fattura)

Voicenotes Official

Voicenotes Official: Questa abilità ufficiale della squadra Voicenotes offre OpenClaw l'accesso a nuovi API e la capacità di cercare semanticamente, recuperare trascrizioni complete, filtrare per t...

🎙️Voce e trascrizione/voicenotes-official

tl;dw - YouTube Video Summarizer

YouTube Video Summarizer: Estrae i trascritti dei video YouTube e fornisce riassunti concisi che evidenziano i punti principali, gli argomenti e le conclusioni senza guardare l'intero video.

Openai Tts.Bak 2026 01 28T18:01:23+10:30

Testo-parola tramite API di Speech Audio OpenAI

🎙️Voce e trascrizione/openai-tts-bak-2026-01-28t18-01-23-10-30

speech-recognition

Riconoscimento vocale universale. Supporta vari formati audio (ogg/mp3/wav/m4a) e utilizza l'API SenseVoice API basata su silicio per trasformare il testo in voce. Attivato quando l'utente invia messaggi vocali, file audio o necessita di trascrivere audio.

🎙️Voce e trascrizione/speech-recognition

freshbooks-cli

CLI di FreshBooks per la gestione delle fatture, clienti e fatturazione

Text To Speech

Converti il testo in speech naturale con DIA TTS, Kokoro, Chatterbox e altri tramite CLI inference.sh. Modelli: DIA TTS (conversazionale), Kokoro TTS, Chatterbox, Hig...

AssemblyAI Transcriber

AssemblyAI Transcriber: Trascrive file audio con diarizzazione degli speaker (chi parla quando). Supporta 100+ lingue, rilevamento automatico della lingua e timestamp. Utilizzabile per riunioni, interviste, podcast o messaggi vocali. Richiede la chiave API di AssemblyAI.

🎙️Voce e trascrizione/assemblyai-transcriber

Whisper Transcribe

Trascrittura in Sussurro: Trascrive file audio in testo utilizzando OpenAI Whisper. Supporta la trascrizione dal parlato con rilevamento automatico della lingua, formati di output multipli (txt, srt, vtt, ), elaborazione in lotti e selezione del modello (da piccolo a grande). Usa quando trascrivi registrazioni audio, podcast, messaggi vocali, lezioni, riunioni o qualsiasi file audio/video in testo. Gestisce formati mp3, wav, m4a, ogg, flac, webm, opus, aac.

🎙️Voce e trascrizione/whisper-transcribe

eternal-haven-lore-pack

packe delle leggende di Eterna Tavola + packe mitico

🎙️Voce e trascrizione/eternal-haven-lore-pack

agent-voice

Piattaforma di blogging da riga di comando per agenti AI

akaunting

Interagisci con il software di contabilità open-source Akaunting tramite l'API REST

auto-whisper-safe

Trascrizione vocale sicura RAM con chunking automatico — funziona su macchine con 16GB di RAM senza crash.

🎙️Voce e trascrizione/auto-whisper-safe

brw-de-ai-ify

Rimuovi gergo generato dall'AI e ripristina la voce umana nel testo.

dellight-cro-revenue-ops

DELLIGHT.AI è una startup AI in DIFC, Dubai.

🎙️Voce e trascrizione/dellight-cro-revenue-ops

documents-ai

API di OCR e estrazione dati in tempo reale di Veryfi.

doubao-api-open-tts

Servizio di Text-to-Speech utilizzando Doubao (Motore Volcano).

🎙️Voce e trascrizione/doubao-api-open-tts

duby

Convertire il testo in voce utilizzando l'API Duby.so

eachlabs-voice-audio

TTS, STT, conversione della voce utilizzando ElevenLabs, Whisper, RVC

🎙️Voce e trascrizione/eachlabs-voice-audio

easyverein-api

Lavorare con l'API REST easyVerein v2.0

elevenlabs-media

Generazione di musica con ElevenLabs

feishu-minutes

recupera informazioni, statistiche, trascrizioni e media da Feishu

gettr-transcribe-summarize

scarica audio da un post GETTR

🎙️Voce e trascrizione/gettr-transcribe-summarize

hebrew-nikud

riferimento ai nikud (punti vocalici) ebraici per agenti AI

her-voice

dai una voce al tuo agente

miranda-sag

text-to-speech ElevenLabs con UX di say in stile mac

norman-categorize-transactions

revisione e categorizzazione delle transazioni bancarie non categorizzate, abbinamento con fatture e verifica delle registrazioni contabili

🎙️Voce e trascrizione/norman-categorize-transactions

norman-monthly-reconciliation

esecuzione di una riconciliazione finanziaria mensile completa - revisione di tutte le transazioni, abbinamento delle fatture, verifica delle somme pendenti

🎙️Voce e trascrizione/norman-monthly-reconciliation

ressemble

integrazione di Text-to-Speech e Speech-to-Text utilizzando l'API HTTP di Resemble AI

siliconflow-tts-gen

text-to-speech utilizzando l'API SiliconFlow (CosyVoice2)

🎙️Voce e trascrizione/siliconflow-tts-gen