Home/Voce e trascrizione

🎙️

Voce e trascrizione

(71)

🎖️In evidenza

41,621

Mcporter

Mcporter: Utilizza il CLI mcporter per elencare, configurare, autenticare e chiamare server/tools MCP direttamente (HTTP o stdio), inclusi server ad hoc, modifiche alla configurazione e generazione CLI/type.

🎙️Voce e trascrizione/mcporter

🎖️In evidenza

31,978

OpenClaw YouTube Transcript

Trascrizione YouTube OpenClaw: Trascrive video YouTube in testo estrarre direttamente i sottotitoli e i caption dall'URL del video utilizzando yt-dlp senza elaborazione audio.

🎙️Voce e trascrizione/openclaw-youtube-transcript

🎖️In evidenza

18,448

Sag

Sag: ElevenLabs text-to-speech con interfaccia utente mac-style say.

🎙️Voce e trascrizione/sag

🎖️In evidenza

15,590

YouTube Transcript

Trascrizione YouTube: Recupera e riassumi le trascrizioni dei video YouTube. Usa quando si chiede di riassumere, trascrivere o estrarre contenuti dai video YouTube. Gestisce il recupero delle trascrizioni tramite proxy IP residenziale per bypassare i blocchi IP cloud di YouTube.

🎙️Voce e trascrizione/youtube-transcript

Local Whisper

Linguaggio Locale: Traduzione della voce locale in testo utilizzando OpenAI Whisper. Funziona completamente offline dopo il download del modello. Trascrizione ad alta qualità con diverse dimensioni di modello.

🎙️Voce e trascrizione/local-whisper

elevenlabs-voices

Sintesi vocale di alta qualità con 18 personaggi, 32.

🎙️Voce e trascrizione/elevenlabs-voices

faster-whisper

trascrizione locale utilizzando faster-whisper

🎙️Voce e trascrizione/faster-whisper

elevenlabs-tts

TTS ElevenLabs - la migliore integrazione di ElevenLabs per OpenClaw

🎙️Voce e trascrizione/elevenlabs-tts

Voice Transcribe

Trascrittura vocale: Trascrive file audio utilizzando il modello gpt-4o-mini-transcribe di OpenAI con suggerimenti lessicali e sostituzioni di testo. Richiede uv (https://docs.astral.sh/uv/).

🎙️Voce e trascrizione/voice-transcribe

jarvis-voice

voce AI metallica con TTS e stile di trascrizione visiva

🎙️Voce e trascrizione/jarvis-voice

kokoro-tts

generazione di audio parlato dal testo utilizzando il motore locale Kokoro TTS

🎙️Voce e trascrizione/kokoro-tts

ElevenLabs Speech-to-Text

Trascrivi file audio utilizzando ElevenLabs Speech-to-Text (Scribe v2)

🎙️Voce e trascrizione/elevenlabs-stt

Mlx Whisper

Parola locale con MLX Whisper (ottimizzato per Apple Silicon, senza chiave API).

🎙️Voce e trascrizione/mlx-whisper

Transcribe audio files via OpenRouter using audio-capable models

Trascrivere file audio tramite OpenRouter utilizzando modelli con capacità audio: Trascrivere file audio tramite OpenRouter utilizzando modelli con capacità audio (Gemini, GPT-4o-audio, ecc.)

🎙️Voce e trascrizione/openrouter-transcribe

Gemini STT

Trascrive file audio utilizzando l'API Gemini di Google o Vertex AI

🎙️Voce e trascrizione/gemini-stt

Tts

Convertire il testo in voce utilizzando l'API di Hume AI (o OpenAI). Utilizzare quando l'utente richiede un messaggio audio, una risposta vocale o per ascoltare qualcosa con una voce 'di vive voce'.

🎙️Voce e trascrizione/tts

Local Whisper

Whisper locale: Libera trascrizione vocale in italiano per Telegram e WhatsApp utilizzando MLX Whisper su Apple Silicon. Privato, senza costi di API.

🎙️Voce e trascrizione/whisper-mlx-local

Transcribe

Trascrivi: Trascrivi file audio in testo utilizzando Whisper locale (Docker). Usa quando ricevi messaggi vocali, file audio (.mp3, .m4a, .ogg, .wav, .webm) o quando ti viene richiesto di trascrivere contenuti audio.

🎙️Voce e trascrizione/transcribe

assemblyai-transcribe

Trascrive audio/video utilizzando AssemblyAI.

🎙️Voce e trascrizione/assemblyai-transcribe

elevenlabs-agents

Creare, gestire e distribuire ElevenLabs

🎙️Voce e trascrizione/elevenlabs-agents

Local STT (Nvidia Parakeet + Whisper Support)

STT locale (Nvidia Parakeet + Supporto Whisper): STT locale con backend selezionabile - Parakeet (massima accuratezza) o Whisper (più veloce, multilingue).

🎙️Voce e trascrizione/local-stt

audio-gen

Genera audiolibri, podcast o contenuti audio educativi.

🎙️Voce e trascrizione/audio-gen

critical-article-writer

Genera articoli bozze e schemi.

🎙️Voce e trascrizione/critical-article-writer

audio-reply

Genera risposte audio utilizzando TTS (Text-to-Speech).

🎙️Voce e trascrizione/audio-reply-skill

it will help you to send voice messages to your AI Assistant and also can make it talk

Ti aiuta a inviare messaggi vocali al tuo Assistente AI e può farlo anche parlare: Text-to-Speech e Speech-to-Text utilizzando l'AI di ElevenLabs. Usa quando l'utente vuole convertire il testo in voce, trascrivere messaggi vocali o lavorare con la voce in più lingue. Supporta voci AI ad alta qualità e trascrizioni accurate.

🎙️Voce e trascrizione/elevenlabs-voice

elevenlabs-transcribe

Trascrittura audio in testo utilizzando ElevenLabs

🎙️Voce e trascrizione/elevenlabs-transcribe

Parakeet Stt

Parakeet Stt: Speech-to-text locale con NVIDIA Parakeet TDT 0.6B v3 (ONNX su CPU). 30 volte più veloce di Whisper, 25 lingue, rilevamento automatico, API compatibile con OpenAI. Utilizzare per trascrivere file audio, convertire voce in testo o elaborare registrazioni vocali localmente senza API cloud.

🎙️Voce e trascrizione/parakeet-stt

deepgram

Interfaccia a riga di comando per Deepgram speech-to-text.

🎙️Voce e trascrizione/deepgram

announcer

Annuncia il testo in tutta la casa tramite altoparlanti AirPlay utilizzando Airfoil +.

🎙️Voce e trascrizione/announcer

Speech To Text

Trascrizione audio in testo con modelli Whisper tramite CLI inference.sh. Modelli: Fast Whisper Large V3, Whisper V3 Large. Funzionalità: trascrizione, traduzione,...

🎙️Voce e trascrizione/speech-to-text

Voice

Vocale: Converti il testo in voce utilizzando il motore TTS di Microsoft Edge con voci personalizzabili, riproduzione diretta e pulizia automatica dei file temporanei.

🎙️Voce e trascrizione/voice

addis-assistant-stt

Fornisce Speech-to-Text (STT) e testo

🎙️Voce e trascrizione/addis-assistant-stt

Pocket Tts

Generare speech in inglese di alta qualità offline utilizzando il CPU con 8 voci integrate o clonazione delle voci personalizzata con il modello Pocket TTS di Kyutai.

🎙️Voce e trascrizione/pocket-tts

inworld-tts

text-to-speech tramite API di Inworld.ai

🎙️Voce e trascrizione/inworld-tts

Voicenotes

Sincronizzazione e accesso alle note vocali da Voicenotes.com. Utilizzare quando l'utente desidera recuperare le loro registrazioni vocali, i trascritti e i sommari AI da Voicenotes. Supporta il recupero delle note, la sincronizzazione con markdown e la ricerca dei trascritti.

🎙️Voce e trascrizione/voicenotes

claw-voice

Connesso a una sessione utente in diretta tramite voce.

🎙️Voce e trascrizione/claw-voice

Transcribe Audio with Parakeet MLX

Trascrivi Audio con Parakeet MLX: Speech-to-text locale con Parakeet MLX (ASR) per Apple Silicon (nessuna chiave API).

🎙️Voce e trascrizione/parakeet-mlx

clonev

Clona qualsiasi voce e genera speech utilizzando Coqui XTTS v2.

🎙️Voce e trascrizione/clonev

cult-of-carcinization

Dai una voce al tuo agente e ascoltalo.

🎙️Voce e trascrizione/cult-of-carcinization

deepdub-tts

Genera audio speech utilizzando Deepdub e allegalo come MEDIA.

🎙️Voce e trascrizione/deepdub-tts

chichi-speech

Servizio RESTful per un testo-a-vocale di alta qualità utilizzando Qwen3.

🎙️Voce e trascrizione/chichi-speech

lnbits

gestione del portafoglio Lightning LNbits (Saldo, Pagamento, Fattura)

🎙️Voce e trascrizione/lnbits

Voicenotes Official

Voicenotes Official: Questa abilità ufficiale della squadra Voicenotes offre OpenClaw l'accesso a nuovi API e la capacità di cercare semanticamente, recuperare trascrizioni complete, filtrare per t...

🎙️Voce e trascrizione/voicenotes-official

tl;dw - YouTube Video Summarizer

YouTube Video Summarizer: Estrae i trascritti dei video YouTube e fornisce riassunti concisi che evidenziano i punti principali, gli argomenti e le conclusioni senza guardare l'intero video.

🎙️Voce e trascrizione/tldw

Openai Tts.Bak 2026 01 28T18:01:23+10:30

Testo-parola tramite API di Speech Audio OpenAI

🎙️Voce e trascrizione/openai-tts-bak-2026-01-28t18-01-23-10-30

speech-recognition

Riconoscimento vocale universale. Supporta vari formati audio (ogg/mp3/wav/m4a) e utilizza l'API SenseVoice API basata su silicio per trasformare il testo in voce. Attivato quando l'utente invia messaggi vocali, file audio o necessita di trascrivere audio.

🎙️Voce e trascrizione/speech-recognition

freshbooks-cli

CLI di FreshBooks per la gestione delle fatture, clienti e fatturazione

🎙️Voce e trascrizione/freshbooks-cli

Text To Speech

Converti il testo in speech naturale con DIA TTS, Kokoro, Chatterbox e altri tramite CLI inference.sh. Modelli: DIA TTS (conversazionale), Kokoro TTS, Chatterbox, Hig...

🎙️Voce e trascrizione/text-to-speech

AssemblyAI Transcriber

AssemblyAI Transcriber: Trascrive file audio con diarizzazione degli speaker (chi parla quando). Supporta 100+ lingue, rilevamento automatico della lingua e timestamp. Utilizzabile per riunioni, interviste, podcast o messaggi vocali. Richiede la chiave API di AssemblyAI.

🎙️Voce e trascrizione/assemblyai-transcriber

Whisper Transcribe

Trascrittura in Sussurro: Trascrive file audio in testo utilizzando OpenAI Whisper. Supporta la trascrizione dal parlato con rilevamento automatico della lingua, formati di output multipli (txt, srt, vtt, ), elaborazione in lotti e selezione del modello (da piccolo a grande). Usa quando trascrivi registrazioni audio, podcast, messaggi vocali, lezioni, riunioni o qualsiasi file audio/video in testo. Gestisce formati mp3, wav, m4a, ogg, flac, webm, opus, aac.

🎙️Voce e trascrizione/whisper-transcribe

eternal-haven-lore-pack

packe delle leggende di Eterna Tavola + packe mitico

🎙️Voce e trascrizione/eternal-haven-lore-pack

agent-voice

Piattaforma di blogging da riga di comando per agenti AI

🎙️Voce e trascrizione/agent-voice

akaunting

Interagisci con il software di contabilità open-source Akaunting tramite l'API REST

🎙️Voce e trascrizione/akaunting

auto-whisper-safe

Trascrizione vocale sicura RAM con chunking automatico — funziona su macchine con 16GB di RAM senza crash.

🎙️Voce e trascrizione/auto-whisper-safe

brw-de-ai-ify

Rimuovi gergo generato dall'AI e ripristina la voce umana nel testo.

🎙️Voce e trascrizione/brw-de-ai-ify

dellight-cro-revenue-ops

DELLIGHT.AI è una startup AI in DIFC, Dubai.

🎙️Voce e trascrizione/dellight-cro-revenue-ops

documents-ai

API di OCR e estrazione dati in tempo reale di Veryfi.

🎙️Voce e trascrizione/documents-ai

doubao-api-open-tts

Servizio di Text-to-Speech utilizzando Doubao (Motore Volcano).

🎙️Voce e trascrizione/doubao-api-open-tts

duby

Convertire il testo in voce utilizzando l'API Duby.so

🎙️Voce e trascrizione/duby

eachlabs-voice-audio

TTS, STT, conversione della voce utilizzando ElevenLabs, Whisper, RVC

🎙️Voce e trascrizione/eachlabs-voice-audio

easyverein-api

Lavorare con l'API REST easyVerein v2.0

🎙️Voce e trascrizione/easyverein-api

elevenlabs-media

Generazione di musica con ElevenLabs

🎙️Voce e trascrizione/elevenlabs-media

feishu-minutes

recupera informazioni, statistiche, trascrizioni e media da Feishu

🎙️Voce e trascrizione/feishu-minutes

gettr-transcribe-summarize

scarica audio da un post GETTR

🎙️Voce e trascrizione/gettr-transcribe-summarize

hebrew-nikud

riferimento ai nikud (punti vocalici) ebraici per agenti AI

🎙️Voce e trascrizione/hebrew-nikud

her-voice

dai una voce al tuo agente

🎙️Voce e trascrizione/her-voice

miranda-sag

text-to-speech ElevenLabs con UX di say in stile mac

🎙️Voce e trascrizione/miranda-sag

norman-categorize-transactions

revisione e categorizzazione delle transazioni bancarie non categorizzate, abbinamento con fatture e verifica delle registrazioni contabili

🎙️Voce e trascrizione/norman-categorize-transactions

norman-monthly-reconciliation

esecuzione di una riconciliazione finanziaria mensile completa - revisione di tutte le transazioni, abbinamento delle fatture, verifica delle somme pendenti

🎙️Voce e trascrizione/norman-monthly-reconciliation

ressemble

integrazione di Text-to-Speech e Speech-to-Text utilizzando l'API HTTP di Resemble AI

🎙️Voce e trascrizione/ressemble

siliconflow-tts-gen

text-to-speech utilizzando l'API SiliconFlow (CosyVoice2)

🎙️Voce e trascrizione/siliconflow-tts-gen