Startseite/Sprache & Transkription

🎙️

Sprache & Transkription

(71)

🎖️Empfohlen

41,621

Mcporter

Verwende mcporter CLI, um MCP-Server/Tools direkt (HTTP oder stdio) zu auflisten, konfigurieren und anzuwenden, einschließlich Ad-hoc-Servern, Konfigurationsänderungen und CLI/Typ-Generierung.

🎙️Sprache & Transkription/mcporter

🎖️Empfohlen

31,978

OpenClaw YouTube Transcript

YouTube-Videos transkribieren, indem man Untertitel direkt aus der URL extrahiert. Ohne Audionachbearbeitung mit yt-dlp.

🎙️Sprache & Transkription/openclaw-youtube-transcript

🎖️Empfohlen

18,448

Sag

ElevenLabs Text-to-Speech mit Mac-Stil UX.

🎙️Sprache & Transkription/sag

🎖️Empfohlen

15,590

YouTube Transcript

YouTube-Transkript: Holen und zusammenfassen Sie YouTube-Video-Transkripte. Verwenden Sie dies, wenn Sie gebeten werden, Zusammenfassungen, Transkripte oder Inhalte aus YouTube-Videos zu extrahieren. Verarbeitet die Abfrage von Transkripten über einen Residential IP Proxy, um YouTube's Cloud IP-Blocks zu umgehen.

🎙️Sprache & Transkription/youtube-transcript

Local Whisper

Lokaler Sprach-to-Text mit OpenAI Whisper. Vollständig offline nach Modell-Download. Hohe Qualität der Transkription mit mehreren Modellgrößen.

🎙️Sprache & Transkription/local-whisper

elevenlabs-voices

Hochwertige Stimmsynthese mit 18 Persönlichkeiten

🎙️Sprache & Transkription/elevenlabs-voices

faster-whisper

Lokale Sprach-zu-Text-Übersetzung mit faster-whisper.

🎙️Sprache & Transkription/faster-whisper

elevenlabs-tts

Beste ElevenLabs-Integration für OpenClaw

🎙️Sprache & Transkription/elevenlabs-tts

Voice Transcribe

Voice Transcribe: Konvertieren Sie Audiodateien mithilfe des OpenAI gpt-4o-mini-transcribe Modells mit Wortschlüsseln und Textersetzungen. Erfordert uv (https://docs.astral.sh/uv/).

🎙️Sprache & Transkription/voice-transcribe

jarvis-voice

Metallische AI-Stimme mit TTS und visuellem Transkript-Design.

🎙️Sprache & Transkription/jarvis-voice

kokoro-tts

Erzeugt gesprochenen Audio aus Text mit dem lokalen Kokoro TTS-Engine.

🎙️Sprache & Transkription/kokoro-tts

ElevenLabs Speech-to-Text

ElevenLabs Speech-to-Text: Transkribieren Sie Audiodateien mit ElevenLabs Speech-to-Text (Scribe v2).

🎙️Sprache & Transkription/elevenlabs-stt

Mlx Whisper

Lokale Sprach-zu-Text-Übersetzung mit MLX Whisper (Optimiert für Apple Silicon, ohne API-Schlüssel).

🎙️Sprache & Transkription/mlx-whisper

Transcribe audio files via OpenRouter using audio-capable models

Transkribieren Sie Audiodateien über OpenRouter mithilfe von audiotauglichen Modellen: Transkribieren Sie Audiodateien über OpenRouter mithilfe audiotauglicher Modelle (Gemini, GPT-4o-audio, etc.).

🎙️Sprache & Transkription/openrouter-transcribe

Gemini STT

Transkribieren Sie Audiodateien mithilfe von Googles Gemini API oder Vertex AI

🎙️Sprache & Transkription/gemini-stt

Tts

Tts: Text in Sprache umwandeln mit Hume AI (oder OpenAI) API. Verwenden Sie dies, wenn der Benutzer nach einer Audio-Nachricht, einer Sprachantwort oder um etwas 'von vive voix' zu hören fragt.

🎙️Sprache & Transkription/tts

Local Whisper

Local Whisper: Kostenlose lokale Speech-to-Text für Telegram und WhatsApp mit MLX Whisper auf Apple Silicon. Privat, ohne API-Kosten.

🎙️Sprache & Transkription/whisper-mlx-local

Transcribe

Transkribieren: Konvertieren Sie Audiodateien in Text mit lokalem Whisper (Docker). Verwenden Sie dies, wenn Sie Sprachnachrichten, Audiodateien (.mp3, .m4a, .ogg, .wav, .webm) erhalten oder wenn Sie gebeten werden, Audiodaten zu transkribieren.

🎙️Sprache & Transkription/transcribe

assemblyai-transcribe

Audio/Video mit AssemblyAI transkribieren

🎙️Sprache & Transkription/assemblyai-transcribe

elevenlabs-agents

Erstellen, verwalten undployen von ElevenLabs.

🎙️Sprache & Transkription/elevenlabs-agents

Local STT (Nvidia Parakeet + Whisper Support)

Local STT (Nvidia Parakeet + Whisper Support): Lokale STT mit wählbaren Backends - Parakeet (beste Genauigkeit) oder Whisper (schnellst, mehrsprachig).

🎙️Sprache & Transkription/local-stt

audio-gen

Audiobücher, Podcasts oder Bildungsinhalte erstellen

🎙️Sprache & Transkription/audio-gen

critical-article-writer

Erstelle Artikelentwürfe und Gliederungen.

🎙️Sprache & Transkription/critical-article-writer

audio-reply

Erstellt Audio-Antworten mit TTS.

🎙️Sprache & Transkription/audio-reply-skill

it will help you to send voice messages to your AI Assistant and also can make it talk

Es hilft dir, Sprachnachrichten an deinen AI-Assistenten zu senden und ihn dazu zu bringen, zu sprechen: Text-to-Speech und Speech-to-Text mit ElevenLabs AI. Verwende dies, wenn der Benutzer Text in Sprache umwandeln, Sprachnachrichten transkribieren oder mit Sprache in mehreren Sprachen arbeiten möchte. Unterstützt hochwertige AI-Stimmen und genaue Transkription.

🎙️Sprache & Transkription/elevenlabs-voice

elevenlabs-transcribe

ElevenLabs-Audio in Text umwandeln

🎙️Sprache & Transkription/elevenlabs-transcribe

Parakeet Stt

Parakeet Stt: Lokale Speech-to-Text mit NVIDIA Parakeet TDT 0.6B v3 (ONNX auf CPU). 30-mal schneller als Whisper, 25 Sprachen, automatische Erkennung, OpenAI-kompatibler API. Verwenden Sie dies, wenn Audio-Dateien transkribiert werden, Sprache in Text umgewandelt wird oder lokale Voice-Recordings ohne Cloud-APIs verarbeitet werden.

🎙️Sprache & Transkription/parakeet-stt

deepgram

Deepgram-Kommandozeileninterface für Sprach-zu-Text

🎙️Sprache & Transkription/deepgram

announcer

Text über AirPlay-Lautsprecher mit Airfoil + verkünden

🎙️Sprache & Transkription/announcer

Speech To Text

Audio in Text transkribieren mit Whisper-Modellen über das inference.sh CLI. Modelle: Fast Whisper Large V3, Whisper V3 Large. Funktionen: Transkription, Übersetzung,...

🎙️Sprache & Transkription/speech-to-text

Voice

Sprache: Konvertiere Text in Sprache mithilfe des TTS-Engines von Microsoft Edge mit anpassbaren Stimmen, direkter Wiedergabe und automatischer Bereinigung temporärer Dateien.

🎙️Sprache & Transkription/voice

addis-assistant-stt

Sprach-zu-Text (STT) und Text

🎙️Sprache & Transkription/addis-assistant-stt

Pocket Tts

Pocket Tts: Generieren Sie offline auf CPU hochwertige englische Sprache mit 8 integrierten Stimmen oder mit dem Kyutai Pocket TTS-Modell personalisierte Stimmenklonierung.

🎙️Sprache & Transkription/pocket-tts

inworld-tts

Text-to-Speech über die Inworld.ai API.

🎙️Sprache & Transkription/inworld-tts

Voicenotes

Voicenotes: Synchronisation und Zugriff auf Sprachnotizen von Voicenotes.com. Verwenden Sie dies, wenn der Benutzer seine Sprachaufzeichnungen, Transkripte und AI-Zusammenfassungen von Voicenotes abrufen möchte. Unterstützt das Abrufen von Notizen, Synchronisation zu Markdown und die Suche in Transkripten.

🎙️Sprache & Transkription/voicenotes

claw-voice

Verbindung zu einer Live-Nutzer-Sitzung über Sprache hergestellt.

🎙️Sprache & Transkription/claw-voice

Transcribe Audio with Parakeet MLX

Audio mit Parakeet MLX transkribieren: Lokale Sprach-zu-Text-Übersetzung mit Parakeet MLX (ASR) für Apple Silicon (kein API-Schlüssel).

🎙️Sprache & Transkription/parakeet-mlx

clonev

Jede Stimme klonen und mit Coqui XTTS v2 sprechen erzeugen.

🎙️Sprache & Transkription/clonev

cult-of-carcinization

Gib deinem Agenten eine Stimme und Ohren.

🎙️Sprache & Transkription/cult-of-carcinization

deepdub-tts

Erstelle Sprachaudio mit Deepdub und hänge es als MEDIA bei an.

🎙️Sprache & Transkription/deepdub-tts

chichi-speech

Ein RESTful-Dienst für hochwertige Text-zu-Sprache mit Qwen3.

🎙️Sprache & Transkription/chichi-speech

lnbits

Verwalte LNbits Lightning Wallet (Guthaben, Zahlungen, Rechnungen).

🎙️Sprache & Transkription/lnbits

Voicenotes Official

Voicenotes Official: Dieser offizielle Skill von der Voicenotes-Team gibt OpenClaw Zugang zu neuen APIs und die Fähigkeit, semantisch zu suchen, vollständige Transkripte abzurufen, nach Filterkriterien zu sortieren, ...

🎙️Sprache & Transkription/voicenotes-official

tl;dw - YouTube Video Summarizer

tl;dw - YouTube Video Zusammenfasser: Extrahiert YouTube Video-Transkripte und bietet prägnante Zusammenfassungen, die Hauptpunkte, Argumente und Schlussfolgerungen hervorheben, ohne das gesamte Video anzusehen.

🎙️Sprache & Transkription/tldw

Openai Tts.Bak 2026 01 28T18:01:23+10:30

Openai Tts.Bak 2026 01 28T18:01:23+10:30: Text-to-speech über die OpenAI Audio Speech API.

🎙️Sprache & Transkription/openai-tts-bak-2026-01-28t18-01-23-10-30

speech-recognition

Allgemeine Spracherkennung. Unterstützt verschiedene Audioformate (ogg/mp3/wav/m4a) und nutzt die SenseVoice API für die Umwandlung von Sprache in Text. Wird ausgelöst, wenn der Benutzer eine Sprachnachricht, einen Audiofile sendet oder eine Audio-Transkription benötigt.

🎙️Sprache & Transkription/speech-recognition

freshbooks-cli

FreshBooks-CLI zur Verwaltung von Rechnungen, Kunden und Abrechnung.

🎙️Sprache & Transkription/freshbooks-cli

Text To Speech

Text zu Sprache: Konvertieren Sie Text in natürliche Sprache mit DIA TTS, Kokoro, Chatterbox und mehr über inference.sh CLI. Modelle: DIA TTS (konversational), Kokoro TTS, Chatterbox, Hig...

🎙️Sprache & Transkription/text-to-speech

AssemblyAI Transcriber

AssemblyAI Transcriber: Audio-Dateien mit Sprecherdiarisation (wer spricht wann) transkribieren. Unterstützt über 100 Sprachen, automatische Spracherkennung und Zeitstempel. Für Besprechungen, Interviews, Podcasts oder Sprachnachrichten verwenden. Erfordert AssemblyAI API-Schlüssel.

🎙️Sprache & Transkription/assemblyai-transcriber

Whisper Transcribe

Whisper Transcribe: Audio-Dateien in Text transkribieren using OpenAI Whisper. Unterstützt Speech-to-Text mit automatischer Spracherkennung, mehrere Ausgabeformate (txt, srt, vtt, ), Batch-Verarbeitung und Modellauswahl (von klein bis groß). Verwenden Sie diese Fähigkeit, um Audioaufzeichnungen, Podcasts, Sprachnachrichten, Vorträge, Sitzungen oder jegliche Audio-/Videodatei in Text zu transkribieren. Verarbeitet Formate wie mp3, wav, m4a, ogg, flac, webm, opus, aac.

🎙️Sprache & Transkription/whisper-transcribe