Startseite/Sprache & Transkription
🎙️

Sprache & Transkription

(71)
🎖️Empfohlen
41,621

Mcporter

Verwende mcporter CLI, um MCP-Server/Tools direkt (HTTP oder stdio) zu auflisten, konfigurieren und anzuwenden, einschließlich Ad-hoc-Servern, Konfigurationsänderungen und CLI/Typ-Generierung.

🎖️Empfohlen
31,978

OpenClaw YouTube Transcript

YouTube-Videos transkribieren, indem man Untertitel direkt aus der URL extrahiert. Ohne Audionachbearbeitung mit yt-dlp.

🎙️Sprache & Transkription/openclaw-youtube-transcript
🎖️Empfohlen
18,448

Sag

ElevenLabs Text-to-Speech mit Mac-Stil UX.

🎖️Empfohlen
15,590

YouTube Transcript

YouTube-Transkript: Holen und zusammenfassen Sie YouTube-Video-Transkripte. Verwenden Sie dies, wenn Sie gebeten werden, Zusammenfassungen, Transkripte oder Inhalte aus YouTube-Videos zu extrahieren. Verarbeitet die Abfrage von Transkripten über einen Residential IP Proxy, um YouTube's Cloud IP-Blocks zu umgehen.

Local Whisper

Lokaler Sprach-to-Text mit OpenAI Whisper. Vollständig offline nach Modell-Download. Hohe Qualität der Transkription mit mehreren Modellgrößen.

elevenlabs-voices

Hochwertige Stimmsynthese mit 18 Persönlichkeiten

faster-whisper

Lokale Sprach-zu-Text-Übersetzung mit faster-whisper.

elevenlabs-tts

Beste ElevenLabs-Integration für OpenClaw

Voice Transcribe

Voice Transcribe: Konvertieren Sie Audiodateien mithilfe des OpenAI gpt-4o-mini-transcribe Modells mit Wortschlüsseln und Textersetzungen. Erfordert uv (https://docs.astral.sh/uv/).

jarvis-voice

Metallische AI-Stimme mit TTS und visuellem Transkript-Design.

kokoro-tts

Erzeugt gesprochenen Audio aus Text mit dem lokalen Kokoro TTS-Engine.

ElevenLabs Speech-to-Text

ElevenLabs Speech-to-Text: Transkribieren Sie Audiodateien mit ElevenLabs Speech-to-Text (Scribe v2).

Mlx Whisper

Lokale Sprach-zu-Text-Übersetzung mit MLX Whisper (Optimiert für Apple Silicon, ohne API-Schlüssel).

Transcribe audio files via OpenRouter using audio-capable models

Transkribieren Sie Audiodateien über OpenRouter mithilfe von audiotauglichen Modellen: Transkribieren Sie Audiodateien über OpenRouter mithilfe audiotauglicher Modelle (Gemini, GPT-4o-audio, etc.).

🎙️Sprache & Transkription/openrouter-transcribe

Gemini STT

Transkribieren Sie Audiodateien mithilfe von Googles Gemini API oder Vertex AI

Tts

Tts: Text in Sprache umwandeln mit Hume AI (oder OpenAI) API. Verwenden Sie dies, wenn der Benutzer nach einer Audio-Nachricht, einer Sprachantwort oder um etwas 'von vive voix' zu hören fragt.

Local Whisper

Local Whisper: Kostenlose lokale Speech-to-Text für Telegram und WhatsApp mit MLX Whisper auf Apple Silicon. Privat, ohne API-Kosten.

Transcribe

Transkribieren: Konvertieren Sie Audiodateien in Text mit lokalem Whisper (Docker). Verwenden Sie dies, wenn Sie Sprachnachrichten, Audiodateien (.mp3, .m4a, .ogg, .wav, .webm) erhalten oder wenn Sie gebeten werden, Audiodaten zu transkribieren.

assemblyai-transcribe

Audio/Video mit AssemblyAI transkribieren

🎙️Sprache & Transkription/assemblyai-transcribe

elevenlabs-agents

Erstellen, verwalten undployen von ElevenLabs.

Local STT (Nvidia Parakeet + Whisper Support)

Local STT (Nvidia Parakeet + Whisper Support): Lokale STT mit wählbaren Backends - Parakeet (beste Genauigkeit) oder Whisper (schnellst, mehrsprachig).

audio-gen

Audiobücher, Podcasts oder Bildungsinhalte erstellen

critical-article-writer

Erstelle Artikelentwürfe und Gliederungen.

🎙️Sprache & Transkription/critical-article-writer

audio-reply

Erstellt Audio-Antworten mit TTS.

it will help you to send voice messages to your AI Assistant and also can make it talk

Es hilft dir, Sprachnachrichten an deinen AI-Assistenten zu senden und ihn dazu zu bringen, zu sprechen: Text-to-Speech und Speech-to-Text mit ElevenLabs AI. Verwende dies, wenn der Benutzer Text in Sprache umwandeln, Sprachnachrichten transkribieren oder mit Sprache in mehreren Sprachen arbeiten möchte. Unterstützt hochwertige AI-Stimmen und genaue Transkription.

elevenlabs-transcribe

ElevenLabs-Audio in Text umwandeln

🎙️Sprache & Transkription/elevenlabs-transcribe

Parakeet Stt

Parakeet Stt: Lokale Speech-to-Text mit NVIDIA Parakeet TDT 0.6B v3 (ONNX auf CPU). 30-mal schneller als Whisper, 25 Sprachen, automatische Erkennung, OpenAI-kompatibler API. Verwenden Sie dies, wenn Audio-Dateien transkribiert werden, Sprache in Text umgewandelt wird oder lokale Voice-Recordings ohne Cloud-APIs verarbeitet werden.

deepgram

Deepgram-Kommandozeileninterface für Sprach-zu-Text

announcer

Text über AirPlay-Lautsprecher mit Airfoil + verkünden

Speech To Text

Audio in Text transkribieren mit Whisper-Modellen über das inference.sh CLI. Modelle: Fast Whisper Large V3, Whisper V3 Large. Funktionen: Transkription, Übersetzung,...

Voice

Sprache: Konvertiere Text in Sprache mithilfe des TTS-Engines von Microsoft Edge mit anpassbaren Stimmen, direkter Wiedergabe und automatischer Bereinigung temporärer Dateien.

addis-assistant-stt

Sprach-zu-Text (STT) und Text

🎙️Sprache & Transkription/addis-assistant-stt

Pocket Tts

Pocket Tts: Generieren Sie offline auf CPU hochwertige englische Sprache mit 8 integrierten Stimmen oder mit dem Kyutai Pocket TTS-Modell personalisierte Stimmenklonierung.

inworld-tts

Text-to-Speech über die Inworld.ai API.

Voicenotes

Voicenotes: Synchronisation und Zugriff auf Sprachnotizen von Voicenotes.com. Verwenden Sie dies, wenn der Benutzer seine Sprachaufzeichnungen, Transkripte und AI-Zusammenfassungen von Voicenotes abrufen möchte. Unterstützt das Abrufen von Notizen, Synchronisation zu Markdown und die Suche in Transkripten.

claw-voice

Verbindung zu einer Live-Nutzer-Sitzung über Sprache hergestellt.

Transcribe Audio with Parakeet MLX

Audio mit Parakeet MLX transkribieren: Lokale Sprach-zu-Text-Übersetzung mit Parakeet MLX (ASR) für Apple Silicon (kein API-Schlüssel).

clonev

Jede Stimme klonen und mit Coqui XTTS v2 sprechen erzeugen.

cult-of-carcinization

Gib deinem Agenten eine Stimme und Ohren.

🎙️Sprache & Transkription/cult-of-carcinization

deepdub-tts

Erstelle Sprachaudio mit Deepdub und hänge es als MEDIA bei an.

chichi-speech

Ein RESTful-Dienst für hochwertige Text-zu-Sprache mit Qwen3.

lnbits

Verwalte LNbits Lightning Wallet (Guthaben, Zahlungen, Rechnungen).

Voicenotes Official

Voicenotes Official: Dieser offizielle Skill von der Voicenotes-Team gibt OpenClaw Zugang zu neuen APIs und die Fähigkeit, semantisch zu suchen, vollständige Transkripte abzurufen, nach Filterkriterien zu sortieren, ...

🎙️Sprache & Transkription/voicenotes-official

tl;dw - YouTube Video Summarizer

tl;dw - YouTube Video Zusammenfasser: Extrahiert YouTube Video-Transkripte und bietet prägnante Zusammenfassungen, die Hauptpunkte, Argumente und Schlussfolgerungen hervorheben, ohne das gesamte Video anzusehen.

Openai Tts.Bak 2026 01 28T18:01:23+10:30

Openai Tts.Bak 2026 01 28T18:01:23+10:30: Text-to-speech über die OpenAI Audio Speech API.

🎙️Sprache & Transkription/openai-tts-bak-2026-01-28t18-01-23-10-30

speech-recognition

Allgemeine Spracherkennung. Unterstützt verschiedene Audioformate (ogg/mp3/wav/m4a) und nutzt die SenseVoice API für die Umwandlung von Sprache in Text. Wird ausgelöst, wenn der Benutzer eine Sprachnachricht, einen Audiofile sendet oder eine Audio-Transkription benötigt.

freshbooks-cli

FreshBooks-CLI zur Verwaltung von Rechnungen, Kunden und Abrechnung.

Text To Speech

Text zu Sprache: Konvertieren Sie Text in natürliche Sprache mit DIA TTS, Kokoro, Chatterbox und mehr über inference.sh CLI. Modelle: DIA TTS (konversational), Kokoro TTS, Chatterbox, Hig...

AssemblyAI Transcriber

AssemblyAI Transcriber: Audio-Dateien mit Sprecherdiarisation (wer spricht wann) transkribieren. Unterstützt über 100 Sprachen, automatische Spracherkennung und Zeitstempel. Für Besprechungen, Interviews, Podcasts oder Sprachnachrichten verwenden. Erfordert AssemblyAI API-Schlüssel.

🎙️Sprache & Transkription/assemblyai-transcriber

Whisper Transcribe

Whisper Transcribe: Audio-Dateien in Text transkribieren using OpenAI Whisper. Unterstützt Speech-to-Text mit automatischer Spracherkennung, mehrere Ausgabeformate (txt, srt, vtt, ), Batch-Verarbeitung und Modellauswahl (von klein bis groß). Verwenden Sie diese Fähigkeit, um Audioaufzeichnungen, Podcasts, Sprachnachrichten, Vorträge, Sitzungen oder jegliche Audio-/Videodatei in Text zu transkribieren. Verarbeitet Formate wie mp3, wav, m4a, ogg, flac, webm, opus, aac.

eternal-haven-lore-pack

Ewiges Paradies-Chroniken-Wissenspack + mythisches Persona-Pack.

🎙️Sprache & Transkription/eternal-haven-lore-pack

agent-voice

Kommandozeilen-Blog-Plattform für AI-Agenten

akaunting

Interagiere mit Akaunting via REST API

auto-whisper-safe

RAM-sicherer Sprach-Transkriptionsdienst mit Auto-Teilung — läuft auf 16GB-Rechnern ohne Abstürze.

brw-de-ai-ify

Entfernt AI-generierten Jargon und stellt menschliche Stimme in Text wieder her.

dellight-cro-revenue-ops

DELLIGHT.AI, AI-Start-up in DIFC, Dubai

🎙️Sprache & Transkription/dellight-cro-revenue-ops

documents-ai

Veryfi API für Echtzeit-OCR und Datenextraktion

doubao-api-open-tts

Text-to-Speech-Dienst mit Doubao (Vulkan-Motor)

🎙️Sprache & Transkription/doubao-api-open-tts

duby

Text in Sprache umwandeln mit Duby.so API

eachlabs-voice-audio

TTS, STT, Stimmenkonvertierung mit ElevenLabs, Whisper, RVC

🎙️Sprache & Transkription/eachlabs-voice-audio

easyverein-api

Arbeiten mit der easyVerein v2.0 REST API.

elevenlabs-media

ElevenLabs Musikgenerierung.

feishu-minutes

Info, Statistiken, Protokoll und Medien von Feishu abrufen.

gettr-transcribe-summarize

Audio von GETTR-Beiträgen herunterladen.

🎙️Sprache & Transkription/gettr-transcribe-summarize

hebrew-nikud

Hebräische Nikud-Referenz für AI-Agenten.

her-voice

Verleihe deinem Agenten eine Stimme.

miranda-sag

ElevenLabs Text-to-Speech mit Mac-Stil-Sagen-UX.

norman-categorize-transactions

BANKGESCHÄFTE kategorisieren und Buchungseingaben überprüfen.

🎙️Sprache & Transkription/norman-categorize-transactions

norman-monthly-reconciliation

Monatliche Finanzabstimmung durchführen.

🎙️Sprache & Transkription/norman-monthly-reconciliation

ressemble

Text-to-Speech und Speech-to-Text mit Resemble AI API integrieren.

siliconflow-tts-gen

Text-to-Speech mit SiliconFlow API (CosyVoice2)

🎙️Sprache & Transkription/siliconflow-tts-gen