ホーム/音声と文字起こし
🎙️

音声と文字起こし

(71)
🎖️注目
41,621

Mcporter

Mcporter: mcporter CLIを使用して、MCPサーバー/ツールをリストアップ、設定、認証、コール(HTTPまたはstdio)、アドホックサーバー、設定編集、CLI/タイプ生成

🎖️注目
31,978

OpenClaw YouTube Transcript

OpenClaw YouTube Transcript: yt-dlpを使用して、ビデオURLからキャプションと字幕を直接抽出してYouTubeビデオをテキストに変換

🎙️音声と文字起こし/openclaw-youtube-transcript
🎖️注目
18,448

Sag

ElevenLabsテキストトースプーチとmacスタイルのUX。

🎖️注目
15,590

YouTube Transcript

YouTube字幕: YouTubeビデオの字幕を取得し要約します。字幕の要約、書き起こし、またはYouTubeビデオからのコンテンツの抽出が必要な場合に使用します。YouTubeのクラウドIPブロックを迂回するために住宅IPプロキシを通じて字幕の取得を処理します。

Local Whisper

ローカルウィスパー:OpenAI Whisperを使用したローカルスピーチトテキスト。モデルのダウンロード後、完全にオフラインで動作します。複数のモデルサイズでの高品質なトランスクリプション。

elevenlabs-voices

18のパーソナで高品質な音声合成、32

faster-whisper

faster-whisperを使用したローカルスピーチからテキスト変換

elevenlabs-tts

ElevenLabs TTS - OpenClaw用の最高のElevenLabs統合

Voice Transcribe

Voice Transcribe: オープンAIのgpt-4o-mini-transcribeモデルを使用して、語彙ヒントとテキスト置換を使用してオーディオファイルをトランスクリプト。uv(https://docs.astral.sh/uv/)が必要です。

jarvis-voice

TTSと視覚的なトランスクリプトスタイルの金属的なAIボイス

kokoro-tts

ローカルのKokoro TTSエンジンを使用してテキストから音声生成

ElevenLabs Speech-to-Text

ElevenLabs Speech-to-Text: ElevenLabs Speech-to-Text(Scribe v2)を使用してオーディオファイルをトランスクライプします。

Mlx Whisper

Mlx Whisper: MLX Whisperを使用したローカルスピーチトキスト(Apple Silicon最適化、APIキー不要)

Transcribe audio files via OpenRouter using audio-capable models

オープンルーターを使用してオーディオ機能を持つモデル(ジェミニ、GPT-4o-audioなど)を通じてオーディオファイルを変換します。

🎙️音声と文字起こし/openrouter-transcribe

Gemini STT

Gemini STT: GoogleのGemini APIまたはVertex AIを使用してオーディオファイルをトランスクリプトします。

Tts

Tts: Hume AI(またはOpenAI)APIを使用してテキストを音声に変換します。ユーザーが音声メッセージ、音声応答を求める際や、'vive voix'で何かを聞きたい場合に使用。

Local Whisper

ローカルウィスパー:Apple Silicon上のMLX Whisperを使用して、TelegramとWhatsAppのために無料のローカルスピーチトテキストを提供します。プライベートで、APIコストはかかりません。

Transcribe

Transcribe: ローカルの Whisper (Docker) を使用してオーディオファイルをテキストに変換します。音声メッセージを受け取る際、オーディオファイル(.mp3、.m4a、.ogg、.wav、.webm)がある場合、またはオーディオコンテンツを変換するように依頼された場合に使用します。

assemblyai-transcribe

AssemblyAIで音/動画を変換

🎙️音声と文字起こし/assemblyai-transcribe

elevenlabs-agents

ElevenLabsの作成・管理・展開

Local STT (Nvidia Parakeet + Whisper Support)

Local STT(Nvidia Parakeet + Whisper Support):選択可能なバックエンドを備えたローカルSTT - Parakeet(最も高い精度)またはWhisper(最も速く、多言語)。

audio-gen

オーディオブックやPodcast生成

critical-article-writer

草案記事、概要生成

🎙️音声と文字起こし/critical-article-writer

audio-reply

TTSを使った音声応答生成

it will help you to send voice messages to your AI Assistant and also can make it talk

AIアシスタントに音声メッセージを送信するのに役立ち、また話すこともできます:ElevenLabs AIを使用したテキストトースピーチとスピーチトテキスト。テキストを音声に変換する、音声メッセージを書き起こす、または複数の言語で音声を扱う際に使用します。高品質のAIボイスと正確な書き起こしをサポートします。

elevenlabs-transcribe

音声をテキストに変換

🎙️音声と文字起こし/elevenlabs-transcribe

Parakeet Stt

Parakeet Stt:NVIDIA Parakeet TDT 0.6B v3(CPU上のONNX)を使用したローカルスピーチからテキスト変換。Whisperよりも30倍速く、25言語、自動検出、OpenAI互換API。オーディオファイルのトランスクライピング、スピーチをテキストに変換、クラウドAPIなしでローカルで音声記録を処理する場合に使用します。

deepgram

Deepgramのコマンドラインインターフェース

announcer

AirPlayスピーカーでAirfoil+を使って家全体にテキストを発表

Speech To Text

Speech To Text: inference.sh CLIを通じてWhisperモデルを使用してオーディオをテキストに変換します。モデル: Fast Whisper Large V3、Whisper V3 Large。機能:変換、翻訳...

Voice

Voice: Microsoft EdgeのTTSエンジンを使用してテキストを音声に変換。カスタマイズ可能なボイス、直接再生、自動一時ファイルクリーンアップ。

addis-assistant-stt

音声認識と���キスト提供

Pocket Tts

Pocket Tts: KyutaiのPocket TTSモデルを使用して、CPU上でオフラインで高品質な英語スピーチを生成します。8つの内蔵ボイスまたはカスタムボイスクローニングを使用できます。

inworld-tts

Inworld.ai APIを通じてのテキスト読み上げ

Voicenotes

Voicenotes: Voicenotes.comからの音声メモを同期およびアクセス。ユーザーが音声録音、トランスクリプト、AI要約をVoicenotesから取得したい場合に使用。ノートの取得、マークダウンへの同期、トランスクリプトの検索をサポート。

claw-voice

生ユーザーセッションと音声接続

Transcribe Audio with Parakeet MLX

Parakeet MLXでオーディオをトランスクリプト: Apple Silicon用のParakeet MLX(ASR)でローカルの音声対テキストを実行(APIキー不要)。

clonev

Coqui XTTS v2で音声をクローンし、話す

cult-of-carcinization

エージェントに声と耳を与える

🎙️音声と文字起こし/cult-of-carcinization

deepdub-tts

Deepdubで音声生成し、MEDIAとして付属

chichi-speech

Qwen3を使用した高品質なテキスト読み上げのRESTfulサービス

lnbits

LNbitsレジ袋管理(残高、支払い、請求)

Voicenotes Official

Voicenotes Official:Voicenotesチームからの公式スキルで、OpenClawに新しいAPIへのアクセスと意味的検索、完全なトランスクリプトの取得、フィルタリング機能を提供します...

tl;dw - YouTube Video Summarizer

tl;dw - YouTube Video Summarizer: 全ての動画を視聴する前に、YouTube動画のトランスクラップトを抽出し、主なポイント、議論、結論を強調する簡潔な要約を提供します。

Openai Tts.Bak 2026 01 28T18:01:23+10:30

Openai Tts.Bak 2026 01 28T18:01:23+10:30: OpenAI Audio Speech APIを通じてテキストトースプト。

🎙️音声と文字起こし/openai-tts-bak-2026-01-28t18-01-23-10-30

speech-recognition

通用音声認識スキル。様々なオーディオフォーマット(ogg/mp3/wav/m4a)をサポートし、音声をテキストに変換するためにシリコンベースの動的 SenseVoice API を使用。ユーザーが音声メッセージ、オーディオファイルを送信したり、オーディオの転写が必要な場合にトリガーされます。

freshbooks-cli

請求、顧客、課金を管理するFreshBooks CLI

Text To Speech

テキストトースプ:inference.sh CLIを通じて DIA TTS、Kokoro、Chatterbox、などでテキストを自然なスピーチに変換します。モデル:DIA TTS(会話型)、Kokoro TTS、Chatterbox、Hig...

AssemblyAI Transcriber

AssemblyAI Transcriber: オーディオファイルをスピーカー分離(誰が話しているか)で変換します。100を超える言語をサポートし、自動言語検出とタイムスタンプを提供します。会議、インタビュー、ポッドキャスト、ボイスメッセージに使用してください。AssemblyAI APIキーが必要です。

🎙️音声と文字起こし/assemblyai-transcriber

Whisper Transcribe

Whisper Transcribe: OpenAI Whisperを使用してオーディオファイルをテキストに変換します。音声からテキストへの変換、自動言語検出、複数の出力形式(txt、srt、vtt、)、バッチ処理、モデル選択(小さいから大きいまで)をサポートします。オーディオ記録、ポッドキャスト、音声メッセージ、講義、会議、またはオーディオ/ビデオファイルをテキストに変換する場合に使用します。mp3、wav、m4a、ogg、flac、webm、opus、aac形式を処理します。

eternal-haven-lore-pack

永遠の楽園の伝説 + 神話パーソナパック

🎙️音声と文字起こし/eternal-haven-lore-pack

agent-voice

AIエージェント用のコマンドラインブログプラットフォーム

akaunting

REST APIでAkauntingオープンソース会計ソフトを使用

auto-whisper-safe

RAM安全なオートチャンク音声変換 - 16GBマシンでもクラッシュせず動作

brw-de-ai-ify

AI生成の専門用語を排除し、人間の声をテキストに戻す

dellight-cro-revenue-ops

DELLIGHT.AIはドバイDIFCのAIスタートアップです。

🎙️音声と文字起こし/dellight-cro-revenue-ops

documents-ai

VeryfiのリアルタイムOCRとデータ抽出API。

doubao-api-open-tts

ドバオ(火山エンジン)を使用するテキスト読み上げサービス。

duby

テキストを音声に変換(Duby.so API)

eachlabs-voice-audio

TTS、STT、音声変換(ElevenLabs、Whisper、RVC)

🎙️音声と文字起こし/eachlabs-voice-audio

easyverein-api

easyVerein v2.0 REST APIを使用

elevenlabs-media

ElevenLabs音楽生成

feishu-minutes

Feishuから情報、統計、トランスクリプト、メディアを取得

gettr-transcribe-summarize

GETTRの投稿から音声をダウンロード

🎙️音声と文字起こし/gettr-transcribe-summarize

hebrew-nikud

AIエージェントのためのヘブライ語 nikud 参考情報

her-voice

エージェントに声を与える

miranda-sag

macスタイルのテキスト読み上げUX搭載のElevenLabs

norman-categorize-transactions

未分類銀行取引のレビュー・分類、請求書と一致、簿記確認

🎙️音声と文字起こし/norman-categorize-transactions

norman-monthly-reconciliation

完全な月次財務調整を行います

🎙️音声と文字起こし/norman-monthly-reconciliation

ressemble

Resemble AI HTTP APIを使用したテキスト読み上げ・テキスト入力

siliconflow-tts-gen

SiliconFlow API(CosyVoice2)を使用したテキスト読み上げ