語音與轉錄
(71)Mcporter
Mcporter:使用mcporter CLI直接列出、配置、認證和調用MCP伺服器/工具(HTTP或stdio),包括臨時伺服器、配置編輯和CLI/類型生成。
/mcporterOpenClaw YouTube Transcript
OpenClaw YouTube 譯文:透過yt-dlp直接從視頻網址提取字幕和副標題,將YouTube視頻轉換為文字,無需音頻處理。
/openclaw-youtube-transcriptYouTube Transcript
YouTube 譯文:抓取並總結 YouTube 觀看紀錄。當被要求總結、抄寫或從 YouTube 觀看紀錄中提取內容時使用。通過住宅 IP 代理抓取譯文以跳過 YouTube 的雲 IP 阻塞。
/youtube-transcriptVoice Transcribe
使用 OpenAI 的 gpt-4o-mini-transcribe 模型,並提供詞彙提示和文字替換,將音頻檔案轉寫成文字。需要 uv(https://docs.astral.sh/uv/)。
/voice-transcribeTranscribe audio files via OpenRouter using audio-capable models
使用 OpenRouter 透過具音頻功能的模型(Gemini、GPT-4o-audio 等)轉錄音頻檔案:使用 OpenRouter 透過具音頻功能的模型(Gemini、GPT-4o-audio 等)轉錄音頻檔案。
/openrouter-transcribeLocal Whisper
本機低語:使用 Apple Silicon 上的 MLX Whisper 提供免費的 Telegram 和 WhatsApp 本地語音轉文字功能。隱私保護,無 API 費用。
/whisper-mlx-localTranscribe
將音頻檔案轉錄為文字,使用本地的Whisper (Docker)。在收到聲音訊息、音頻檔案 (.mp3, .m4a, .ogg, .wav, .webm) 或被要求轉錄音頻內容時使用。
/transcribeLocal STT (Nvidia Parakeet + Whisper Support)
本地語音識別(Nvidia Parakeet + Whisper 支援):可選擇後端之本地語音識別 - Parakeet(最佳準確度)或 Whisper(最快,多語言)。
/local-sttit will help you to send voice messages to your AI Assistant and also can make it talk
此功能可協助您向您的AI助手發送聲音訊息,並能讓它說話:使用ElevenLabs AI的文本轉語音和語音轉文本。當用戶想要將文字轉換為語音、錄製聲音訊息或以多種語言處理聲音時使用。支援高品質的AI聲音和精準的轉錄。
/elevenlabs-voiceParakeet Stt
Parakeet Stt:使用 NVIDIA Parakeet TDT 0.6B v3(ONNX 在 CPU 上)的本地語音轉文字。比 Whisper 快 30 倍,支援 25 種語言,自動偵測,與 OpenAI 兼容的 API。用於轉寫音頻檔案、將語音轉換為文字或本地處理聲音錄音,無需雲端 API。
/parakeet-sttSpeech To Text
語音轉文字:透過 inference.sh CLI 使用 Whisper 模型將音頻轉換為文字。模型:Fast Whisper Large V3、Whisper V3 Large。功能:文字轉寫、翻譯、...
/speech-to-textVoicenotes
同步並存取Voicenotes.com的聲音筆記。當用戶想要從Voicenotes中取回他們的聲音錄音、文字轉錄和AI摘要時使用。支援取回筆記、同步至markdown格式以及搜索文字轉錄。
/voicenotesTranscribe Audio with Parakeet MLX
使用Parakeet MLX轉錄音頻:本地語音轉文字,透過Parakeet MLX (ASR)為Apple Silicon設計(無需API金鑰)
/parakeet-mlxVoicenotes Official
Voicenotes官方:這個來自Voicenotes團隊的官方技能,為OpenClaw提供訪問新API的權限,並能進行意義搜索,獲取完整的轉錄,按條件過濾…
/voicenotes-officialtl;dw - YouTube Video Summarizer
tl;dw - YouTube影片摘要:從YouTube影片中提取字幕並提供精簡摘要,強調主要點、論點和結論,無需觀看完整影片。
/tldwOpenai Tts.Bak 2026 01 28T18:01:23+10:30
透過 OpenAI 音頻語音 API 進行文字轉語音
/openai-tts-bak-2026-01-28t18-01-23-10-30speech-recognition
通用語音識別 Skill。支援多種音頻格式(ogg/mp3/wav/m4a),使用矽基流動 SenseVoice API 進行語音轉文字。當用戶發送語音消息、音頻文件,或需要轉錄音頻時觸發。
/speech-recognitionText To Speech
文字轉語音:使用 DIA TTS、Kokoro、Chatterbox 等通過 inference.sh CLI 轉換文字為自然語音。模型:DIA TTS(對話式)、Kokoro TTS、Chatterbox、Hig...
/text-to-speechAssemblyAI Transcriber
AssemblyAI 記錄器:使用講者分類(誰在說話)進行音頻文件的轉寫。支援100多種語言,自動語言檢測和時間標記。用於會議、採訪、播客或聲音訊息。需要AssemblyAI API金鑰。
/assemblyai-transcriberWhisper Transcribe
Whisper 轉寫:使用 OpenAI Whisper 將音頻檔案轉換為文字。支援語音轉文字功能,自動語言偵測,多種輸出格式(txt, srt, vtt, ),批次處理,以及模型選擇(從微型到大型)。用於轉寫音頻錄音、播客、聲音訊息、演講、會議或任何音頻/視頻檔案至文字。處理 mp3、wav、m4a、ogg、flac、webm、opus、aac 格式。
/whisper-transcribenorman-monthly-reconciliation
進行完整的每月財務對賬 - 檢查所有交易,匹配發票,檢查未結清項目。
/norman-monthly-reconciliation