หน้าแรก/คำพูดและการถอดความ
🎙️

คำพูดและการถอดความ

(71)
🎖️เด่น
41,621

Mcporter

ใช้ mcporter CLI รายการแสดง、ตั้งค่า、ระบุสิทธิ์ และเรียกใช้เซิร์ฟเวอร์/เครื่องมือ MCP โดยตรง (HTTP หรือ stdio),รวมถึงเซิร์ฟเวอร์สดประกอบ、การแก้ไขค่าตั้ง และการสร้าง CLI/ประเภท

🎖️เด่น
31,978

OpenClaw YouTube Transcript

OpenClaw YouTube Transcript: บันทึกวิดีโอ YouTube ให้เป็นข้อความด้วยการดึงแบบคำบอกและแบบคำไว้ในหัวข้อจาก URL ของวิดีโอโดยใช้ yt-dlp โดยไม่มีการประมวลผลเสียง

🎖️เด่น
18,448

Sag

Sag: การแปลงข้อความเป็นเสียงด้วย ElevenLabs แบบ UX แบบ Mac

🎖️เด่น
15,590

YouTube Transcript

บันทึกเสียง YouTube: ดึงและสรุปบันทึกเสียงวิดีโอ YouTube ใช้เมื่อถูกขอสรุป บันทึกหรือดึงเนื้อหาจากวิดีโอ YouTube จาก IP ที่อาศัยตามที่เปิดเสรีเพื่อหลีกเลี่ยงการบล็อก IP ทางคลาวด์ของ YouTube

Local Whisper

Local Whisper: การบอกเล่าเสียงท้องถิ่นด้วย OpenAI Whisper ทำงานออฟไลน์เต็มรูปแบบหลังการดาวน์โหลดโมเดล การบันทึกเสียงคุณภาพสูงกับขนาดโมเดลหลายรุ่น

elevenlabs-voices

การสร้างเสียงที่มีคุณภาพสูงกับ 18 บุคลิกภาพ และ 32

faster-whisper

พูดเสียงบอกเป็นข้อความท้องถิ่นด้วย faster-whisper

elevenlabs-tts

ElevenLabs TTS - การสมการชื่อมั่นใน OpenClaw ที่ดีที่สุดของ ElevenLabs

Voice Transcribe

Voice Transcribe: บันทึกแสงเสียงไว้ในแบบเอกสารด้วยโมเดล gpt-4o-mini-transcribe ของ OpenAI ด้วยคำชี้แจงศัพท์และการแทนที่ข้อความ ต้องการ uv (https://docs.astral.sh/uv/).

jarvis-voice

ตัวละครเสียง AI ที่มีเสียงเหมือนโลหะ พร้อม TTS และการแสดงข้อความที่มีสไตล์ทางภาพ

kokoro-tts

สร้างเสียงพูดจากข้อความด้วยเครื่องยนต์ TTS Kokoro ท้องถิ่น

ElevenLabs Speech-to-Text

ElevenLabs Speech-to-Text: บันทึกแบบเสียงใช้ ElevenLabs Speech-to-Text (Scribe v2)

Mlx Whisper

Mlx Whisper: การพูดเป็นข้อความท้องถิ่นด้วย MLX Whisper (ปรับเสรีมาตรฐาน Apple Silicon, ไม่ต้องใช้ API key)

Transcribe audio files via OpenRouter using audio-capable models

บันทึกเสียงผ่าน OpenRouter ด้วยโมเดลที่มีความสามารถในการบันทึกเสียง: บันทึกเสียงผ่าน OpenRouter ด้วยโมเดลที่มีความสามารถในการบันทึกเสียง (Gemini, GPT-4o-audio, และอื่น ๆ)

Gemini STT

Gemini STT: บันทึกแสงเสียงแบบอัตโนมัติด้วย API Gemini ของ Google หรือ Vertex AI

Tts

Tts: แปลงข้อความเป็นเสียงด้วย Hume AI (หรือ OpenAI) API. ใช้เมื่อผู้ใช้ขอข้อความเสียง, การตอบกลับด้วยเสียง หรือ เพื่อได้ฟังบางอย่าง "of vive voix"

Local Whisper

Local Whisper: การพาโลแกลย์เสียงเป็นข้อความเสรีสำหรับ Telegram และ WhatsApp ด้วย MLX Whisper บน Apple Silicon ส่วนตัว ไม่มีค่า API

Transcribe

บันทึกเสียงเป็นข้อความด้วยการใช้ Whisper (Docker) ท้องถิ่น ใช้เมื่อได้รับข้อความเสียง ไฟล์เสียง (.mp3, .m4a, .ogg, .wav, .webm) หรือเมื่อขอบันทึกเสียง

assemblyai-transcribe

บันทึกเสียง/วิดีโอด้วย AssemblyAI

elevenlabs-agents

สร้าง จัดการ และประกาศ ElevenLabs

Local STT (Nvidia Parakeet + Whisper Support)

Local STT (Nvidia Parakeet + Whisper Support): การแปลคำพูดท้องถิ่นกับเบรนด์แบ็กเอนด์ที่สามารถเลือก - Parakeet (ความแน่นอนสูงสุด) หรือ Whisper (เร็วที่สุด หลายภาษา).

audio-gen

สร้างหนังสือเสียง,โปรแกรมรายการประชาสัมพันธ์หรือเนื้อหาเสียงเพื่อการศึกษา

critical-article-writer

ผู้เขียนบทความวิจารณ์: สร้างบทความร่างและสรุป

audio-reply

สร้างคำตอบเสียงด้วย TTS

it will help you to send voice messages to your AI Assistant and also can make it talk

จะช่วยคุณในการส่งข้อความเสียงไปยังอุปกรณ์ช่วยเหลือ AI ของคุณ และยังสามารถทำให้มันพูดด้วย: การแปลงข้อความเป็นเสียงและการแปลงเสียงเป็นข้อความด้วย AI ElevenLabs. ใช้เมื่อผู้ใช้ต้องการแปลงข้อความเป็นเสียง บันทึกข้อความเสียง หรือทำงานกับเสียงด้วยหลายภาษา. สนับสนุนเสียง AI คุณภาพสูงและการบันทึกที่แน่นอน

elevenlabs-transcribe

บันทึกเสียงเป็นข้อความด้วย ElevenLabs

Parakeet Stt

Parakeet Stt: การแปลงความว่ายเสียงเป็นข้อความท้องถิ่นด้วย NVIDIA Parakeet TDT 0.6B v3 (ONNX บน CPU). 30 เท่าเร็วกว่า Whisper 25 ภาษา ตรวจจับอัตโนมัติ อุปกรณ์ API ที่สอดคล้องกับ OpenAI. ใช้เมื่อแปลงไฟล์เสียงเป็นข้อความ แปลงความว่ายเสียงเป็นข้อความ หรือประมวลผลบันทึกเสียงท้องถิ่นโดยไม่ใช้ API ในคลาวด์.

deepgram

เดียบกราม: — ส่วนติดต่อทางคำสั่งสำหรับ Deepgram การบวกแปลงเสียงเป็นข้อความ

announcer

ประกาศข้อความทั่วบ้านผ่านลำรับเสียง AirPlay ด้วย Airfoil +

Speech To Text

บันทึกเสียงเป็นข้อความด้วยโมเดล Whisper ผ่าน CLI inference.sh โมเดล: Fast Whisper Large V3, Whisper V3 Large ความสามารถ: บันทึกข้อความ แปลภาษา...

Voice

Voice: แปลงข้อความเป็นเสียงด้วยเครื่องกลภาษาของ Microsoft Edge โดยมีเสียงที่สามารถปรับแต่งได้ การเล่นเสียงโดยตรง และการทำการลบไฟล์ชั่วคราวอัตโนมัติ

addis-assistant-stt

เปิดใช้งาน Speech-to-Text (STT) และข้อความ

Pocket Tts

Pocket Tts: สร้างเสียงพูดอังกฤษคุณภาพสูงออฟไลน์บน CPU ด้วย 8 ความหวานในลักษณะต่าง ๆ หรือสร้างความหวานที่สามารถปรับแต่งเองด้วยแบบแบ่งย่อย Pocket TTS ของ Kyutai

inworld-tts

การแปลงข้อความเป็นเสียงผ่าน API ของ Inworld.ai

Voicenotes

Voicenotes: สัมพันธุ์และเข้าถึงบันทึกเสียงจาก Voicenotes.com ใช้เมื่อผู้ใช้ต้องการดาวน์โหลดบันทึกเสียงของตน บันทึกข้อความและสรุปของ AI จาก Voicenotes สนับสนุนการดาวน์โหลดบันทึก สัมพันธุ์เข้า markdown และค้นหาบันทึกข้อความ.

claw-voice

คุณได้เชื่อมต่อกับการประชุมผู้ใช้แบบสดผ่านเสียง

Transcribe Audio with Parakeet MLX

บันทึกเสียงด้วย Parakeet MLX: การบันทึกเสียงเป็นข้อความท้องถิ่นด้วย Parakeet MLX (ASR) สำหรับ Apple Silicon (ไม่ต้องใช้ API key).

clonev

คลอนเสียงและสร้างเสียงด้วย Coqui XTTS v2

cult-of-carcinization

วัฒนธรรมของการมีมะเร็ง: ให้ตัวแทนของคุณเสียงและหู

deepdub-tts

deepdub-tts: สร้างเสียงพูดและแอตเชิฟเป็น MEDIA

chichi-speech

บริการ RESTful สำหรับการแปลงข้อความเป็นเสียงด้วยคุณภาพสูงโดยใช้ Qwen3

lnbits

จัดการกระจายเงิน LNbits Lightning Wallet (ยอดเงิน, จ่าย, ใบแจ้งชำระ)

Voicenotes Official

Voicenotes Official: Skill ทางการจากทีม Voicenotes ที่ให้ OpenClaw สามารถเข้าถึง API ใหม่และมีความสามารถในการค้นหาทางนัย, ดึงข้อมูลบันทึกเต็ม, กรองตาม...

tl;dw - YouTube Video Summarizer

tl;dw - YouTube Video Summarizer: ดึงบันทึกของวิดีโอ YouTube และให้บันทึกสรุปที่ย่อยย่อ โดยเน้นที่จุดสำคัญ ข้อเสนอข้อต่อ และข้อสรุป โดยไม่ต้องดูวิดีโอทั้งหมด

Openai Tts.Bak 2026 01 28T18:01:23+10:30

Openai Tts.Bak 2026 01 28T18:01:23+10:30: การแปลงข้อความเป็นเสียงด้วย API การพูดเสียงของ OpenAI.

🎙️คำพูดและการถอดความ/openai-tts-bak-2026-01-28t18-01-23-10-30

speech-recognition

สัญญาณแบบรับรู้เสียงทั่วไป สนับสนุนรูปแบบแฟ้มเสียงหลายรูปแบบ (ogg/mp3/wav/m4a) ใช้ API SenseVoice API ที่มีฐานข้อมูลไซลิกอนเพื่อแปลงเสียงเป็นข้อความ จะทำงานเมื่อผู้ใช้ส่งข้อความเสียง แฟ้มเสียง หรือต้องการบันทึกเสียง

freshbooks-cli

FreshBooks CLI สำหรับจัดการใบแจ้งหนี้, ลูกค้า และการเรียกเก็บเงิน

Text To Speech

ข้อความเป็นเสียง: แปลงข้อความเป็นเสียงธรรมชาติด้วย DIA TTS, Kokoro, Chatterbox และอื่น โดยผ่าน inference.sh CLI รูปแบบ: DIA TTS (การสนทนา), Kokoro TTS, Chatterbox, Hig...

AssemblyAI Transcriber

AssemblyAI Transcriber: บันทึกแสงเสียงแบบแยกผู้พูด (ใครพูดเมื่อไหร่) สนับสนุนบันทึกแสงเสียงแบบฉบับ 100 ภาษา, ตรวจจับภาษาอัตโนมัติ และเวลาเวลา ใช้สำหรับการประชุม สัมภาษณ์ โปรแกรมรายการ หรือข้อความเสียง ต้องใช้ API key ของ AssemblyAI

Whisper Transcribe

Whisper Transcribe: บันทึกแบบภาษาของแบบแฟ้มเสียงเป็นข้อความด้วย OpenAI Whisper สนับสนุน speech-to-text การตรวจจับภาษาอัตโนมัติ รูปแบบออกอากาศหลายรูปแบบ (txt, srt, vtt, ) การประมวลผลแบบฉบับ และการเลือกโมเดล (จากเล็กถึงใหญ่) ใช้เมื่อบันทึกบันทึกเสียง โปรแกรมรายการ ข้อความเสียง การบรรยาย การประชุม หรือแบบภาษา/วิดีโอเสียงเป็นข้อความ จัดการกับรูปแบบ mp3, wav, m4a, ogg, flac, webm, opus, aac

eternal-haven-lore-pack

โซมแห่งความไม่มีสิ้นสุด ความรู้เรื่องราว + แพ็คตัวละครเทพประวัติ

agent-voice

แพลตฟอร์มบล็อกที่ใช้งานด้วยบรรทัดคำสั่งสำหรับตัวแทน AI

akaunting

สื่อสารกับซอฟต์แวร์บัญชี Akaunting ที่เปิดแหล่งข้อมูลด้วย REST API

auto-whisper-safe

บันทึกเสียงแบบปลอดภัยด้วย RAM และการแบ่งชิ้นอัตโนมัติ — ทำงานบนเครื่อง 16GB โดยไม่มีการล่มตัว

brw-de-ai-ify

ลบคำแปลงเป็นภาษาของ AI และกลับไปเป็นเสียงมนุษย์เป็นข้อความ

dellight-cro-revenue-ops

dellight-cro-revenue-ops: DELLIGHT.AI เป็นบริษัท AI ใน DIFC, Dubai

documents-ai

documents-ai: API การสแกนตัวอักษรทันทีและการดึงข้อมูลด้วย Veryfi

doubao-api-open-tts

บริการ Text-to-Speech ด้วย Doubao (เครื่องยนต์ Volcano)

duby

แปลงข้อความเป็นเสียงด้วย API Duby.so

eachlabs-voice-audio

TTS, STT, การแปลงเสียงด้วย ElevenLabs, Whisper, RVC

easyverein-api

ทำงานกับ API easyVerein v2.0

elevenlabs-media

การสร้างเพลงด้วย ElevenLabs

feishu-minutes

ดึงข้อมูล สถิติ บันทึกการพูด และสื่อจาก Feishu

gettr-transcribe-summarize

ดาวน์โหลดเสียงจากโพสต์ GETTR

hebrew-nikud

คู่มือ Hebrew nikud (จุดเสียง) สำหรับตัวแทน AI

her-voice

ให้ตัวแทนของคุณเสียง

miranda-sag

text-to-speech ของ ElevenLabs ด้วย UX พูดแบบ Mac

norman-categorize-transactions

ตรวจสอบและจำแนกการโอนเงินที่ยังไม่ถูกจำแนก ตรวจสอบใบกำกับเงิน และยืนยันบันทึกการจัดเก็บบัญชี

norman-monthly-reconciliation

ปฏิบัติการตรวจสอบการปรับเปรองการเงินประจำเดือนทั้งหมด - ตรวจสอบการโอนเงินทั้งหมด ตรวจสอบใบกำกับเงิน และตรวจสอบหนี้ยังเหลือ

ressemble

การสัมผัสข้อความและการสัมผัสเสียง ด้วยการใช้ API Resemble AI

siliconflow-tts-gen

siliconflow-tts-gen: การแปลงข้อความเป็นเสียงด้วย API SiliconFlow (CosyVoice2)