Trang chủ/Giọng nói và Phiên âm
🎙️

Giọng nói và Phiên âm

(46)
🎖️Nổi bật
29,391

OpenClaw YouTube Transcript

OpenClaw YouTube Transcript: Chép lại video YouTube thành văn bản bằng cách trích xuất chú thích và phụ đề trực tiếp từ URL video sử dụng yt-dlp mà không cần xử lý âm thanh.

🎙️Giọng nói và Phiên âm/openclaw-youtube-transcript
🎖️Nổi bật
28,587

Mcporter

Mcporter: Sử dụng CLI mcporter để liệt kê, cấu hình, xác thực và gọi các máy chủ/công cụ MCP trực tiếp (HTTP hoặc stdio), bao gồm máy chủ tạm thời, chỉnh sửa cấu hình và tạo CLI/thuộc tính.

Sag

Sag: Công cụ text-to-speech của ElevenLabs với giao diện nói theo phong cách macOS.

addis-assistant-stt

Cung cấp dịch vụ Nghe-nói (STT) và văn bản

agent-voice

Platform blogging lệnh cho các agente AI

akaunting

Thực hiện tương tác với phần mềm kế toán mã nguồn mở Akaunting qua API REST

announcer

Chuyển văn bản qua loa AirPlay trong nhà bằng Airfoil +

assemblyai-transcribe

Ghi lại âm thanh/video bằng AssemblyAI

audio-gen

Tạo sách nói, podcast hoặc nội dung âm thanh giáo dục

audio-reply

Tạo phản hồi âm thanh bằng TTS

auto-whisper-safe

Ghi âm giọng nói an toàn với RAM, tự động chia đoạn — hoạt động trên máy 16GB mà không bị lỗi

brw-de-ai-ify

Loại bỏ từ vựng AI và khôi phục giọng nói con người thành văn bản

chichi-speech

Dịch vụ RESTful cho chất lượng giọng nói từ văn bản cao bằng Qwen3

claw-voice

Bạn đã kết nối với phiên làm việc người dùng trực tiếp qua giọng nói

clonev

Sao chép bất kỳ giọng nói nào và tạo lời nói bằng cách sử dụng Coqui XTTS v2.

critical-article-writer

Tạo bản nháp bài viết và tóm tắt.

🎙️Giọng nói và Phiên âm/critical-article-writer

cult-of-carcinization

Cung cấp giọng nói và tai cho người đại diện của bạn.

deepdub-tts

Tạo âm thanh lời nói bằng Deepdub và đính kèm như là MEDIA.

deepgram

Giao diện dòng lệnh cho Deepgram từ lời nói thành văn bản.

dellight-cro-revenue-ops

DELLIGHT.AI là một startup AI tại DIFC, Dubai.

🎙️Giọng nói và Phiên âm/dellight-cro-revenue-ops

documents-ai

API OCR và trích xuất dữ liệu thời gian thực bởi Veryfi.

doubao-api-open-tts

Dịch vụ Text-to-Speech sử dụng Doubao (Máy móc núi lửa).

duby

Chuyển đổi văn bản thành giọng nói sử dụng API Duby.so.

eachlabs-voice-audio

TTS, STT, chuyển đổi giọng nói sử dụng ElevenLabs, Whisper, RVC.

easyverein-api

Làm việc với API REST v2.0 của easyVerein.

elevenlabs-agents

Tạo, quản lý và triển khai ElevenLabs.

elevenlabs-media

Tạo nhạc sử dụng ElevenLabs.

elevenlabs-transcribe

Chuyển đổi âm thanh thành văn bản sử dụng ElevenLabs.

elevenlabs-tts

TTS của ElevenLabs - bộ tích hợp tốt nhất của ElevenLabs cho OpenClaw.

elevenlabs-voices

Tạo giọng nói chất lượng cao với 18 nhân vật, 32.

eternal-haven-lore-pack

Bộ tri thức huyền thoại của Eternal Haven + gói nhân vật huyền thoại

🎙️Giọng nói và Phiên âm/eternal-haven-lore-pack

faster-whisper

Ngôn ngữ nói địa phương sử dụng faster-whisper

feishu-minutes

Lấy thông tin, thống kê, bản ghi và phương tiện truyền thông từ Feishu

freshbooks-cli

CLI FreshBooks để quản lý hóa đơn, khách hàng và thanh toán

gettr-transcribe-summarize

Tải xuống âm thanh từ bài đăng GETTR

🎙️Giọng nói và Phiên âm/gettr-transcribe-summarize

hebrew-nikud

Tham khảo nikud (điểm nguyên âm) Hebrew cho các đại lý AI

her-voice

Cung cấp giọng nói cho đại lý của bạn

inworld-tts

Text-to-speech thông qua API Inworld.ai

jarvis-voice

Người mẫu giọng AI kim loại với TTS và phong cách bản dịch hình ảnh.

kokoro-tts

Tạo âm thanh nói từ văn bản sử dụng động cơ TTS địa phương Kokoro.

lnbits

Quản lý ví Lightning LNbits (Số dư, Thanh toán, Hóa đơn).

miranda-sag

Text-to-Speech của ElevenLabs với UX nói theo phong cách Mac.

norman-categorize-transactions

Kiểm tra và phân loại các giao dịch ngân hàng chưa được phân loại, khớp chúng với hóa đơn và xác minh các ghi chép kế toán.

🎙️Giọng nói và Phiên âm/norman-categorize-transactions

norman-monthly-reconciliation

Thực hiện việc đối chiếu tài chính hàng tháng hoàn chỉnh - kiểm tra tất cả các giao dịch, khớp hóa đơn, kiểm tra số dư.

🎙️Giọng nói và Phiên âm/norman-monthly-reconciliation

ressemble

Tích hợp Text-to-Speech và Speech-to-Text sử dụng API HTTP của Resemble AI.

siliconflow-tts-gen

Text-to-Speech sử dụng API SiliconFlow (CosyVoice2).