होम/वाणी और प्रतिलेखन
🎙️

वाणी और प्रतिलेखन

(71)
🎖️विशेष
41,621

Mcporter

मैकपोर्टर: mcporter CLI का उपयोग करके MCP सर्वरों/टूलों को सीधे सूचीबद्ध, कॉन्फ़िगर, प्रमाणीकरण और कॉल करें (HTTP या stdio), जिसमें अनुषंगी सर्वर, कॉन्फ़िगरेशन संपादन और CLI/टाइप जनरेशन शामिल हैं।

🎖️विशेष
31,978

OpenClaw YouTube Transcript

ओपनक्लॉ यूट्यूब ट्रांसक्रिप्ट: यूट्यूब वीडियो को पाठ में रूपांतरित करें, जिसमें वीडियो यूरल से सीधे शीर्षक और अनुवाद निकाले जाते हैं (yt-dlp के जरिए) और आडियो प्रोसेसिंग के बिना।

🎖️विशेष
18,448

Sag

साग: एलेवेनलैब्स टेक्स्ट-टू-स्पीच के साथ मैक-स्टाइल सेअ यूएक्स।

🎖️विशेष
15,590

YouTube Transcript

YouTube ट्रांसक्रिप्ट: YouTube वीडियो ट्रांसक्रिप्ट को प्राप्त करें और समीक्षा करें। जब किसी को समीक्षा करने, ट्रांसक्रिप्ट करने या YouTube वीडियो से सामग्री निकालने के लिए पूछा जाए तो उपयोग करें। निवासी IP प्रॉक्सी के माध्यम से ट्रांसक्रिप्ट प्राप्त करने के लिए YouTube के ग्राउंड IP ब्लॉक को चूर्हा करता है।

Local Whisper

स्थानीय व्हिस्पर: ओपनएआई व्हिस्पर के इस्तेमाल से स्थानीय स्पीच-टू-टेक्स्टिंग. मॉडल डाउनलोड के बाद पूरी तरह से ऑफलाइन चलता है. कई मॉडल आकारों के साथ उच्च गुणवत्ता वाला ट्रांसक्रिप्शन.

elevenlabs-voices

elevenlabs-voices: 18 पर्सोना, 32 के साथ हाई-क्वालिटी वॉयस सिंथेसिस.

faster-whisper

फास्टर-व्हिस्पर: फास्टर-व्हिस्पर के जरिए स्थानीय स्पीच-टू-टेक्स्ट.

elevenlabs-tts

elevenlabs-tts: इलेवेनलैब्स TTS - ओपेनक्लॉ के लिए सबसे अच्छा इलेवेनलैब्स इंटीग्रेशन.

Voice Transcribe

वॉइस ट्रांसक्राइब: ओपनएआई के gpt-4o-mini-transcribe मॉडल के उपयोग से ऑडियो फ़ाइलों को ट्रांसक्राइब करें, जिसमें शब्दकोश सुझाव और टेक्स्ट प्रतिस्थापन हैं। uv (https://docs.astral.sh/uv/) की आवश्यकता है।

jarvis-voice

जार्विस-वॉयस: टीईएस और विजुअल ट्रांसक्रिप्ट स्टाइलिंग वाला धात्विक एआई वॉयस पर्सोना.

kokoro-tts

कोकोरो-टीटीएस: स्थानीय कोकोरो टीटीएस इंजिन का उपयोग करके पाठ से वाणी ऑडियो जन्यता.

ElevenLabs Speech-to-Text

एलवेनलैब्स स्पीच-टू-टेक्स्ट: एलवेनलैब्स स्पीच-टू-टेक्स्ट (Scribe v2) का उपयोग करके ऑडियो फ़ाइलों को ट्रांसक्राइब करें.

Mlx Whisper

Mlx Whisper: स्थानीय स्पीच-टू-टेक्स्ट साथ Mlx Whisper (Apple Silicon संगत, कोई API की नहीं चाहिए).

Transcribe audio files via OpenRouter using audio-capable models

ऑपनरूटर के माध्यम से ऑडियो फ़ाइलों को ट्रांसक्राइब करें: ऑडियो-सक्षम मॉडलों (जेमिनी, GPT-4o-audio, आदि) का उपयोग करके ऑडियो फ़ाइलों को ट्रांसक्राइब करें.

Gemini STT

जेमिनी सीटीटी: गूगल के जेमिनी एपीआई या वर्टिक्स एआई का उपयोग करके ऑडियो फ़ाइलों को ट्रांसक्राइब करें

Tts

Tts: __PROTECTED_X__ के उपयोग से पाठ को वाक्यांश में बदलें (या __PROTECTED_X__ API)। जब उपयोगकर्ता एक आवाजीय संदेश, वॉइस रिप्लाई चाहता है या 'ऑफ विव वोइज' कुछ सुनना चाहता है तो इसका उपयोग करें।

Local Whisper

स्थानीय श्वेतर: __PROTECTED_X__ और WhatsApp के लिए मुफ्त स्थानीय वाक-से-पाठ टेक्नोलॉजी उपयोग करते हुए. निजी, कोई API दर नहीं।

Transcribe

ऑडियो फ़ाइलों को पाठ में ट्रांसक्राइब करें: लोकल विशपर (डॉकर) का उपयोग करके ऑडियो फ़ाइलों को पाठ में ट्रांसक्राइब करें। जब वॉयस मैसेजेज, ऑडियो फ़ाइलें (.mp3, .m4a, .ogg, .wav, .webm) प्राप्त करते हैं, या जब आदेश मिलता है कि ऑडियो सामग्री को ट्रांसक्राइब करें तो इसका उपयोग करें.

assemblyai-transcribe

एसेम्बलीएआई का उपयोग करके ऑडियो/वीडियो का ट्रांसक्राइब लिएं

elevenlabs-agents

elevenlabs-agents: इलेवेनलैब्स को बनाएं, प्रबंधित करें और लॉन्च करें.

Local STT (Nvidia Parakeet + Whisper Support)

स्थानीय STT (Nvidia Parakeet + Whisper Support): चुनने योग्य बैकेंड के साथ स्थानीय STT - Parakeet (बे���तरीन निर्धारण) या Whisper (सबसे तेज, बहुभाषिक).

audio-gen

ऑडियोबुक, पॉडकास्ट या शैक्षिक ऑडियो सामग्री जन्य उत्पन्न करें

critical-article-writer

ड्राफ्ट लेख और सूची बनाएं।

audio-reply

TTS का उपयोग करके ऑडियो प्रतिक्रिया जन्य उत्पन्न करें

it will help you to send voice messages to your AI Assistant and also can make it talk

यह आपको आईआई असिस्टेंट को वॉयस मेसेजेज़ भेजने में मदद करेगा और इसे बोलने की भी क्षमता देगा: टेक्स्ट-टू-स्पीच और स्पीच-टू-टेक्स्ट इलेवेनलैब्स एआई के इस्तेमाल करके। जब उपयोगकर्ता टेक्स्ट को स्पीच में बदलना चाहता है, वॉयस मेसेजेज़ को ट्रांसक्राइब करना चाहता है या बहुभाषाओं में वॉयस से काम करना चाहता है, तब इस्तेमाल करें। यह उच्च गुणवत्ता वाली एआई वॉयसेज़ और सटीक ट्रांसक्रिप्शन समर्थित करता है।

elevenlabs-transcribe

elevenlabs-transcribe: इलेवेनलैब्स के उपयोग से ऑडियो को टेक्स्ट में बदलें.

Parakeet Stt

पाराकीट सटी: स्थानीय स्पीच-टू-टेक्स्ट NVIDIA पाराकीट TDT 0.6B v3 (ONNX on CPU) के साथ. विश्वरूप की 30 गुना तेजी से, 25 भाषाएँ, स्वचालित पहचान, OpenAI-समर्थ एपीआई. ऑडियो फ़ाइलों को ट्रांसक्राइबिंग करने, वाणी को टेक्स्ट में बदलने या वाणी रिकॉर्डिंग को स्थानीय रूप से संसाधित करने के लिए इसका उपयोग करें क्योंकि क्लाउड एपीआई के बिना।

deepgram

डीपग्रैम के लिए कमांड लाइन इंटरफेस।

announcer

घर भर में एयरप्ले स्पीकर्स के माध्यम से एयरफोइल + का उपयोग करके पाठ का घोषणा करें

Speech To Text

वाक्य से लिखाई: इन्फरेंस.sh CLI के माध्यम से Whisper मॉडलों के द्वारा ऑडियो को पाठ में लिखें. मॉडल: Fast Whisper Large V3, Whisper V3 Large. क्षमताएं: लिखाई, अनुवाद,...

Voice

वॉयस: माइक्रोसॉफ्ट एज के TTS इंजिन का उपयोग करके टेक्स्ट को वॉयस में बदलें, अनुकूलनी वॉयस, सीधा प्लेबैक और ऑटोमेटिक अस्थायी फ़ाइल सफाई.

addis-assistant-stt

वोयस-टू-टेक्स्ट (STT) और टेक्स्ट प्रदान करता है

Pocket Tts

पॉकेट Tts: 8 अंतर्निहित आवाजों या क्युटाई के पॉकेट TTS मॉडल के साथ कस्टम वायस क्लोनिंग के जरिए सीपीयू पर ऑफ़लाइन उच्च गुणवत्ता वाली अंग्रेजी वाणी उत्पन्न करें.

inworld-tts

इनवर्ल्ड-टीटीएस: Inworld.ai API के जरिए टेक्स्ट-टू-स्पीच.

Voicenotes

वायसनोट्स: Voicenotes.com से वायस नोट्स सिंक और अद्यतन करें. जब उपयोगकर्ता अपने वायस रिकॉर्डिंग, ट्रांसक्रिप्ट और एआई समरीक्षण को वायसनोट्स से प्राप्त करना चाहता है, तब इसका उपयोग करें. नोट्स फेच करने, मार्कडाउन से सिंक करने और ट्रांसक्रिप्ट को खोजने का समर्थन करता है.

claw-voice

वायस के माध्यम से लाइव उपयोगकर्ता सत्र से कनेक्ट करें

Transcribe Audio with Parakeet MLX

पाराकीट MLX के साथ ऑडियो का ट्रांसक्राइब लिया जाता है: पाराकीट MLX (ASR) के साथ स्थानीय वाक-टू-टेक्स्ट (एसएसआर) एप्पल सिलिकन (एपीआई की चाबी नहीं है).

clonev

कोकी एक्सटीटीएस वी 2 का उपयोग करके किसी भी वोईस का क्लोन करें और वक्तव्य उत्पन्न करें।

cult-of-carcinization

अपने एजेंट को वोईस और कान दें।

deepdub-tts

डीप्डब और इसे मीडिया के रूप में जोड़कर वक्तव्य ऑडियो उत्पन्न करें।

chichi-speech

Qwen3 का उपयोग करके हाई-क्वालिटी टेक्स्ट-टू-स्पीच सेवा

lnbits

लेनबिट्स: एलएनबिट्स लाइटनिंग वॉलेट (बैलेंस, पेय, इनवायस) प्रबंधन.

Voicenotes Official

वॉयसनोट्स आधिकारिक: वॉयसनोट्स टीम की यह आधिकारिक कौशल OpenClaw को नए APIs तक पहुंच देता है और शब्दावलीय खोज करने, पूरे ट्रांसक्रिप्ट को प्राप्त करने, फ़िल्टर करने... की क्षमता देता है.

tl;dw - YouTube Video Summarizer

tl;dw - YouTube वीडियो समरीज़र: YouTube वीडियो के प्रतिलेख को निकालता है और पूरा वीडियो देखे बिना मुख्य बिंदुओं, तर्कों और निष्कर्षों को उभारता है।

Openai Tts.Bak 2026 01 28T18:01:23+10:30

OpenAI ऑडियो स्पीच एपीआई के माध्यम से टेक्स्ट-टू-स्पीच

🎙️वाणी और प्रतिलेखन/openai-tts-bak-2026-01-28t18-01-23-10-30

speech-recognition

स्पीच-रिकग्नीशन: सामान्य वाणी पहचान कौशल। अनेक आडियो फॉर्मेट (ogg/mp3/wav/m4a) का समर्थन करता है, वाणी से लेख में बदलने के लिए सीलिकॉन आधारित फ्लॉटिंग SenseVoice API का उपयोग करता है। जब उपयोगकर्ता वाणी संदेश, आडियो फ़ाइल भेजता है या आडियो को ट्रांसक्रिप्ट करने की जरूरत है तो यह स्किल ट्रिगर होता है।

freshbooks-cli

फ्रेशबुक्स-क्लाय: फ्रेशबुक्स के लिए इनवायर्स, ग्राहकों और बिलिंग का प्रबंधन करने के लिए फ्रेशबुक्स क्लाय.

Text To Speech

पाठ से वाकशास्त्र: DIA TTS, Kokoro, Chatterbox और अधिक के साथ प्राकृतिक वाकशास्त्र में पाठ बदलें, inference.sh CLI के माध्यम से.

AssemblyAI Transcriber

एसेम्बलीएआई ट्रांसक्राइबर: ऑडियो फ़ाइलों को स्पीकर डायरेशन (किस वक्ता कब बोलता है) के साथ ट्रांसक्राइब करें। 100 से अधिक भाषाओं, स्वचालित भाषा पहचान और टाइमस्टैम्प्स समर्थित। बैठकों, साक्षात्कारों, पॉडकास्ट या वॉइस मेसेजेज के लिए उपयोग करें। एसेम्बलीएआई API की आवश्यकता है।

Whisper Transcribe

विश्वप्रचार ट्रांसक्राइब: ओपनएआई विश्वप्रचार का उपयोग करके ऑडियो फ़ाइलों को पाठ में ट्रांसक्राइब करें। वक्ता से पाठ (ऑटो भाषा पहचान), कई आउटपुट फ़ॉर्मेट (txt, srt, vtt, ), बैच प्रोसेसिंग, और मॉडल चयन (टाइनी से लेकर बड़े तक) समर्थित है। ऑडियो रिकॉर्डिंग, पॉडकास्ट, वॉयस मेसे��, व्याख्यान, बैठक, या किसी ऑडियो/वीडियो फ़ाइल को पाठ में ट्रांसक्राइब करने के लिए उपयोग करें। mp3, wav, m4a, ogg, flac, webm, opus, aac फ़ॉर्मेटों को संभालता है।

eternal-haven-lore-pack

विवादी आश्रय-कालमोशन-पैक: विवादी आश्रय क्रोनिकल्स कालमोशन + मायथिक पर्सोना पैक.

agent-voice

एआई एजेंट्स के लिए कमांड-�ाइन ब्लॉगिंग प्लेटफॉर्म

akaunting

आरएसटी एपीआई के माध्यम से एका०ंटिंग ओपन-सोर्स लेखांकन सॉफ्टवेयर से संपर्क करें

auto-whisper-safe

ऑटो-चंकिंग के साथ RAM-सुरक्षित वोयस ट्रांसक्राइब — 16GB मशीनों पर बिना क्रैश के काम करता है

brw-de-ai-ify

एआई-जर्नल को हटाएं और मानव वोयस को पाठ में वापस लाएं

dellight-cro-revenue-ops

डेल्लाइग्ट.एआई दुबई के डीएफसी में एक एआई स्टार्टअप है।

documents-ai

वेरीफ़ि द्वारा वास्तविक समय ओसीआर और डाटा निकासी एपीआई।

doubao-api-open-tts

डौबाओ (वोल्केनो इंजिन) का उपयोग करके टेक्स्ट-टू-स्पीच सेवा।

duby

डबी: डबी.so API के उपयोग से टेक्स्ट को वॉयस बदलें.

eachlabs-voice-audio

eachlabs-voice-audio: TTS, STT, वॉयस कनवर्शन इलेवेनलैब्स, विस्पियर, RVC के उपयोग से.

easyverein-api

easyverein-api: easyVerein v2.0 REST API के साथ काम करें.

elevenlabs-media

elevenlabs-media: इलेवेनलैब्स संगीत उत्पादन.

feishu-minutes

फीशू-मिनिट्स: फीशू से जानकारी, आकड़े, ट्रांसक्रिप्ट और मीडिया प्राप्त करें.

gettr-transcribe-summarize

गेट्ट्र-ट्रांसक्रिब्स-समरीज़: GETTR पोस्ट से ऑडियो डाउनलोड करें.

hebrew-nikud

हिब्रू-निकुद: एआई एजेंट्स के लिए हिब्रू निकुद (व्यंजन बिन्दु) संदर्भ.

her-voice

हर-वॉयस: अपने एजेंट को आवाज दें.

miranda-sag

मिरांडा-सैग: मैक-स्टाइल साइ क्यूएक्स वाला एलवेनलैब्स टेक्स्ट-टू-स्पीच.

norman-categorize-transactions

नॉरमन-कैटेगराइज-ट्रांजेक्शन्स: अकैटेगराइजड बैंक लेन-देन की समीक्षा करें, इनवायस के साथ मेल खाने और लेखापालन प्रविष्टियों की पुष्टि करें.

norman-monthly-reconciliation

नॉरमन-मासिक-रिकॉन्सिलिएशन: पूर्ण मासिक वित्तीय रिकॉन्सिलिएशन करें - सभी लेन-देन की समीक्षा करें, इनवायस के साथ मेल खाने, बाकी की जाँच करें.

ressemble

रेसेम्बल: रेसेम्बल एआई एचटीटीपी एपीआई का उपयोग करके टेक्स्ट-टू-स्पीच और स्पीच-टू-टेक्स्ट एकीकरण.

siliconflow-tts-gen

सिलिकॉनफ्लो-टीटीएस-जन: सिलिकॉनफ्लो एपीआई (कॉसीवॉयस2) का उपयोग करके टेक्स्ट-टू-स्पीच.