वाणी और प्रतिलेखन Skills | OpenClaw कौशल नेविगेटर

🎖️विशेष

41,621

Mcporter

मैकपोर्टर: mcporter CLI का उपयोग करके MCP सर्वरों/टूलों को सीधे सूचीबद्ध, कॉन्फ़िगर, प्रमाणीकरण और कॉल करें (HTTP या stdio), जिसमें अनुषंगी सर्वर, कॉन्फ़िगरेशन संपादन और CLI/टाइप जनरेशन शामिल हैं।

🎙️वाणी और प्रतिलेखन/mcporter

🎖️विशेष

31,978

OpenClaw YouTube Transcript

ओपनक्लॉ यूट्यूब ट्रांसक्रिप्ट: यूट्यूब वीडियो को पाठ में रूपांतरित करें, जिसमें वीडियो यूरल से सीधे शीर्षक और अनुवाद निकाले जाते हैं (yt-dlp के जरिए) और आडियो प्रोसेसिंग के बिना।

🎙️वाणी और प्रतिलेखन/openclaw-youtube-transcript

🎖️विशेष

18,448

Sag

साग: एलेवेनलैब्स टेक्स्ट-टू-स्पीच के साथ मैक-स्टाइल सेअ यूएक्स।

🎙️वाणी और प्रतिलेखन/sag

🎖️विशेष

15,590

YouTube Transcript

YouTube ट्रांसक्रिप्ट: YouTube वीडियो ट्रांसक्रिप्ट को प्राप्त करें और समीक्षा करें। जब किसी को समीक्षा करने, ट्रांसक्रिप्ट करने या YouTube वीडियो से सामग्री निकालने के लिए पूछा जाए तो उपयोग करें। निवासी IP प्रॉक्सी के माध्यम से ट्रांसक्रिप्ट प्राप्त करने के लिए YouTube के ग्राउंड IP ब्लॉक को चूर्हा करता है।

🎙️वाणी और प्रतिलेखन/youtube-transcript

Local Whisper

स्थानीय व्हिस्पर: ओपनएआई व्हिस्पर के इस्तेमाल से स्थानीय स्पीच-टू-टेक्स्टिंग. मॉडल डाउनलोड के बाद पूरी तरह से ऑफलाइन चलता है. कई मॉडल आकारों के साथ उच्च गुणवत्ता वाला ट्रांसक्रिप्शन.

🎙️वाणी और प्रतिलेखन/local-whisper

elevenlabs-voices

elevenlabs-voices: 18 पर्सोना, 32 के साथ हाई-क्वालिटी वॉयस सिंथेसिस.

🎙️वाणी और प्रतिलेखन/elevenlabs-voices

faster-whisper

फास्टर-व्हिस्पर: फास्टर-व्हिस्पर के जरिए स्थानीय स्पीच-टू-टेक्स्ट.

🎙️वाणी और प्रतिलेखन/faster-whisper

elevenlabs-tts

elevenlabs-tts: इलेवेनलैब्स TTS - ओपेनक्लॉ के लिए सबसे अच्छा इलेवेनलैब्स इंटीग्रेशन.

🎙️वाणी और प्रतिलेखन/elevenlabs-tts

Voice Transcribe

वॉइस ट्रांसक्राइब: ओपनएआई के gpt-4o-mini-transcribe मॉडल के उपयोग से ऑडियो फ़ाइलों को ट्रांसक्राइब करें, जिसमें शब्दकोश सुझाव और टेक्स्ट प्रतिस्थापन हैं। uv (https://docs.astral.sh/uv/) की आवश्यकता है।

🎙️वाणी और प्रतिलेखन/voice-transcribe

jarvis-voice

जार्विस-वॉयस: टीईएस और विजुअल ट्रांसक्रिप्ट स्टाइलिंग वाला धात्विक एआई वॉयस पर्सोना.

🎙️वाणी और प्रतिलेखन/jarvis-voice

kokoro-tts

कोकोरो-टीटीएस: स्थानीय कोकोरो टीटीएस इंजिन का उपयोग करके पाठ से वाणी ऑडियो जन्यता.

🎙️वाणी और प्रतिलेखन/kokoro-tts

ElevenLabs Speech-to-Text

एलवेनलैब्स स्पीच-टू-टेक्स्ट: एलवेनलैब्स स्पीच-टू-टेक्स्ट (Scribe v2) का उपयोग करके ऑडियो फ़ाइलों को ट्रांसक्राइब करें.

🎙️वाणी और प्रतिलेखन/elevenlabs-stt

Mlx Whisper

Mlx Whisper: स्थानीय स्पीच-टू-टेक्स्ट साथ Mlx Whisper (Apple Silicon संगत, कोई API की नहीं चाहिए).

🎙️वाणी और प्रतिलेखन/mlx-whisper

Transcribe audio files via OpenRouter using audio-capable models

ऑपनरूटर के माध्यम से ऑडियो फ़ाइलों को ट्रांसक्राइब करें: ऑडियो-सक्षम मॉडलों (जेमिनी, GPT-4o-audio, आदि) का उपयोग करके ऑडियो फ़ाइलों को ट्रांसक्राइब करें.

🎙️वाणी और प्रतिलेखन/openrouter-transcribe

Gemini STT

जेमिनी सीटीटी: गूगल के जेमिनी एपीआई या वर्टिक्स एआई का उपयोग करके ऑडियो फ़ाइलों को ट्रांसक्राइब करें

🎙️वाणी और प्रतिलेखन/gemini-stt

Tts

Tts: __PROTECTED_X__ के उपयोग से पाठ को वाक्यांश में बदलें (या __PROTECTED_X__ API)। जब उपयोगकर्ता एक आवाजीय संदेश, वॉइस रिप्लाई चाहता है या 'ऑफ विव वोइज' कुछ सुनना चाहता है तो इसका उपयोग करें।

🎙️वाणी और प्रतिलेखन/tts

Local Whisper

स्थानीय श्वेतर: __PROTECTED_X__ और WhatsApp के लिए मुफ्त स्थानीय वाक-से-पाठ टेक्नोलॉजी उपयोग करते हुए. निजी, कोई API दर नहीं।

🎙️वाणी और प्रतिलेखन/whisper-mlx-local

Transcribe

ऑडियो फ़ाइलों को पाठ में ट्रांसक्राइब करें: लोकल विशपर (डॉकर) का उपयोग करके ऑडियो फ़ाइलों को पाठ में ट्रांसक्राइब करें। जब वॉयस मैसेजेज, ऑडियो फ़ाइलें (.mp3, .m4a, .ogg, .wav, .webm) प्राप्त करते हैं, या जब आदेश मिलता है कि ऑडियो सामग्री को ट्रांसक्राइब करें तो इसका उपयोग करें.

🎙️वाणी और प्रतिलेखन/transcribe

assemblyai-transcribe

एसेम्बलीएआई का उपयोग करके ऑडियो/वीडियो का ट्रांसक्राइब लिएं

🎙️वाणी और प्रतिलेखन/assemblyai-transcribe

elevenlabs-agents

elevenlabs-agents: इलेवेनलैब्स को बनाएं, प्रबंधित करें और लॉन्च करें.

🎙️वाणी और प्रतिलेखन/elevenlabs-agents

Local STT (Nvidia Parakeet + Whisper Support)

स्थानीय STT (Nvidia Parakeet + Whisper Support): चुनने योग्य बैकेंड के साथ स्थानीय STT - Parakeet (बे��तरीन निर्धारण) या Whisper (सबसे तेज, बहुभाषिक).

🎙️वाणी और प्रतिलेखन/local-stt

audio-gen

ऑडियोबुक, पॉडकास्ट या शैक्षिक ऑडियो सामग्री जन्य उत्पन्न करें

🎙️वाणी और प्रतिलेखन/audio-gen

critical-article-writer

ड्राफ्ट लेख और सूची बनाएं।

🎙️वाणी और प्रतिलेखन/critical-article-writer

audio-reply

TTS का उपयोग करके ऑडियो प्रतिक्रिया जन्य उत्पन्न करें

🎙️वाणी और प्रतिलेखन/audio-reply-skill

it will help you to send voice messages to your AI Assistant and also can make it talk

यह आपको आईआई असिस्टेंट को वॉयस मेसेजेज़ भेजने में मदद करेगा और इसे बोलने की भी क्षमता देगा: टेक्स्ट-टू-स्पीच और स्पीच-टू-टेक्स्ट इलेवेनलैब्स एआई के इस्तेमाल करके। जब उपयोगकर्ता टेक्स्ट को स्पीच में बदलना चाहता है, वॉयस मेसेजेज़ को ट्रांसक्राइब करना चाहता है या बहुभाषाओं में वॉयस से काम करना चाहता है, तब इस्तेमाल करें। यह उच्च गुणवत्ता वाली एआई वॉयसेज़ और सटीक ट्रांसक्रिप्शन समर्थित करता है।

🎙️वाणी और प्रतिलेखन/elevenlabs-voice

elevenlabs-transcribe

elevenlabs-transcribe: इलेवेनलैब्स के उपयोग से ऑडियो को टेक्स्ट में बदलें.

🎙️वाणी और प्रतिलेखन/elevenlabs-transcribe

Parakeet Stt

पाराकीट सटी: स्थानीय स्पीच-टू-टेक्स्ट NVIDIA पाराकीट TDT 0.6B v3 (ONNX on CPU) के साथ. विश्वरूप की 30 गुना तेजी से, 25 भाषाएँ, स्वचालित पहचान, OpenAI-समर्थ एपीआई. ऑडियो फ़ाइलों को ट्रांसक्राइबिंग करने, वाणी को टेक्स्ट में बदलने या वाणी रिकॉर्डिंग को स्थानीय रूप से संसाधित करने के लिए इसका उपयोग करें क्योंकि क्लाउड एपीआई के बिना।

🎙️वाणी और प्रतिलेखन/parakeet-stt

deepgram

डीपग्रैम के लिए कमांड लाइन इंटरफेस।

🎙️वाणी और प्रतिलेखन/deepgram

announcer

घर भर में एयरप्ले स्पीकर्स के माध्यम से एयरफोइल + का उपयोग करके पाठ का घोषणा करें

🎙️वाणी और प्रतिलेखन/announcer

Speech To Text

वाक्य से लिखाई: इन्फरेंस.sh CLI के माध्यम से Whisper मॉडलों के द्वारा ऑडियो को पाठ में लिखें. मॉडल: Fast Whisper Large V3, Whisper V3 Large. क्षमताएं: लिखाई, अनुवाद,...

🎙️वाणी और प्रतिलेखन/speech-to-text

Voice

वॉयस: माइक्रोसॉफ्ट एज के TTS इंजिन का उपयोग करके टेक्स्ट को वॉयस में बदलें, अनुकूलनी वॉयस, सीधा प्लेबैक और ऑटोमेटिक अस्थायी फ़ाइल सफाई.

🎙️वाणी और प्रतिलेखन/voice

addis-assistant-stt

वोयस-टू-टेक्स्ट (STT) और टेक्स्ट प्रदान करता है

🎙️वाणी और प्रतिलेखन/addis-assistant-stt

Pocket Tts

पॉकेट Tts: 8 अंतर्निहित आवाजों या क्युटाई के पॉकेट TTS मॉडल के साथ कस्टम वायस क्लोनिंग के जरिए सीपीयू पर ऑफ़लाइन उच्च गुणवत्ता वाली अंग्रेजी वाणी उत्पन्न करें.

🎙️वाणी और प्रतिलेखन/pocket-tts

inworld-tts

इनवर्ल्ड-टीटीएस: Inworld.ai API के जरिए टेक्स्ट-टू-स्पीच.

🎙️वाणी और प्रतिलेखन/inworld-tts

Voicenotes

वायसनोट्स: Voicenotes.com से वायस नोट्स सिंक और अद्यतन करें. जब उपयोगकर्ता अपने वायस रिकॉर्डिंग, ट्रांसक्रिप्ट और एआई समरीक्षण को वायसनोट्स से प्राप्त करना चाहता है, तब इसका उपयोग करें. नोट्स फेच करने, मार्कडाउन से सिंक करने और ट्रांसक्रिप्ट को खोजने का समर्थन करता है.

🎙️वाणी और प्रतिलेखन/voicenotes

claw-voice

वायस के माध्यम से लाइव उपयोगकर्ता सत्र से कनेक्ट करें

🎙️वाणी और प्रतिलेखन/claw-voice

Transcribe Audio with Parakeet MLX

पाराकीट MLX के साथ ऑडियो का ट्रांसक्राइब लिया जाता है: पाराकीट MLX (ASR) के साथ स्थानीय वाक-टू-टेक्स्ट (एसएसआर) एप्पल सिलिकन (एपीआई की चाबी नहीं है).

🎙️वाणी और प्रतिलेखन/parakeet-mlx

clonev

कोकी एक्सटीटीएस वी 2 का उपयोग करके किसी भी वोईस का क्लोन करें और वक्तव्य उत्पन्न करें।

🎙️वाणी और प्रतिलेखन/clonev

cult-of-carcinization

अपने एजेंट को वोईस और कान दें।

🎙️वाणी और प्रतिलेखन/cult-of-carcinization

deepdub-tts

डीप्डब और इसे मीडिया के रूप में जोड़कर वक्तव्य ऑडियो उत्पन्न करें।

🎙️वाणी और प्रतिलेखन/deepdub-tts

chichi-speech

Qwen3 का उपयोग करके हाई-क्वालिटी टेक्स्ट-टू-स्पीच सेवा

🎙️वाणी और प्रतिलेखन/chichi-speech

lnbits

लेनबिट्स: एलएनबिट्स लाइटनिंग वॉलेट (बैलेंस, पेय, इनवायस) प्रबंधन.

🎙️वाणी और प्रतिलेखन/lnbits

Voicenotes Official

वॉयसनोट्स आधिकारिक: वॉयसनोट्स टीम की यह आधिकारिक कौशल OpenClaw को नए APIs तक पहुंच देता है और शब्दावलीय खोज करने, पूरे ट्रांसक्रिप्ट को प्राप्त करने, फ़िल्टर करने... की क्षमता देता है.

🎙️वाणी और प्रतिलेखन/voicenotes-official

tl;dw - YouTube Video Summarizer

tl;dw - YouTube वीडियो समरीज़र: YouTube वीडियो के प्रतिलेख को निकालता है और पूरा वीडियो देखे बिना मुख्य बिंदुओं, तर्कों और निष्कर्षों को उभारता है।

🎙️वाणी और प्रतिलेखन/tldw

Openai Tts.Bak 2026 01 28T18:01:23+10:30

OpenAI ऑडियो स्पीच एपीआई के माध्यम से टेक्स्ट-टू-स्पीच

🎙️वाणी और प्रतिलेखन/openai-tts-bak-2026-01-28t18-01-23-10-30

speech-recognition

स्पीच-रिकग्नीशन: सामान्य वाणी पहचान कौशल। अनेक आडियो फॉर्मेट (ogg/mp3/wav/m4a) का समर्थन करता है, वाणी से लेख में बदलने के लिए सीलिकॉन आधारित फ्लॉटिंग SenseVoice API का उपयोग करता है। जब उपयोगकर्ता वाणी संदेश, आडियो फ़ाइल भेजता है या आडियो को ट्रांसक्रिप्ट करने की जरूरत है तो यह स्किल ट्रिगर होता है।

🎙️वाणी और प्रतिलेखन/speech-recognition

freshbooks-cli

फ्रेशबुक्स-क्लाय: फ्रेशबुक्स के लिए इनवायर्स, ग्राहकों और बिलिंग का प्रबंधन करने के लिए फ्रेशबुक्स क्लाय.

🎙️वाणी और प्रतिलेखन/freshbooks-cli

Text To Speech

पाठ से वाकशास्त्र: DIA TTS, Kokoro, Chatterbox और अधिक के साथ प्राकृतिक वाकशास्त्र में पाठ बदलें, inference.sh CLI के माध्यम से.

🎙️वाणी और प्रतिलेखन/text-to-speech

AssemblyAI Transcriber

एसेम्बलीएआई ट्रांसक्राइबर: ऑडियो फ़ाइलों को स्पीकर डायरेशन (किस वक्ता कब बोलता है) के साथ ट्रांसक्राइब करें। 100 से अधिक भाषाओं, स्वचालित भाषा पहचान और टाइमस्टैम्प्स समर्थित। बैठकों, साक्षात्कारों, पॉडकास्ट या वॉइस मेसेजेज के लिए उपयोग करें। एसेम्बलीएआई API की आवश्यकता है।

🎙️वाणी और प्रतिलेखन/assemblyai-transcriber

Whisper Transcribe

विश्वप्रचार ट्रांसक्राइब: ओपनएआई विश्वप्रचार का उपयोग करके ऑडियो फ़ाइलों को पाठ में ट्रांसक्राइब करें। वक्ता से पाठ (ऑटो भाषा पहचान), कई आउटपुट फ़ॉर्मेट (txt, srt, vtt, ), बैच प्रोसेसिंग, और मॉडल चयन (टाइनी से लेकर बड़े तक) समर्थित है। ऑडियो रिकॉर्डिंग, पॉडकास्ट, वॉयस मेसे��, व्याख्यान, बैठक, या किसी ऑडियो/वीडियो फ़ाइल को पाठ में ट्रांसक्राइब करने के लिए उपयोग करें। mp3, wav, m4a, ogg, flac, webm, opus, aac फ़ॉर्मेटों को संभालता है।

🎙️वाणी और प्रतिलेखन/whisper-transcribe