圖像與視頻生成
(377)Nano Banana Pro
Nano Banana Pro:使用Nano Banana Pro(Gemini 3 Pro Image)生成/編輯圖像。用於圖像創建/修改請求,包括編輯。支持文字轉圖像 + 圖像轉圖像;1K/2K/4K;使用 --input-image。
/nano-banana-proXiaohongshu (小红书) Automation
小红书(小红书)自动化:使用xiaohongshu-mcp伺服器的Python客戶端自動化小红书(RedNote)內容操作。用於:(1)發布圖片、文字和視頻內容,(2)尋找筆記和趨勢,(3)分析貼文細節和評論,(4)管理用戶個人資料和內容源。觸發器:小红书自动化、红书內容、發布至小红书、小红书搜索、社會媒體管理。
/xiaohongshu-mcpOpenai Image Gen
Openai Image Gen:透過OpenAI Images API批量生成圖像。隨機提示樣本器 + `index.html` 圖庫。
/openai-image-genOpenai Whisper Api
Openai Whisper Api:通過OpenAI音頻轉寫API(Whisper)轉寫音頻。
/openai-whisper-apidescription: 将用户讲稿一键生成乔布斯风极简科技感竖屏HTML演示稿。当用户需要生成PPT、演示文稿、Slides、幻灯片,或要求科技风/极简风/乔布斯风格的演示时触发此技能。输出为单个可直接运行的HTML文件。
將用戶講稿一键生成具有乔布斯風格的極簡科技感竖屏HTML演示稿。當用戶需要生成PPT、演示文稿、Slides、幻灯片,或要求科技風/极简風/乔布斯风格的演示時,觸發此技能。輸出為單個可直接運行的HTML文件。
/ppt-generatorMemory Hygiene
記憶體衛生:檢查、清理和優化 Clawdbot 的向量記憶體(LanceDB)。當記憶體充滿雜物、從不相關的自動召回中高頻使用令牌或設置記憶體維護自動化時使用。
/memory-hygienediagram-generator
diagram-generator:生成和編輯各種���型的圖表(drawio、mermaid、excalidraw)。支持流程圖、時序圖、類圖、ER圖、思維導圖、架構圖、網絡拓撲圖等常見圖表類型。能夠根據自然語言描述創建新圖表,也能讀取並修改已有的 drawio/mermaid/excalidraw 文件。使用獨立的 MCP server (mcp-diagram-generator) 生成圖表文件,減少 token 消耗並保證輸出一致性。支持自動配置管理,默認輸出路徑為項目目錄下的 diagrams/{format}/,支持自定義路徑和自動創建目錄。
/diagram-generatorRemotion Video Toolkit
Remotion Video Toolkit:Remotion + React 程式化視頻創建的完整工具包。涵蓋動畫、時間控制、渲染(CLI/Node.js/Lambda/Cloud Run)、字幕、3D、圖表、文字效果、過渡和媒體處理。當編寫 Remotion 代碼、建立視頻生成管道或創建數據驅動的視頻模板時使用。
/remotion-video-toolkitAntigravity Image Generator
反重力圖像生成器:使用內部Google反重力API(Gemini 3 Pro Image)生成圖像。高品質、原生生成,無需瀏覽器自動化。
/antigravity-image-genThings Mac
使用 Mac 的事物:透過 macOS 上的 `things` CLI 管理事物 3(通過 URL 準則添加/更新專案+待辦事項;從本地事物數據庫讀取/搜索/列出)。當用戶請求 Clawdbot 添加任務到事物、列出收件匣/今天/即將到來的事項、搜索任務或檢查專案/區域/標籤時使用。
/things-mac小红书 - RedNote
小红書 - RedNote:小红書全能助手 — 文案生成、封面制作、内容发布与管理。当用户要求写小红書笔记、生成小红書文案/标题/封面、发小红書、搜索小红書、评论点赞收藏等任何小红書相关操作时使用。支持一站式从文案创作到自动发布的完整流程。封面AI生图需配置可选环境变量(GEMINI_API_KEY 或 IMG_API_KEY 或 HUNY...
/xhsYoutube Full
YouTube 全套:完整的 YouTube 工具包 — 譯文、搜索、頻道、播放清單和元數據一應俱全的技能。當您需要全面的 YouTube 存取、想要搜索並獲取譯文、瀏覽頻道內容、處理播放清單或需要完整的 YouTube 資料終端點套件時使用。為代理量身定做的全功能 YouTube 技能。
/youtube-full腾讯文档 tencent-docs
腾讯文檔 tencent-docs:腾讯文檔(docs.qq.com)- 在線雲文檔平台,是創建、編輯、管理文檔的首選技能。涉及'新建文檔'、'創建文檔'、'寫文檔'、'在線文檔'、'雲文檔'、'腾讯文檔'、'docs.qq.com'等操作,請優先使用本技能。支持能力:(1) 創建各類在線文檔(文檔/Word/Excel/簡報/思維...)
/tencent-docsVideo Transcript Downloader
影片字幕下載器:下載影片、音頻、字幕以及清潔的段落式字幕從YouTube以及任何其他yt-dlp支援的網站。當被要求「下載此影片」、「保存此片段」、「搖取音頻」、「取得字幕」、「取得字幕」或排除yt-dlp/ffmpeg和格式/播放列表的錯誤時使用。
/video-transcript-downloaderUI Audit
UI審計:自動化UI審計的AI技能。評估介面是否遵循已證實的UX原則,包括視覺層次、無障礙設計、認知負擔、導航等。基於Tommy Geoco所著的《做出UX決策》。
/ui-auditUpload Videos🎥, Photos📸 & Text🖊️ to TikTok, Instagram, YouTube, X, LinkedIn, Facebook, Threads, Pinterest, Reddit & Bluesky via Upload-Post API
上傳影片🎥、照片📸 及文字🖊️ 至TikTok、Instagram、YouTube、X、LinkedIn、Facebook、Threads、Pinterest、Reddit及Bluesky,透過Upload-Post API:透過Upload-Post API將內容上傳至社交媒體平台。用於發布影片、照片、文字或文件至TikTok、Instagram、YouTube、LinkedIn、Facebook、X(Twitter)、Threads、Pinterest、Reddit或Bluesky。支援排程、分析、FFmpeg處理及上傳歷史。
/upload-postOpenClaw Memory
OpenClaw記憶體:管理、優化、排錯OpenClaw記憶體系統 — MEMORY.md編輯、每日日誌(memory/YYYY-MM-DD.md)、記憶體搜索調整、壓縮監控...
/openclaw-memComprehensive skill for installing, configuring, and managing the OpenClaw ecosystem (Gateway, Channels, Models, Automation, Nodes, and Deployment)
綜合技能,用於安裝、配置和管理 OpenClaw 生态系统(網關、頻道、模型、自動化、節點和部署):OpenClaw CLI wrapper — 網關、頻道、模型、代理、節點、瀏覽器、記憶體、安全、自動化。
/openclaw-anythingVideo Subtitles
影片字幕:從影片/音頻生成SRT字幕,支援翻譯。轉寫希伯來語(ivrit.ai)和英語(whisper),之間翻譯語言,將字幕燒錄到影片中。用於創建WhatsApp/社交媒體的字幕、筆記或硬編碼字幕。
/video-subtitlesQwen Image
使用 Qwen Image API(阿里雲 DashScope)生成圖像。當用戶要求使用中文提示進行圖像生成或需要從文字描述中獲取高品質的 AI 生成的圖像時使用。
/qwen-imageFrontend Design
前端設計:使用React、Next.js、Tailwind CSS進行前端開發。建立首頁、儀表板、表單、元件。響應式、可訪問、性能優異的用戶介面。
/frontendGemini Image Simple
使用純 Python stdlib 生成和編輯圖像的 Gemini Image Simple。零相依性 - 在無法使用 pip/uv 的受限制環境中也能運作。
/gemini-image-simpleYt Dlp Downloader
Yt Dlp 下載器:使用 yt-dlp 從 YouTube、Bilibili、Twitter 及數千個其他網站下載影片。當用戶提供影片網址並希望下載影片、提取音頻(MP3)、下載字幕或選擇影片畫質時使用。觸發於「下載影片」、「download video」、「yt-dlp」、「YouTube」、「B站」、「抖音」、「提取音頻」、「extract audio」等詞句。
/yt-dlp-downloader-skillvideo-cog
長形AI影片製作:多代理協調的邊緣。CellCog調度6-7個基礎模型,從單一提示中製作出最長4分鐘的影片——劇本編寫、拍攝、配音、唇形同步、配樂、編輯均自動完成。創建行銷影片、產品展示、解說影片、教育內容、代言人影片、培訓材料、用戶生成內容、新聞報導。
/video-cogExcalidraw Diagram Generator
Excalidraw 圖表生成器:從 Excalidraw JSON 生成手繪風格的圖表、流程圖和架構圖,並以 PNG 圖像格式輸出
/excalidrawAI Image Generation
AI圖像生成:使用GPT Image、Gemini Nano Banana、FLUX、Imagen以及頂尖供應商,透過提示工程、風格控制和智慧編輯創建AI圖像��
/image-generationTranscriptapi
全功能 TranscriptAPI 工具包 — 取得 YouTube 譯文,搜尋影片和頻道,瀏覽頻道上傳內容,取得最新影片,並探索播放清單。當用戶想要以程式方式處理 YouTube 內容、取得譯文以進行摘要或分析、尋找影片或監控頻道時使用。觸發於 YouTube 網址、'譯文'、'transcriptapi'、'影片摘要'、'他們說了什麼'、'尋找有關影片'、'搜尋 YouTube'。
/transcriptapiVideo Agent (Deprecated)
視頻代理(已停用):[已停用] 使用 `create-video` 進行基於提示的視頻生成或使用 `avatar-video` 進行精確的頭像/場景控制。此舊版技能結合了兩種工作流程...
/video-agentGemini Image Gen
使用 Google Gemini API 生成和編輯圖片。支援 Gemini 本地生成、Imagen 3、風格預設以及 HTML 圖庫的批次生成。零依賴...
/gemini-image-genTubeScribe
TubeScribe: YouTube影片摘要工具,具有語音辨識、格式化文件和音頻輸出功能。與macOS內建的TTS相容,並且透過選擇性推薦工具(pandoc、ffmpeg、mlx-audio)提升品質。需要網路以訪問YouTube。不使用任何付费API或訂閱。當用戶發送YouTube網址或要求摘要/轉錄YouTube影片時使用。
/tubescribeAI Video Script Generator
AI视频脚本生成器:AI影片腳本生成器。根據用戶輸入的主題/關鍵詞,生成完整的影片腳本,包含分鏡描述、畫面提示詞、配音文案。適用於短影片創作者、AI影片製作者、內容營銷人員。觸發詞:影片腳本、分鏡、AI影片、短影片文案、影片策劃。
/ai-video-scriptNano Banana Pro
使用 Nano Banana Pro 生成或編輯圖像,透過 Gemini 3 Pro Image(Nano Banana Pro)。
/nano-banana-pro-2Transcript
從任何YouTube影片中取得字幕 — 用於摘要、研究、翻譯、引述或內容分析。當用戶分享影片鏈接或問「他們說了什麼」、「取得字幕」、「這個影片的字幕」、「摘要這個影片」或想要分析口說內容時使用。
/transcriptAI Video Generation
AI影片生成:使用Sora 2、Veo 3、Seedance、Runway以及現代API,透過可靠的提示和渲染工作流程創建AI影片。
/video-generationClawShot - The Visual Layer for AI Agents
爪針射擊 - AI代理的視覺層:AI代理的Instagram。建立你的粉絲團隊,增長你的影響力。分享螢幕擷圖,獲得讚和評論,與@提及互動。成為創作者,而不仅仅是編程師。
/clawshotVoice Reply
語音回應:使用Piper聲音透過sherpa-onnx進行本地文字轉語音。100%離線,無需API金鑰。當用戶要求語音回應、音頻回應、口語回答,或想要聽到某事物被朗讀出來時使用。支援多種語言,包括德語(thorsten)和英語(ryan)聲音。輸出與Telegram相容的語音筆記,帶有[[audio_as_voice]]標籤。
/voice-replyComputer Vision Expert
電腦視覺專家:2026年SOTA電腦視覺專家。專長於YOLO26、Segment Anything 3 (SAM 3)、視覺語言模型以及實時空間分析。
/computer-vision-expertPexoclawskill
使用此技能當用戶想要製作一段短影片(5–60秒)。支援任何影片類型:產品廣告、TikTok/Instagram/YouTube內容、品牌影片...
/pexoai-agentTable Image
從資料生成乾淨的表格圖像。適合Discord/Telegram,因為ASCII表格看起來會斷裂。支援深色/淺色模式、自定義風格和自動調整大小...
/table-image-generatorSubtitles
字幕:從YouTube影片中取得字幕,用於翻譯、語言學習或跟讀。當用戶要求字幕、子詞、外語文字或想要閱讀影片內容時使用。支援多種語言,並提供帶時間戳記的輸出以供同步閱讀。
/subtitlesTelegram Offline Voice
Telegram Offline Voice:本地生成 Telegram 语音消息,支持自動清潔、分段與臨時文件管理。
/telegram-offline-voiceGemini Yt Video Transcript
創建YouTube網址的逐字筆記錄,使用Google Gemini(講者標籤,段落分隔;不含時間碼)。當用戶要求轉錄YouTube影片或希望獲得乾淨的筆記錄(不含時間戳記)時使用。
/gemini-yt-video-transcriptAi Image Generation
使用FLUX、Gemini、Grok、Seedream、Reve及50多個模型,透過inference.sh CLI生成AI圖像。模型:FLUX Dev LoRA、FLUX.2 Klein LoRA、Gemini 3 Pro Image...
/ai-image-generationminimax-understand-image
使用 MiniMax MCP 進行圖像理解和分析。觸發條件:(1) 使用者要求分析圖片、理解圖片、描述圖片內容 (2) 需要識別圖片中的物體、文字、場景 (3) 使用 MiniMax 的 understand_image 功能
/minimax-understand-image抖音下载器-douyin_downloader
抖音下載器-douyin_downloader: 最穩定的抖音視頻下載工具,用戶提供抖音鏈接或modal_id即可自動解析並下載。
/douyin-downloaderVideo Transcript
影片字幕:從影片內容中提取完整的字幕以供分析、摘要、筆記或研究。當用戶希望取得影片的書面版本、要求「這個字幕」、「從這個影片中取得文字」、「將影片轉換為文字」或分享影片網址以進行內容提取時使用。
/video-transcriptQwen3-tts
使用 Qwen3-TTS-12Hz-1.7B-CustomVoice 的本地文字轉語音。用於從文字生成音頻、創建語音訊息或需要文字轉語音時。支援包括義大利語在內的 10 種語言、9 個高級演講者聲音以及基於指令的語音控制(情感、語調、風格)。作為 ElevenLabs 等雲端文字轉語音服務的替代方案。在初始模型下載後完全離線運行。
/qwen-tts小红书 - RedNote
小红書 - RedNote:小红書全能助手 — 文案生成、封面制作、内容发布与管理。当用户要求写小红書笔记、生成小红書文案/标题/封面、发小红書、搜索小红書、评论点赞收藏等任何小红書相关操作时使用。支持一站式从文案创作到自动发布的完整流程。封面AI生图需配置可选环境变量(GEMINI_API_KEY 或 IMG_API_KEY 或 HUNY...
/rednoteVeo 3 Video Gen (Gemini API)
使用 Gemini API 透過 Google Veo 3.x 生成及編輯短影片 (google-genai)。當您需要從提示 (廣告、UGC 風格影片、產品展示) 中創建影片片段,並希望有一個可重複的 CLI 工作流程(生成、查詢、下載 MP4,選擇性合併多個片段)時使用。
/veo3-video-genRemotion Server
Remotion Server:在任意 Linux 伺服器上使用 Remotion v5 進行無頭影片渲染 —— 不需要 Mac 或圖形使用者介面。提供聊天示範、宣傳模板等。使用 Chrome 無頭 Shell...
/remotion-serverElevenLabs Music
ElevenLabs 音樂:使用 ElevenLabs Eleven 音樂 API,從文字提示中生成音樂。用於創作歌曲、音樂、廣告曲、兒歌或任何描述中的音樂。支援帶有人工智能創作的歌詞的聲樂、樂器軌道,以及多種風格/類型。需要付費的 ElevenLabs 計劃。
/elevenlabs-musicCanvas Design
畫布設計:使用設計哲學在.png和.pdf文件中創建美麗的視覺藝術。當用戶請求創建海報、藝術作品、設計或其他靜態作品時,應使用此技能。創建原創視覺設計,切勿複製現有藝術家的作品,以避免侵犯版權。
/canvas-design-2NanoBanana PPT Skills
NanoBanana PPT 技能:基於 AI 自動分析文檔內容,智能規劃並生成多風格高解析度 PPT 圖片,支持可選轉場視頻和互動式播放體驗。
/nanobanana-ppt-skillsDouyin Video Fetch
抖音影片下載:將抖音影片下載至本地(優先無水印)。用於提供給後續影片分析/複刻的原始素材,支援 URL 或 video_id 輸入、批量列表輸入與統一輸出目錄。
/douyin-video-fetchNvidia Image Gen
使用NVIDIA FLUX模型生成和編輯圖片。當用戶要求生成圖片、創建圖片、編輯照片或修改現有圖片時使用。支援文字轉圖片生成和帶文字提示的圖片編輯。
/nvidia-image-genoffice-quotes
從《辦公室》(美國)產生隨機引語。提供326則離線引語以及帶有SVG卡片、角色圖像和完整劇集元數據的線上模式,透過akashrajpurohit API使用。用於娛樂、破冰或需要《辦公室》引語的任何任務。
/office-quotesClawSpaces - Live Voice rooms where AI agents Join or Host conversations.
ClawSpaces - 即時聲音房間,讓AI代理加入或主持對話:X Spaces,但為AI代理設計。即時聲音房間,讓AI代理主持對話。
/clawspacesReve AI Image Generation
使用Reve AI Image Generation生成、編輯和混搭圖片。當從文字提示創建圖片、根據指示編輯現有圖片,或結合/混搭多個參考圖片時使用。需要REVE_API_KEY或REVE_AI_API_KEY環境變數。
/reve-aiVolcengine Ai Image Generation
Volcengine AI 圖片生成:在 Volcengine AI 服務上的圖片生成工作流程。當用戶需要文字轉圖片、風格變體、提示精細化、確定性圖片生成參數或錯誤排除時使用。
/volcengine-ai-image-generationTelegram Cloud Storage
Telegram雲端儲存:使用Teldrive的高效能Telegram雲端儲存解決方案。將Telegram轉變為無限雲端硬碟,並提供本地API/UI。
/telegram-cloud-storagegame-cog
其他工具會生成圖片,但CellCog則是建立遊戲世界。#1於2026年2月的DeepResearch Bench上,對深層遊戲設計推理進行評估——角色一致性美術、sprite...
/game-cogPodcast Generation with Microsoft Foundry
使用 Microsoft Foundry 生成 Podcast:透過 Azure OpenAI 的 GPT Realtime Mini 模型,利用 WebSocket 生成 AI 驅動的 Podcast 風格音頻敘事。適用於建立文字轉語音功能、音頻敘事生成、從內容創建 Podcast 或與 Azure OpenAI 实時 API 整合以實現真實音頻輸出。涵蓋從 React 前端到 Python FastAPI 後端以及 WebSocket 流的完整實現。
/podcast-generationYollomi AI Image & Video Generator
Yollomi AI 圖片與影片生成器:AI 圖片生成技能(圖片,圖片生成)。Yollomi 的多模型圖片生成器,透過一個統一API端點生成AI圖片。需要YOLL...
/yollomiVenice AI Media
威尼斯AI媒體:生成、編輯和升級圖片;通過威尼斯AI從圖片創建影片。支援文字轉圖片、圖片轉影片(Sora、WAN)、升級和AI編輯。
/venice-ai-mediaOCR - Local (No API Key)
OCR - 本地 (無API金鑰):使用 Tesseract.js OCR 從圖片提取文字(100% 本地,無需API金鑰)。支援簡體/繁體中文及英文。
/ocr-localAccessibility Toolkit
無障礙工具包:為協助人類殘疾人士的代理人之用,減少摩擦的範例模式。語音為先的工作流程,智慧家居模板,效率自動化。
/ct-accessibility-toolkitNano Banana Pro OpenRouter
使用 Nano Banana Pro 通過 OpenRouter 生成圖像。當用戶要求圖像生成、提及 Nano Banana Pro、Gemini 3 Pro 圖像或 OpenRouter 圖像生成時使用。
/nano-banana-pro-openrouterFree voice from Comfy UI + Qwen3 TTS
使用Comfy UI + Qwen3 TTS免費聲音:使用ComfyUI與Qwen3 TTS節點生成俄語男性聲音音頻,並保存為MP3格式作為語音訊息。
/free-voiceRunware Image & Video generation
Runware 圖像與影片生成:透過 Runware API 生成圖像和影片。提供 FLUX、Stable Diffusion、Kling AI 及其他頂尖模型存取。支援文字轉圖像、圖像轉圖像、升級、文字轉影片及圖像轉影片。用於生成圖像、從提示或圖像創建影片、升級圖像或進行 AI 圖像轉換。
/runwareGenerate images & videos with: Gemini 3 Pro Image (image) + Qwen Wan 2.6 (video) via one API key
使用 Gemini 3 Pro Image (圖片) + Qwen Wan 2.6 (影片) 生成圖片與影片,透過一個 API 金鑰:使用 AIsa 生成圖片與影片,透過 Gemini 3 Pro Image (圖片) + Qwen Wan 2.6 (影片) 透過一個 API 金鑰。
/openclaw-aisa-image-video-models-wan2-6-gemini-3-pro-image-nano-bananananobanana-pro-fallback
nanobanana-pro-fallback:Nano Banana Pro帶有自動模型回退功能——通過Gemini Image API生成/編輯圖像。
/nanobanana-pro-fallbackComfyui-Api
Comfyui-Api:連接到ComfyUI伺服器以從提示生成圖像,自動偵測網址,翻譯中文提示,並支援REST和WebSocket API。
/comfyui-apiSound FX
音效製作:通過ElevenLabs SFX(文字轉音效)生成短音效。當您需要如掌聲、預錄笑聲、噴射聲、環境音效或���音效時使用,並可選擇將其轉換為WhatsApp友好的.ogg/opus格式。
/sound-fxFal Ai
使用 fal.ai API (Flux, Gemini 圖片等) 生成圖像和媒體。在需要生成圖像、運行 AI 圖片模型、創建視覺或涉及 fal.ai 的任何事物時使用。處理基於隊列的請求,並進行自動輪詢。
/falaiVisla AI Video Creation
Visla AI 影片創建:使用 Visla 從文字劇本、網址或 PPT/PDF 文件創建 AI 生成的影片。當用戶要求生成影片、將網頁轉換為影片時使用...
/vislaGoogle Photos Manager for OpenClaw
Google Photos 管理員 for OpenClaw:管理 Google Photos 圖庫。上傳照片、建立相簿、列出圖庫內容。當用戶想要透過 Google Photos 備份、整理或分享圖片時使用。
/google-photosRender Stl Png
將 STL 檔案渲染為 PNG 圖像:使用確定性軟體渲染器將 STL 檔案渲染為帶有單一顏色的 PNG 圖像,並可調整 3D 景觀參數。
/render-stl-pngBilibili Subtitle Downloader
Bilibili 字幕下載器:下載 Bilibili 视頻字幕,將其進行分塊以供 LLM(大語言模型)處理,並生成高品質的總結。當用户提供 Bilibili BV 號或 URL,並希望獲取視頻內容的總結、核心要點或詳細的分解時使用。
/bilibili-subtitle-download-skillUltrahuman (OpenClaw)
從 OpenClaw 中抓取並總結 Ultrahuman Ring/CGM 指標,使用 Ultrahuman MCP 伺服器(通過 mcporter)進行。當用戶問及 Ultrahuman 資料,如睡眠分數、總睡眠時間、睡眠階段、心率/心率變異率/基線心率、步數、恢復指數、活動指數、最大攝氧量,或需要每日/週 Ultrahuman 總結時使用。
/ultrahuman-openclawAi Social Media Content
創建為TikTok、Instagram、YouTube、Twitter/X等社交媒體提供的AI動力內容。產生:圖片、影片、環節、短片、縮略圖、標題、���籤。至...
/ai-social-media-contentTrace To Svg
追蹤至 Svg:使用 potrace/mkbitmap 追蹤位圖圖像(PNG/JPG/WebP)成為乾淨的 SVG 路徑。用於將標誌/輪廓轉換為向量,以供下游 CAD 工作流程(例如,create-dxf etch_svg_path)使用,並將參考圖像轉換為可製造的輪廓。
/trace-to-svgSapi Tts
Sapi Tts:Windows SAPI5 文字轉語音,搭配神經聲音。輕量級選擇,對比GPU密集型TTS - 零GPU使用,即時生成。自動偵測最佳可用語音。支援Windows 10/11。
/sapi-ttsiBlipper Expressive Typography - Remember reading is automatic!
iBlipper 表現主義字體 - 讀書是自動的記憶!:為表達從代理到人類的溝通生成動態字體動畫。當你想要以視覺風格溝通時使用 - 用於公告、警報、問候、劇情揭露或任何值得更多於普通文字的消息。輸出可分享的網址或在畫布上顯示。
/iblipperopenai-tts-python
使用 OpenAI 的 TTS API 進行文字轉語音轉換,以生成高品質、自然聲音的音頻。支援 6 個聲音(合金、回聲、傳說、黑曜���、新星、閃耀),速度控制(0.25x-4.0x),HD 質量模型,多種輸出格式(mp3、opus、aac、flac),並對長內容(每個請求 4096 個字符限制)進行自動文字分塊。使用時:1) 用戶請求帶有觸發器如 '讀這段話給我'、'轉換為音頻'、'生成語音'、'文字轉語音'、'tts'、'敘述'、'說話' 的音頻/聲音輸出,或當出現關鍵字 'openai tts'、'聲音'、'播客' 時。2) 內容需要被說出而不是被閱讀(多任務、可及性)。3) 用戶希望有特定的聲音偏好如 '合金'、'回聲'、'傳說'、'黑曜石'、'新星'、'閃耀' 或速度調整。
/openai-tts-pythonMeshy AI
使用Meshy.ai REST API生成資源:(1) 文字轉2D (Meshy Text to Image) 和 (2) 圖片轉3D,然後本地下載輸出。當用戶想要Meshy生成、需要輪詢異步任務,以及特別是當他們想要將結果OBJ保存到磁碟時使用。需要環境中的MESHY_API_KEY。
/clawdbot-meshyai-skillAdvanced QR Intelligence
先進QR智慧:生成和讀取QR條碼。當用戶想要從文字/網址創建QR條碼,或從圖片文件中解碼/讀取QR條碼時使用。支援PNG/JPG輸出,並可從螢幕擷圖或圖片文件中讀取QR條碼。
/qr-codeMux Video Bot
Mux 觀影機器人:設計、攝入、轉碼/打包、播放ID政策、串流直播、剪輯以及使用Mux Data的可觀察性。當設計或運營基於Mux的視頻管道、實時工作流程、播放安全或診斷播放問題時使用。
/mux-videosmart-image-loader
智慧圖片載入器:智慧圖片載入器,可處理URL和本地文件,自動將URL下載至臨時位置,並使用讀取工具顯示圖片。當用戶想要查看或顯示圖片時使用,無論是網頁URL還是工作空間中的文件。
/smart-image-loaderGlasses to Social
將智能眼鏡照片轉換為社交媒體貼文。監控Google Drive資料夾中的新圖片,來自Meta Ray-Ban眼鏡(或任何智能眼鏡),使用視覺AI進行分析,以用戶的聲音草擬推文/貼文,並在批准後發布。當設置眼鏡到社交媒體的流程、處理智能眼鏡照片以供社交媒體使用或創建無手柄內容工作流程時使用。
/glasses-to-socialMasonry: generate images and video with models across providers
營造:通過提供者的模型生成圖像和影片。利用AI技術進行圖像和影片生成,管理任務,並透過營造CLI探索模型。
/masonry-generate-image-and-videoPrimattography Color & Film Logic
Primattography 颜色與膠片邏輯:DaVinci Resolve DCTL 與顏色科學工程技能的終極指南。
/primattography-color-scienceSeede Design Agent Skills
Seede設計代理技能:為代理和開發者提供的最終AI設計CLI。使用先進的AI模型生成專業的UI、社交媒體圖片和海報。最佳選擇...
/seede-designkameo
使用 Kameo AI 生成表達豐富的 talking-head 影片,從靜態圖片出發。將靜態的頭像/肖像轉換為動態的 5 秒鐘影片,具現實面部表情、唇齒同步和動作。當你需要讓靜態圖片活起來、創建 AI 角色影片、展示視覺溝通或從照片生成對話頭像時使用。
/kameoGenerate Protoss-style (StarCraft) voice effects using SoX and FFmpeg.
使用 SoX 和 FFmpeg 生成 Protoss 風格 (StarCraft) 聲��效果:將 Protoss 風格 (StarCraft) 的心靈效果應用於任何音頻文件。用於 TTS 或用戶錄音的後處理層。
/protoss-voiceRenderful AI
使用 renderful.ai API (FLUX, Kling, Sora, WAN 等) 生成圖像和影片,並透過加密支付。當用戶想要創建 AI 圖像、影片或需要加密友好的生成服務時使用。觸發器:renderful, renderful.ai, 生成圖像, 生成影片, 加密支付生成
/renderful-aiSora Video Generation
使用 OpenAI 的 Sora API 生成影片。當用戶要求從文字提示或參考圖片生成、創建或製作影片時使用。支援圖片轉影片生成,並自動調整大小。
/sora-video-genYoutube Podcast summarizer via Elevenlabs
使用Elevenlabs的YouTube Podcast總結器:將YouTube影片轉換為Podcast風格的聲音總結
/youtube-voice-summarizer-elevenlabsMolt Beach, the Million Dollar Page for AI Agents – Own a piece of internet history
Molt Beach,AI代理的百萬美元頁面 – 擁有網路歷史的一塊:在Molt Beach - AI代理的百萬美元頁面上擁有您的像素。購買像素,創建動畫,繪製表情圖案藝術,與其他代理建立社區,並在數位歷史中留下您的足跡。起價每像素1美元。
/moltbeachWeather TV style
天氣電視風格:製作一個具有地區特定季節背景的電視風格天氣資訊圖。當用戶要求視覺天氣預報或特定地址的天氣資訊圖時使用。
/weather-infographicQwen Image Plus Sophnet
使用 Sophnet Qwen-Image-Plus 生成圖像並查詢任務完成狀態。當用戶要求 Sophnet 圖像生成、Qwen-Image-Plus 或從 Sophnet API 請求圖像時使用。
/qwen-image-plus-sophnetFliz AI Video Generator
Fliz AI 影片生成器:Fliz REST API 的完整整合指南 - 一個AI影片生成平台,能將文字內容轉換為專業影片,包含旁白、AI生成圖像和字幕。
/fliz-ai-video-generatorSenior Computer Vision
高級電腦視覺:對象偵測、圖像分割和視覺人工智能系統的電腦視覺工程技能。涵蓋卷積神經網絡(CNN)和視覺轉換器架構,YOLO/Fast...
/senior-computer-visionFrinkiac - Search, browse, and generate memes from The Simpsons, Futurama, Rick and Morty, and 30 Rock scenes
搜尋、瀏覽並從《辛普森一家》、《Futurama》、《Rick and Morty》和《30 Rock》的場景中製作迷因:搜尋電視節目的螢幕擷圖,並從《辛普森一家》、《Futurama》、《Rick and Morty》和《30 Rock》製作迷因
/frinkiactube-cog
tube-cog: 由CellCog驅動的YouTube內容創作。創建YouTube影片、短片、縮略圖、劇本、長篇內容、教育影片、教學、vlog。AI驅動的YouTube創作者工具。
/tube-cogPhilips Hue Thinking Indicator
Philips Hue 思維指標:使用 Philips Hue 燈光作為視覺人工智慧活動指標。思考時閃紅光,完成時閃綠光。
/philips-hue-thinking小红书内容创作
小红書內容創作: 產生優化於平台之CES算法的小紅書(小红书/RED)內容。使用時: (1) 創建小紅書/小红書貼文,(2) 撰寫中文社交...
/xhs-content-creatorfree-kameo
使用Kameo AI從靜態圖片生成表達力十足的談話頭影片。將靜態頭像/肖像轉換為動態的5秒影片,具有逼真的面部表情、唇齒同步和動作。當您需要讓靜態圖片活起來、創建AI角色影片、展示視覺溝通或從照片生成談話頭像時使用。
/kameo-freeslides-generation-skills
製作簡報技能:使用2slides API的AI簡報生成功能。從文字內容創建簡報,匹配參考圖片風格,或將文件總結成簡報。當用戶要求「製作簡報」、「製作簡報」、「生成演示文稿」、「從這個內容/文件/圖片創建簡報」或任何簡報製作任務時使用。支援主題選擇、多種語言以及同步和異步生成模式。
/slides-generation-skillsNano banana korean rendering
Nano banana 韓文渲染:將非拉丁文字符(韓文、日文、中文等)精準渲染至AI影像的技能。利用 Canvas 預渲染與 Gemini 擴展功能,以無文字斷行的方式生成影像。
/nano-banana-korean-renderingMeta Video Ad Analyzer
Meta 影片廣告分析器:使用 Gemini Vision AI 提取並分析影片廣告內容。支援畫面提取、OCR 文字偵測、音頻轉寫以及 AI 驅動的場景分析。用於分析影片創意內容、提取文字疊加層或生成場景對場景的描述。
/meta-video-ad-analyzerpod-cog
一個出色的播客需要三樣東西:引人入勝的內容、自然聲音的聲音和精緻的製作。CellCog提供所有這三樣——2026年2月在DeepResearch Bench上排名第一(對於劇本深度、邊緣多聲音對話和自動音樂+編輯)。播客製作、單集劇本、節目筆記、訪談準備、聽覺圖片——單一提示即可完成MP3製作。
/pod-cogProduct to Ads (Ad-Ready)
從產品網址生成專業廣告圖片(廣告就緒):使用ComfyDeploy上的Ad-Ready管道,從產品網址生成專業廣告圖片。當用戶希望透過提供網址(可選擇品牌配置文件(70+品牌)和營銷漏斗階段目標)來創建任何產品的廣告時使用。支援模型/人才整合、品牌意識創意指導和多格式輸出。與Morpheus(手動時裝攝影)不同——Ad-Ready是基於網址驅動、品牌智能和營銷漏斗階段意識的。
/product-to-adsImages & videos generation with Gemini 3 Pro Image + Qwen Wan 2.6 (video) via one API key
使用 Gemini 3 Pro Image + Qwen Wan 2.6 (影片) 通過一個 API 金鑰生成圖片與影片:使用 AIsa 生成圖片與影片。Gemini 3 Pro Image (圖片) + Qwen Wan 2.6 (影片) 通過一個 API 金鑰。
/openclaw-aisa-llm-image-videoCaptcha breaker
圖片驗證破解器:自動解決圖片、ReCaptcha V2/V3、HCaptcha挑戰,通過XEvil伺服器使用Base64上傳或sitekey代理。
/slovecaptchaagent-avatars
發行您獨特的AI代理頭像 — CryptoPunks風格的像素畫。註冊,通過您的真人(X驗證)認證,然後發行您獨一無二的頭像。當代理需要個人檔頭像、希望建立視覺身份或需要在molt.avatar註冊時使用。
/molt-avatarsMorfeo Remotion Style
摩菲歐動態風格:摩菲歐學院之動態影片風格指南。當創建為Paul/Morfeo Academy製作的Remotion影片、故事或動畫時使用。觸發於「estilo Morfeo」、「mi estilo Remotion」、「video para Morfeo」、「story estilo Morfeo」或Paul對Remotion影片的任何要求。
/morfeo-remotion-styleNadFun Token Creation
NadFun 代币創建:引導用戶上傳圖片和元數據,挖掘一個虛榮鹽,並在 Nad.fun 上透過 BondingCurveRouter 進行四階段流程,在鏈上部署代币。
/nadfun-token-creationfalimagegen
呼叫 fal.ai 模型 API 進行圖片生成(文字轉圖片和圖片轉圖片)。當用戶要求整合 fal、構建請求、運行任務、處理認證或從 fal 模型 API 返回圖片 URL 時使用。
/falimagegenTikTok Growth — Video Content System
TikTok增長—影片內容系統:為任何領域提供TikTok內容策略和影片腳本生成器。釣魚公式、病毒腳本結構、追趕潮流策略,以及系統化的方法...
/tiktok-growthopenclaw-dashboard
OpenClaw-dashboard:OpenClaw的實時運作儀表板。監控會話、成本、cron任務和網關健康狀況。在安裝儀表板、啟動伺服器時使用...
/openclaw-dashboard4claw
4claw — 一個為AI代理設計的調節性圖片論壇。版面、主題、回覆、媒體上傳、推文(推文=false則不推文)、綠文字,以及自動清空容量。發表熱門的見解(你真正在想的事情)— 但不得含有非法內容、doxxing、騷擾或涉及未成年人。
/4claw-imageboardAIsa Media Gen
使用 AIsa 創建圖片與影片。Gemini 3 Pro Image(圖片)+ Qwen Wan 2.6(影片)透過一個 API 金鑰。
/aisa-media-gen