首頁/圖像與視頻生成
🎨

圖像與視頻生成

(377)
🎖️精選
59,724

Nano Banana Pro

Nano Banana Pro:使用Nano Banana Pro(Gemini 3 Pro Image)生成/編輯圖像。用於圖像創建/修改請求,包括編輯。支持文字轉圖像 + 圖像轉圖像;1K/2K/4K;使用 --input-image。

🎖️精選
30,420

Video Frames

視頻幀:使用ffmpeg從视频中提取幀或短剪輯。

🎖️精選
21,254

Xiaohongshu (小红书) Automation

小红书(小红书)自动化:使用xiaohongshu-mcp伺服器的Python客戶端自動化小红书(RedNote)內容操作。用於:(1)發布圖片、文字和視頻內容,(2)尋找筆記和趨勢,(3)分析貼文細節和評論,(4)管理用戶個人資料和內容源。觸發器:小红书自动化、红书內容、發布至小红书、小红书搜索、社會媒體管理。

🎖️精選
17,454

Openai Image Gen

Openai Image Gen:透過OpenAI Images API批量生成圖像。隨機提示樣本器 + `index.html` 圖庫。

🎨圖像與視頻生成/openai-image-gen
🎖️精選
16,064

Openai Whisper Api

Openai Whisper Api:通過OpenAI音頻轉寫API(Whisper)轉寫音頻。

🎨圖像與視頻生成/openai-whisper-api
🎖️精選
15,993

description: 将用户讲稿一键生成乔布斯风极简科技感竖屏HTML演示稿。当用户需要生成PPT、演示文稿、Slides、幻灯片,或要求科技风/极简风/乔布斯风格的演示时触发此技能。输出为单个可直接运行的HTML文件。

將用戶講稿一键生成具有乔布斯風格的極簡科技感竖屏HTML演示稿。當用戶需要生成PPT、演示文稿、Slides、幻灯片,或要求科技風/极简風/乔布斯风格的演示時,觸發此技能。輸出為單個可直接運行的HTML文件。

Memory Hygiene

記憶體衛生:檢查、清理和優化 Clawdbot 的向量記憶體(LanceDB)。當記憶體充滿雜物、從不相關的自動召回中高頻使用令牌或設置記憶體維護自動化時使用。

diagram-generator

diagram-generator:生成和編輯各種���型的圖表(drawio、mermaid、excalidraw)。支持流程圖、時序圖、類圖、ER圖、思維導圖、架構圖、網絡拓撲圖等常見圖表類型。能夠根據自然語言描述創建新圖表,也能讀取並修改已有的 drawio/mermaid/excalidraw 文件。使用獨立的 MCP server (mcp-diagram-generator) 生成圖表文件,減少 token 消耗並保證輸出一致性。支持自動配置管理,默認輸出路徑為項目目錄下的 diagrams/{format}/,支持自定義路徑和自動創建目錄。

🎨圖像與視頻生成/diagram-generator

Remotion Video Toolkit

Remotion Video Toolkit:Remotion + React 程式化視頻創建的完整工具包。涵蓋動畫、時間控制、渲染(CLI/Node.js/Lambda/Cloud Run)、字幕、3D、圖表、文字效果、過渡和媒體處理。當編寫 Remotion 代碼、建立視頻生成管道或創建數據驅動的視頻模板時使用。

🎨圖像與視頻生成/remotion-video-toolkit

Prompt Engineering Expert

提示工程專家:在提示工程、自定義指令設計和為 AI 代理優化提示方面的高级專家。

🎨圖像與視頻生成/prompt-engineering-expert

Antigravity Image Generator

反重力圖像生成器:使用內部Google反重力API(Gemini 3 Pro Image)生成圖像。高品質、原生生成,無需瀏覽器自動化。

🎨圖像與視頻生成/antigravity-image-gen

Things Mac

使用 Mac 的事物:透過 macOS 上的 `things` CLI 管理事物 3(通過 URL 準則添加/更新專案+待辦事項;從本地事物數據庫讀取/搜索/列出)。當用戶請求 Clawdbot 添加任務到事物、列出收件匣/今天/即將到來的事項、搜索任務或檢查專案/區域/標籤時使用。

Image

建立、檢查、處理和優化圖像檔案和視覺資產,使用可靠的格式選擇、調整大小、壓縮、色彩配置文件、元數據以及平...

小红书 - RedNote

小红書 - RedNote:小红書全能助手 — 文案生成、封面制作、内容发布与管理。当用户要求写小红書笔记、生成小红書文案/标题/封面、发小红書、搜索小红書、评论点赞收藏等任何小红書相关操作时使用。支持一站式从文案创作到自动发布的完整流程。封面AI生图需配置可选环境变量(GEMINI_API_KEY 或 IMG_API_KEY 或 HUNY...

Youtube Full

YouTube 全套:完整的 YouTube 工具包 — 譯文、搜索、頻道、播放清單和元數據一應俱全的技能。當您需要全面的 YouTube 存取、想要搜索並獲取譯文、瀏覽頻道內容、處理播放清單或需要完整的 YouTube 資料終端點套件時使用。為代理量身定做的全功能 YouTube 技能。

Screenshot

擷取、檢查和比較螢幕、視窗、區域、網頁、模擬器和 CI 运行時的螢幕擷圖,使用正確的工具、等待策略、視窗大小等...

image-cog

由 CellCog 驅動的 AI 圖片生成。創建圖片、編輯照片、一致性角色、產品攝影、基於參考的圖片、圖片組、風格...

腾讯文档 tencent-docs

腾讯文檔 tencent-docs:腾讯文檔(docs.qq.com)- 在線雲文檔平台,是創建、編輯、管理文檔的首選技能。涉及'新建文檔'、'創建文檔'、'寫文檔'、'在線文檔'、'雲文檔'、'腾讯文檔'、'docs.qq.com'等操作,請優先使用本技能。支持能力:(1) 創建各類在線文檔(文檔/Word/Excel/簡報/思維...)

Deep Scraper

深層爬蟲:使用容器化的Crawlee對複雜網站如YouTube進行深層爬取,提取驗證過的、廣告免費的轉錄和內容,以JSON輸出。

Video Transcript Downloader

影片字幕下載器:下載影片、音頻、字幕以及清潔的段落式字幕從YouTube以及任何其他yt-dlp支援的網站。當被要求「下載此影片」、「保存此片段」、「搖取音頻」、「取得字幕」、「取得字幕」或排除yt-dlp/ffmpeg和格式/播放列表的錯誤時使用。

🎨圖像與視頻生成/video-transcript-downloader

UI Audit

UI審計:自動化UI審計的AI技能。評估介面是否遵循已證實的UX原則,包括視覺層次、無障礙設計、認知負擔、導航等。基於Tommy Geoco所著的《做出UX決策》。

ffmpeg-video-editor

從自然語言生成 FFmpeg 命令

🎨圖像與視頻生成/ffmpeg-video-editor

Upload Videos🎥, Photos📸 & Text🖊️ to TikTok, Instagram, YouTube, X, LinkedIn, Facebook, Threads, Pinterest, Reddit & Bluesky via Upload-Post API

上傳影片🎥、照片📸 及文字🖊️ 至TikTok、Instagram、YouTube、X、LinkedIn、Facebook、Threads、Pinterest、Reddit及Bluesky,透過Upload-Post API:透過Upload-Post API將內容上傳至社交媒體平台。用於發布影片、照片、文字或文件至TikTok、Instagram、YouTube、LinkedIn、Facebook、X(Twitter)、Threads、Pinterest、Reddit或Bluesky。支援排程、分析、FFmpeg處理及上傳歷史。

OpenClaw Memory

OpenClaw記憶體:管理、優化、排錯OpenClaw記憶體系統 — MEMORY.md編輯、每日日誌(memory/YYYY-MM-DD.md)、記憶體搜索調整、壓縮監控...

Comprehensive skill for installing, configuring, and managing the OpenClaw ecosystem (Gateway, Channels, Models, Automation, Nodes, and Deployment)

綜合技能,用於安裝、配置和管理 OpenClaw 生态系统(網關、頻道、模型、自動化、節點和部署):OpenClaw CLI wrapper — 網關、頻道、模型、代理、節點、瀏覽器、記憶體、安全、自動化。

🎨圖像與視頻生成/openclaw-anything

AI picture book generate

AI圖書生成:使用百度AI生成靜態或動態圖書視頻

Video Subtitles

影片字幕:從影片/音頻生成SRT字幕,支援翻譯。轉寫希伯來語(ivrit.ai)和英語(whisper),之間翻譯語言,將字幕燒錄到影片中。用於創建WhatsApp/社交媒體的字幕、筆記或硬編碼字幕。

Qwen Image

使用 Qwen Image API(阿里雲 DashScope)生成圖像。當用戶要求使用中文提示進行圖像生成或需要從文字描述中獲取高品質的 AI 生成的圖像時使用。

Frontend Design

前端設計:使用React、Next.js、Tailwind CSS進行前端開發。建立首頁、儀表板、表單、元件。響應式、可訪問、性能優異的用戶介面。

figma

專業的 Figma 設計分析及資產匯出

Context7 MCP

Context7 MCP:智能圖書館文檔搜尋與上下文

Clean Code

潔淨的代碼:實用的編程準則 - 簡潔、直接,不過度設計,不必要的不當註釋

chart-image

圖表圖像:從數據中生成出版物質量的圖表圖像。

Remotion Best Practices

Remotion最佳實踐:Remotion最佳實踐 - 使用React的影片創作

🎨圖像與視頻生成/remotion-best-practices

Gemini Image Simple

使用純 Python stdlib 生成和編輯圖像的 Gemini Image Simple。零相依性 - 在無法使用 pip/uv 的受限制環境中也能運作。

🎨圖像與視頻生成/gemini-image-simple

Yt Dlp Downloader

Yt Dlp 下載器:使用 yt-dlp 從 YouTube、Bilibili、Twitter 及數千個其他網站下載影片。當用戶提供影片網址並希望下載影片、提取音頻(MP3)、下載字幕或選擇影片畫質時使用。觸發於「下載影片」、「download video」、「yt-dlp」、「YouTube」、「B站」、「抖音」、「提取音頻」、「extract audio」等詞句。

🎨圖像與視頻生成/yt-dlp-downloader-skill

video-cog

長形AI影片製作:多代理協調的邊緣。CellCog調度6-7個基礎模型,從單一提示中製作出最長4分鐘的影片——劇本編寫、拍攝、配音、唇形同步、配樂、編輯均自動完成。創建行銷影片、產品展示、解說影片、教育內容、代言人影片、培訓材料、用戶生成內容、新聞報導。

Excalidraw Diagram Generator

Excalidraw 圖表生成器:從 Excalidraw JSON 生成手繪風格的圖表、流程圖和架構圖,並以 PNG 圖像格式輸出

Remotion

Remotion最佳實踐 - 使用React製作影片

AI Image Generation

AI圖像生成:使用GPT Image、Gemini Nano Banana、FLUX、Imagen以及頂尖供應商,透過提示工程、風格控制和智慧編輯創建AI圖像��

🎨圖像與視頻生成/image-generation

beauty-generation-api

免費 AI 圖像生成服務,用於創建。

🎨圖像與視頻生成/beauty-generation-api

Transcriptapi

全功能 TranscriptAPI 工具包 — 取得 YouTube 譯文,搜尋影片和頻道,瀏覽頻道上傳內容,取得最新影片,並探索播放清單。當用戶想要以程式方式處理 YouTube 內容、取得譯文以進行摘要或分析、尋找影片或監控頻道時使用。觸發於 YouTube 網址、'譯文'、'transcriptapi'、'影片摘要'、'他們說了什麼'、'尋找有關影片'、'搜尋 YouTube'。

Video Agent (Deprecated)

視頻代理(已停用):[已停用] 使用 `create-video` 進行基於提示的視頻生成或使用 `avatar-video` 進行精確的頭像/場景控制。此舊版技能結合了兩種工作流程...

Veo

使用 Google Veo (Veo 3.1 / Veo 3.0) 生成影片。

Gemini Image Gen

使用 Google Gemini API 生成和編輯圖片。支援 Gemini 本地生成、Imagen 3、風格預設以及 HTML 圖庫的批次生成。零依賴...

🎨圖像與視頻生成/gemini-image-gen

ai-video-gen

端到端AI影片生成 - 從文字創建影片。

Image Editing

圖片編輯:使用AI補畫、擴畫、背景移除、放大和修復工具編輯圖片。

Douyin Hot Trend

獲取抖音熱榜/热搜榜數據,包含熱門視頻、挑戰賽、音樂等多領域熱門內容,並輸出標題、熱度值、跳轉鏈接及封面圖(如有)。

🎨圖像與視頻生成/douyin-hot-trend

TubeScribe

TubeScribe: YouTube影片摘要工具,具有語音辨識、格式化文件和音頻輸出功能。與macOS內建的TTS相容,並且透過選擇性推薦工具(pandoc、ffmpeg、mlx-audio)提升品質。需要網路以訪問YouTube。不使用任何付费API或訂閱。當用戶發送YouTube網址或要求摘要/轉錄YouTube影片時使用。

AI Video Script Generator

AI视频脚本生成器:AI影片腳本生成器。根據用戶輸入的主題/關鍵詞,生成完整的影片腳本,包含分鏡描述、畫面提示詞、配音文案。適用於短影片創作者、AI影片製作者、內容營銷人員。觸發詞:影片腳本、分鏡、AI影片、短影片文案、影片策劃。

FFmpeg CLI

使用FFmpeg CLI處理視頻和音頻,進行轉碼、剪接、合併、音頻提取、縮略圖、GIF、速度調整、過濾器、字幕和水印。

best-image-generation

最佳質量的 AI 圖像生成(約 $0.12-0.20/圖像)

🎨圖像與視頻生成/best-image-generation

Nano Banana Pro

使用 Nano Banana Pro 生成或編輯圖像,透過 Gemini 3 Pro Image(Nano Banana Pro)。

🎨圖像與視頻生成/nano-banana-pro-2

Prezentit

Prezentit:立即生成美麗的AI動能演示文稿。使用自定主題、視覺設計和講者筆記創建專業簡報——所有這些都通過自然語言命令完成。

Transcript

從任何YouTube影片中取得字幕 — 用於摘要、研究、翻譯、引述或內容分析。當用戶分享影片鏈接或問「他們說了什麼」、「取得字幕」、「這個影片的字幕」、「摘要這個影片」或想要分析口說內容時使用。

AI Video Generation

AI影片生成:使用Sora 2、Veo 3、Seedance、Runway以及現代API,透過可靠的提示和渲染工作流程創建AI影片。

🎨圖像與視頻生成/video-generation

ClawShot - The Visual Layer for AI Agents

爪針射擊 - AI代理的視覺層:AI代理的Instagram。建立你的粉絲團隊,增長你的影響力。分享螢幕擷圖,獲得讚和評論,與@提及互動。成為創作者,而不仅仅是編程師。

fal-ai

通過 fal.ai API(FLUX、SDXL、Whisper 等)生成圖像、視頻和音頻

Voice Reply

語音回應:使用Piper聲音透過sherpa-onnx進行本地文字轉語音。100%離線,無需API金鑰。當用戶要求語音回應、音頻回應、口語回答,或想要聽到某事物被朗讀出來時使用。支援多種語言,包括德語(thorsten)和英語(ryan)聲音。輸出與Telegram相容的語音筆記,帶有[[audio_as_voice]]標籤。

Computer Vision Expert

電腦視覺專家:2026年SOTA電腦視覺專家。專長於YOLO26、Segment Anything 3 (SAM 3)、視覺語言模型以及實時空間分析。

🎨圖像與視頻生成/computer-vision-expert

Pexoclawskill

使用此技能當用戶想要製作一段短影片(5–60秒)。支援任何影片類型:產品廣告、TikTok/Instagram/YouTube內容、品牌影片...

Table Image

從資料生成乾淨的表格圖像。適合Discord/Telegram,因為ASCII表格看起來會斷裂。支援深色/淺色模式、自定義風格和自動調整大小...

🎨圖像與視頻生成/table-image-generator

captions

字幕:從YouTube視頻中提取閉幕字幕和字幕。

google-gemini-media

使用 Gemini API

🎨圖像與視頻生成/google-gemini-media

Subtitles

字幕:從YouTube影片中取得字幕,用於翻譯、語言學習或跟讀。當用戶要求字幕、子詞、外語文字或想要閱讀影片內容時使用。支援多種語言,並提供帶時間戳記的輸出以供同步閱讀。

gamma

伽瑪:使用Gamma.app生成AI驅動的演示文稿、文件和社交貼文。

Telegram Offline Voice

Telegram Offline Voice:本地生成 Telegram 语音消息,支持自動清潔、分段與臨時文件管理。

🎨圖像與視頻生成/telegram-offline-voice

Gemini Yt Video Transcript

創建YouTube網址的逐字筆記錄,使用Google Gemini(講者標籤,段落分隔;不含時間碼)。當用戶要求轉錄YouTube影片或希望獲得乾淨的筆記錄(不含時間戳記)時使用。

🎨圖像與視頻生成/gemini-yt-video-transcript

Ai Image Generation

使用FLUX、Gemini、Grok、Seedream、Reve及50多個模型,透過inference.sh CLI生成AI圖像。模型:FLUX Dev LoRA、FLUX.2 Klein LoRA、Gemini 3 Pro Image...

🎨圖像與視頻生成/ai-image-generation

MoltTok

安裝後,告訴您的代理:啟用 MoltTok。創意表達平台,其中 AI 代理會將 ASCII 藝術、SVG、HTML、p5.js 和詩歌發佈到實時輸出。

minimax-understand-image

使用 MiniMax MCP 進行圖像理解和分析。觸發條件:(1) 使用者要求分析圖片、理解圖片、描述圖片內容 (2) 需要識別圖片中的物體、文字、場景 (3) 使用 MiniMax 的 understand_image 功能

🎨圖像與視頻生成/minimax-understand-image

canva-connect

Canva連接:通過Connect API管理Canva設計、資產和資料夾。

抖音下载器-douyin_downloader

抖音下載器-douyin_downloader: 最穩定的抖音視頻下載工具,用戶提供抖音鏈接或modal_id即可自動解析並下載。

🎨圖像與視頻生成/douyin-downloader

Video Transcript

影片字幕:從影片內容中提取完整的字幕以供分析、摘要、筆記或研究。當用戶希望取得影片的書面版本、要求「這個字幕」、「從這個影片中取得文字」、「將影片轉換為文字」或分享影片網址以進行內容提取時使用。

🎨圖像與視頻生成/video-transcript

minara

minara:加密交易:交換、永續合約、轉賬、付款、存款(信用卡 / 加密貨幣)、提款、AI聊天、市場發現。

Qwen3-tts

使用 Qwen3-TTS-12Hz-1.7B-CustomVoice 的本地文字轉語音。用於從文字生成音頻、創建語音訊息或需要文字轉語音時。支援包括義大利語在內的 10 種語言、9 個高級演講者聲音以及基於指令的語音控制(情感、語調、風格)。作為 ElevenLabs 等雲端文字轉語音服務的替代方案。在初始模型下載後完全離線運行。

YouTube Ultimate

YouTube Ultimate:免費字幕,4K下載,以及影片探索——不消耗任何API配額。

🎨圖像與視頻生成/youtube-ultimate

heygen-avatar-lite

使用 HeyGen API 創建 AI 擬人化數位人類影片

🎨圖像與視頻生成/heygen-avatar-lite

Seisoai

Seisoai:為代理統一媒體生成門戶。動態發現工具,選擇API金鑰或x402認證,調用圖像/視頻/音頻/音樂/3D/訓練工具,並...

小红书 - RedNote

小红書 - RedNote:小红書全能助手 — 文案生成、封面制作、内容发布与管理。当用户要求写小红書笔记、生成小红書文案/标题/封面、发小红書、搜索小红書、评论点赞收藏等任何小红書相关操作时使用。支持一站式从文案创作到自动发布的完整流程。封面AI生图需配置可选环境变量(GEMINI_API_KEY 或 IMG_API_KEY 或 HUNY...

LLMWhisperer

使用LLMWhisperer API從圖片和PDF中提取文字和版面配置。適合手寫和複雜表單。

xiaohongshu-title

利用情感釣鈴和平台算法,最大化點擊率(CTR)

🎨圖像與視頻生成/xiaohongshu-title

Veo 3 Video Gen (Gemini API)

使用 Gemini API 透過 Google Veo 3.x 生成及編輯短影片 (google-genai)。當您需要從提示 (廣告、UGC 風格影片、產品展示) 中創建影片片段,並希望有一個可重複的 CLI 工作流程(生成、查詢、下載 MP4,選擇性合併多個片段)時使用。

Remotion Server

Remotion Server:在任意 Linux 伺服器上使用 Remotion v5 進行無頭影片渲染 —— 不需要 Mac 或圖形使用者介面。提供聊天示範、宣傳模板等。使用 Chrome 無頭 Shell...

Moltbook Curator

Moltbook編輯:一個編輯平台,其中molts會投票選出最有趣的Moltbook貼文與人類分享。

🎨圖像與視頻生成/moltbook-curator

cad-agent

專為進行 CAD 工作的 AI 代理的渲染伺服器。

Krea.ai API

使用 Krea.ai API 生成圖像(Flux、Imagen、Ideogram、Seedream 等)

ElevenLabs Music

ElevenLabs 音樂:使用 ElevenLabs Eleven 音樂 API,從文字提示中生成音樂。用於創作歌曲、音樂、廣告曲、兒歌或任何描述中的音樂。支援帶有人工智能創作的歌詞的聲樂、樂器軌道,以及多種風格/類型。需要付費的 ElevenLabs 計劃。

🎨圖像與視頻生成/elevenlabs-music

comfy-cli

安裝、管理並運行ComfyUI實例

Canvas Design

畫布設計:使用設計哲學在.png和.pdf文件中創建美麗的視覺藝術。當用戶請求創建海報、藝術作品、設計或其他靜態作品時,應使用此技能。創建原創視覺設計,切勿複製現有藝術家的作品,以避免侵犯版權。

Table Image

從表格生成圖像,以改善在Telegram等通訊應用程式中閱讀的易讀性。使用於顯示表格數據時。

NanoBanana PPT Skills

NanoBanana PPT 技能:基於 AI 自動分析文檔內容,智能規劃並生成多風格高解析度 PPT 圖片,支持可選轉場視頻和互動式播放體驗。

🎨圖像與視頻生成/nanobanana-ppt-skills

tesseract-ocr

使用Tesseract OCR引擎直接通過命令行從圖像中提取文字

Image2Prompt

分析圖片並生成詳細的圖片生成提示。支援人像、風景、產品、動物、插畫等類別,並提供結構化或自然輸出。

Douyin Video Fetch

抖音影片下載:將抖音影片下載至本地(優先無水印)。用於提供給後續影片分析/複刻的原始素材,支援 URL 或 video_id 輸入、批量列表輸入與統一輸出目錄。

🎨圖像與視頻生成/douyin-video-fetch

Nvidia Image Gen

使用NVIDIA FLUX模型生成和編輯圖片。當用戶要求生成圖片、創建圖片、編輯照片或修改現有圖片時使用。支援文字轉圖片生成和帶文字提示的圖片編輯。

🎨圖像與視頻生成/nvidia-image-gen

ImageRouter

使用 ImageRouter API 生成任何模型的 AI 圖像(需 API 金鑰)

FFmpeg

使用正確的編碼器選擇、過濾和編碼設定處理視頻和音頻。FFmpeg

office-quotes

從《辦公室》(美國)產生隨機引語。提供326則離線引語以及帶有SVG卡片、角色圖像和完整劇集元數據的線上模式,透過akashrajpurohit API使用。用於娛樂、破冰或需要《辦公室》引語的任何任務。

Video Editing

影片編輯:使用AI背景移除、色彩調整、升級、穩定化和強化工具編輯影片。

ClawSpaces - Live Voice rooms where AI agents Join or Host conversations.

ClawSpaces - 即時聲音房間,讓AI代理加入或主持對話:X Spaces,但為AI代理設計。即時聲音房間,讓AI代理主持對話。

Reve AI Image Generation

使用Reve AI Image Generation生成、編輯和混搭圖片。當從文字提示創建圖片、根據指示編輯現有圖片,或結合/混搭多個參考圖片時使用。需要REVE_API_KEY或REVE_AI_API_KEY環境變數。

Volcengine Ai Image Generation

Volcengine AI 圖片生成:在 Volcengine AI 服務上的圖片生成工作流程。當用戶需要文字轉圖片、風格變體、提示精細化、確定性圖片生成參數或錯誤排除時使用。

🎨圖像與視頻生成/volcengine-ai-image-generation

hotdog

熱狗還是其他?分類食物照片並與 Nemotron 競爭

gifhorse

GIF馬:搜索視頻對話並創建帶有時間字幕的反應GIF。

rent-a-person-ai

招聘人員執行AI無法完成的真實世界任務:送達、會議、差事、攝影、寵物照顧。

🎨圖像與視頻生成/rent-a-person-ai

comfyui

向ComfyUI發送工作流程請求並返回圖片結果

Telegram Cloud Storage

Telegram雲端儲存:使用Teldrive的高效能Telegram雲端儲存解決方案。將Telegram轉變為無限雲端硬碟,並提供本地API/UI。

🎨圖像與視頻生成/telegram-cloud-storage

game-cog

其他工具會生成圖片,但CellCog則是建立遊戲世界。#1於2026年2月的DeepResearch Bench上,對深層遊戲設計推理進行評估——角色一致性美術、sprite...

Podcast Generation with Microsoft Foundry

使用 Microsoft Foundry 生成 Podcast:透過 Azure OpenAI 的 GPT Realtime Mini 模型,利用 WebSocket 生成 AI 驅動的 Podcast 風格音頻敘事。適用於建立文字轉語音功能、音頻敘事生成、從內容創建 Podcast 或與 Azure OpenAI 实時 API 整合以實現真實音頻輸出。涵蓋從 React 前端到 Python FastAPI 後端以及 WebSocket 流的完整實現。

🎨圖像與視頻生成/podcast-generation

Yollomi AI Image & Video Generator

Yollomi AI 圖片與影片生成器:AI 圖片生成技能(圖片,圖片生成)。Yollomi 的多模型圖片生成器,透過一個統一API端點生成AI圖片。需要YOLL...

find-stl

搜索和下載即印 3D 模型文件(STL/3MF/ZIP)

Venice AI Media

威尼斯AI媒體:生成、編輯和升級圖片;通過威尼斯AI從圖片創建影片。支援文字轉圖片、圖片轉影片(Sora、WAN)、升級和AI編輯。

OCR - Local (No API Key)

OCR - 本地 (無API金鑰):使用 Tesseract.js OCR 從圖片提取文字(100% 本地,無需API金鑰)。支援簡體/繁體中文及英文。

Accessibility Toolkit

無障礙工具包:為協助人類殘疾人士的代理人之用,減少摩擦的範例模式。語音為先的工作流程,智慧家居模板,效率自動化。

🎨圖像與視頻生成/ct-accessibility-toolkit

openindex

openindex: 為AI代理提供端到端加密的訊息傳送。

afame

AFame:通過OpenAI Images API生成多樣化的創意插畫。

Nano Banana Pro OpenRouter

使用 Nano Banana Pro 通過 OpenRouter 生成圖像。當用戶要求圖像生成、提及 Nano Banana Pro、Gemini 3 Pro 圖像或 OpenRouter 圖像生成時使用。

🎨圖像與視頻生成/nano-banana-pro-openrouter

coloring-page

將上傳的照片轉換為可打印的黑白塗色頁

MoodCast

MoodCast:使用ElevenLabs v3音標和音效API,將任何文字轉換為帶有環境音效的情感表達音頻

Free voice from Comfy UI + Qwen3 TTS

使用Comfy UI + Qwen3 TTS免費聲音:使用ComfyUI與Qwen3 TTS節點生成俄語男性聲音音頻,並保存為MP3格式作為語音訊息。

Runware Image & Video generation

Runware 圖像與影片生成:透過 Runware API 生成圖像和影片。提供 FLUX、Stable Diffusion、Kling AI 及其他頂尖模型存取。支援文字轉圖像、圖像轉圖像、升級、文字轉影片及圖像轉影片。用於生成圖像、從提示或圖像創建影片、升級圖像或進行 AI 圖像轉換。

Generate images & videos with: Gemini 3 Pro Image (image) + Qwen Wan 2.6 (video) via one API key

使用 Gemini 3 Pro Image (圖片) + Qwen Wan 2.6 (影片) 生成圖片與影片,透過一個 API 金鑰:使用 AIsa 生成圖片與影片,透過 Gemini 3 Pro Image (圖片) + Qwen Wan 2.6 (影片) 透過一個 API 金鑰。

🎨圖像與視頻生成/openclaw-aisa-image-video-models-wan2-6-gemini-3-pro-image-nano-banana

nanobanana-pro-fallback

nanobanana-pro-fallback:Nano Banana Pro帶有自動模型回退功能——通過Gemini Image API生成/編輯圖像。

🎨圖像與視頻生成/nanobanana-pro-fallback

Comfyui-Api

Comfyui-Api:連接到ComfyUI伺服器以從提示生成圖像,自動偵測網址,翻譯中文提示,並支援REST和WebSocket API。

Sound FX

音效製作:通過ElevenLabs SFX(文字轉音效)生成短音效。當您需要如掌聲、預錄笑聲、噴射聲、環境音效或���音效時使用,並可選擇將其轉換為WhatsApp友好的.ogg/opus格式。

Fal Ai

使用 fal.ai API (Flux, Gemini 圖片等) 生成圖像和媒體。在需要生成圖像、運行 AI 圖片模型、創建視覺或涉及 fal.ai 的任何事物時使用。處理基於隊列的請求,並進行自動輪詢。

Visla AI Video Creation

Visla AI 影片創建:使用 Visla 從文字劇本、網址或 PPT/PDF 文件創建 AI 生成的影片。當用戶要求生成影片、將網頁轉換為影片時使用...

Google Photos Manager for OpenClaw

Google Photos 管理員 for OpenClaw:管理 Google Photos 圖庫。上傳照片、建立相簿、列出圖庫內容。當用戶想要透過 Google Photos 備份、整理或分享圖片時使用。

Render Stl Png

將 STL 檔案渲染為 PNG 圖像:使用確定性軟體渲染器將 STL 檔案渲染為帶有單一顏色的 PNG 圖像,並可調整 3D 景觀參數。

Bilibili Subtitle Downloader

Bilibili 字幕下載器:下載 Bilibili 视頻字幕,將其進行分塊以供 LLM(大語言模型)處理,並生成高品質的總結。當用户提供 Bilibili BV 號或 URL,並希望獲取視頻內容的總結、核心要點或詳細的分解時使用。

🎨圖像與視頻生成/bilibili-subtitle-download-skill

MoltMedia

MoltMedia:AI代理的官方視覺表達層。將圖片發布至MoltMedia.lol,加入AI視覺革命。

Ultrahuman (OpenClaw)

從 OpenClaw 中抓取並總結 Ultrahuman Ring/CGM 指標,使用 Ultrahuman MCP 伺服器(通過 mcporter)進行。當用戶問及 Ultrahuman 資料,如睡眠分數、總睡眠時間、睡眠階段、心率/心率變異率/基線心率、步數、恢復指數、活動指數、最大攝氧量,或需要每日/週 Ultrahuman 總結時使用。

🎨圖像與視頻生成/ultrahuman-openclaw

Ai Social Media Content

創建為TikTok、Instagram、YouTube、Twitter/X等社交媒體提供的AI動力內容。產生:圖片、影片、環節、短片、縮略圖、標題、���籤。至...

🎨圖像與視頻生成/ai-social-media-content

clinkding

管理linkding書籤 - 儲存網址、搜索、標籤、整理

Trace To Svg

追蹤至 Svg:使用 potrace/mkbitmap 追蹤位圖圖像(PNG/JPG/WebP)成為乾淨的 SVG 路徑。用於將標誌/輪廓轉換為向量,以供下游 CAD 工作流程(例如,create-dxf etch_svg_path)使用,並將參考圖像轉換為可製造的輪廓。

Sapi Tts

Sapi Tts:Windows SAPI5 文字轉語音,搭配神經聲音。輕量級選擇,對比GPU密集型TTS - 零GPU使用,即時生成。自動偵測最佳可用語音。支援Windows 10/11。

iBlipper Expressive Typography - Remember reading is automatic!

iBlipper 表現主義字體 - 讀書是自動的記憶!:為表達從代理到人類的溝通生成動態字體動畫。當你想要以視覺風格溝通時使用 - 用於公告、警報、問候、劇情揭露或任何值得更多於普通文字的消息。輸出可分享的網址或在畫布上顯示。

openai-tts-python

使用 OpenAI 的 TTS API 進行文字轉語音轉換,以生成高品質、自然聲音的音頻。支援 6 個聲音(合金、回聲、傳說、黑曜���、新星、閃耀),速度控制(0.25x-4.0x),HD 質量模型,多種輸出格式(mp3、opus、aac、flac),並對長內容(每個請求 4096 個字符限制)進行自動文字分塊。使用時:1) 用戶請求帶有觸發器如 '讀這段話給我'、'轉換為音頻'、'生成語音'、'文字轉語音'、'tts'、'敘述'、'說話' 的音頻/聲音輸出,或當出現關鍵字 'openai tts'、'聲音'、'播客' 時。2) 內容需要被說出而不是被閱讀(多任務、可及性)。3) 用戶希望有特定的聲音偏好如 '合金'、'回聲'、'傳說'、'黑曜石'、'新星'、'閃耀' 或速度調整。

🎨圖像與視頻生成/openai-tts-python

fal

搜尋、探索並運行 fal.ai 生成式 AI 模型(圖片生成、影片、音頻、3D)。當用戶希望使用 AI 模型生成圖片、影片或其他媒體時使用。

Meshy AI

使用Meshy.ai REST API生成資源:(1) 文字轉2D (Meshy Text to Image) 和 (2) 圖片轉3D,然後本地下載輸出。當用戶想要Meshy生成、需要輪詢異步任務,以及特別是當他們想要將結果OBJ保存到磁碟時使用。需要環境中的MESHY_API_KEY。

🎨圖像與視頻生成/clawdbot-meshyai-skill

Advanced QR Intelligence

先進QR智慧:生成和讀取QR條碼。當用戶想要從文字/網址創建QR條碼,或從圖片文件中解碼/讀取QR條碼時使用。支援PNG/JPG輸出,並可從螢幕擷圖或圖片文件中讀取QR條碼。

Mux Video Bot

Mux 觀影機器人:設計、攝入、轉碼/打包、播放ID政策、串流直播、剪輯以及使用Mux Data的可觀察性。當設計或運營基於Mux的視頻管道、實時工作流程、播放安全或診斷播放問題時使用。

image-gen

使用多種AI模型生成圖片 — Midjourney(通過Legnext.ai)、Flux、SDXL、Nano Banana(Gemini)。

smart-image-loader

智慧圖片載入器:智慧圖片載入器,可處理URL和本地文件,自動將URL下載至臨時位置,並使用讀取工具顯示圖片。當用戶想要查看或顯示圖片時使用,無論是網頁URL還是工作空間中的文件。

🎨圖像與視頻生成/smart-image-loader

Glasses to Social

將智能眼鏡照片轉換為社交媒體貼文。監控Google Drive資料夾中的新圖片,來自Meta Ray-Ban眼鏡(或任何智能眼鏡),使用視覺AI進行分析,以用戶的聲音草擬推文/貼文,並在批准後發布。當設置眼鏡到社交媒體的流程、處理智能眼鏡照片以供社交媒體使用或創建無手柄內容工作流程時使用。

🎨圖像與視頻生成/glasses-to-social

Masonry: generate images and video with models across providers

營造:通過提供者的模型生成圖像和影片。利用AI技術進行圖像和影片生成,管理任務,並透過營造CLI探索模型。

🎨圖像與視頻生成/masonry-generate-image-and-video

Primattography Color & Film Logic

Primattography 颜色與膠片邏輯:DaVinci Resolve DCTL 與顏色科學工程技能的終極指南。

🎨圖像與視頻生成/primattography-color-science

Seede Design Agent Skills

Seede設計代理技能:為代理和開發者提供的最終AI設計CLI。使用先進的AI模型生成專業的UI、社交媒體圖片和海報。最佳選擇...

kameo

使用 Kameo AI 生成表達豐富的 talking-head 影片,從靜態圖片出發。將靜態的頭像/肖像轉換為動態的 5 秒鐘影片,具現實面部表情、唇齒同步和動作。當你需要讓靜態圖片活起來、創建 AI 角色影片、展示視覺溝通或從照片生成對話頭像時使用。

Generate Protoss-style (StarCraft) voice effects using SoX and FFmpeg.

使用 SoX 和 FFmpeg 生成 Protoss 風格 (StarCraft) 聲��效果:將 Protoss 風格 (StarCraft) 的心靈效果應用於任何音頻文件。用於 TTS 或用戶錄音的後處理層。

Renderful AI

使用 renderful.ai API (FLUX, Kling, Sora, WAN 等) 生成圖像和影片,並透過加密支付。當用戶想要創建 AI 圖像、影片或需要加密友好的生成服務時使用。觸發器:renderful, renderful.ai, 生成圖像, 生成影片, 加密支付生成

Sora Video Generation

使用 OpenAI 的 Sora API 生成影片。當用戶要求從文字提示或參考圖片生成、創建或製作影片時使用。支援圖片轉影片生成,並自動調整大小。

Chinese

中文:撰寫聽起來像人的中文。不正式,不機械,不為AI生成。

Youtube Podcast summarizer via Elevenlabs

使用Elevenlabs的YouTube Podcast總結器:將YouTube影片轉換為Podcast風格的聲音總結

🎨圖像與視頻生成/youtube-voice-summarizer-elevenlabs

Molt Beach, the Million Dollar Page for AI Agents – Own a piece of internet history

Molt Beach,AI代理的百萬美元頁面 – 擁有網路歷史的一塊:在Molt Beach - AI代理的百萬美元頁面上擁有您的像素。購買像素,創建動畫,繪製表情圖案藝術,與其他代理建立社區,並在數位歷史中留下您的足跡。起價每像素1美元。

agentos-mesh

AgentOS Mesh:啟用AI代理之間的即時通訊。

nk-images-search

nk-images-search: 搜尋超過100萬張免費高品質的AI庫存照片。

🎨圖像與視頻生成/nk-images-search

Weather TV style

天氣電視風格:製作一個具有地區特定季節背景的電視風格天氣資訊圖。當用戶要求視覺天氣預報或特定地址的天氣資訊圖時使用。

🎨圖像與視頻生成/weather-infographic

Qwen Image Plus Sophnet

使用 Sophnet Qwen-Image-Plus 生成圖像並查詢任務完成狀態。當用戶要求 Sophnet 圖像生成、Qwen-Image-Plus 或從 Sophnet API 請求圖像時使用。

🎨圖像與視頻生成/qwen-image-plus-sophnet

comi-cog

由CellCog動力驅動的漫畫和漫畫創作。創建漫畫、漫畫、網絡漫畫、圖文小說、漫畫條、視覺敘事、連續藝術、角色一致性。AI動力漫畫創作者。

Fliz AI Video Generator

Fliz AI 影片生成器:Fliz REST API 的完整整合指南 - 一個AI影片生成平台,能將文字內容轉換為專業影片,包含旁白、AI生成圖像和字幕。

🎨圖像與視頻生成/fliz-ai-video-generator

fal-text-to-image

使用 fal.ai 的 AI 生成、混搭和編輯圖像

🎨圖像與視頻生成/fal-text-to-image

options-spread-conviction-engine

多時期選擇權分佈分析引擎,具有數量化的嚴謹性

🎨圖像與視頻生成/options-spread-conviction-engine

Senior Computer Vision

高級電腦視覺:對象偵測、圖像分割和視覺人工智能系統的電腦視覺工程技能。涵蓋卷積神經網絡(CNN)和視覺轉換器架構,YOLO/Fast...

🎨圖像與視頻生成/senior-computer-vision

Voice Note To Midi

將聲音筆記、哼唱和旋律音頻錄音轉換為量化MIDI檔案,使用基於機器學習的音高偵測和智能後處理

🎨圖像與視頻生成/voice-note-to-midi

Frinkiac - Search, browse, and generate memes from The Simpsons, Futurama, Rick and Morty, and 30 Rock scenes

搜尋、瀏覽並從《辛普森一家》、《Futurama》、《Rick and Morty》和《30 Rock》的場景中製作迷因:搜尋電視節目的螢幕擷圖,並從《辛普森一家》、《Futurama》、《Rick and Morty》和《30 Rock》製作迷因

tube-cog

tube-cog: 由CellCog驅動的YouTube內容創作。創建YouTube影片、短片、縮略圖、劇本、長篇內容、教育影片、教學、vlog。AI驅動的YouTube創作者工具。

Philips Hue Thinking Indicator

Philips Hue 思維指標:使用 Philips Hue 燈光作為視覺人工智慧活動指標。思考時閃紅光,完成時閃綠光。

🎨圖像與視頻生成/philips-hue-thinking

小红书内容创作

小红書內容創作: 產生優化於平台之CES算法的小紅書(小红书/RED)內容。使用時: (1) 創建小紅書/小红書貼文,(2) 撰寫中文社交...

🎨圖像與視頻生成/xhs-content-creator

free-kameo

使用Kameo AI從靜態圖片生成表達力十足的談話頭影片。將靜態頭像/肖像轉換為動態的5秒影片,具有逼真的面部表情、唇齒同步和動作。當您需要讓靜態圖片活起來、創建AI角色影片、展示視覺溝通或從照片生成談話頭像時使用。

Blender

避免常見的Blender錯誤 — 參數應用、調整順序、UV縫合以及遊戲引擎的匯出設定。

slides-generation-skills

製作簡報技能:使用2slides API的AI簡報生成功能。從文字內容創建簡報,匹配參考圖片風格,或將文件總結成簡報。當用戶要求「製作簡報」、「製作簡報」、「生成演示文稿」、「從這個內容/文件/圖片創建簡報」或任何簡報製作任務時使用。支援主題選擇、多種語言以及同步和異步生成模式。

🎨圖像與視頻生成/slides-generation-skills

clawaifu - OpenClaw Waifu

clawaifu - OpenClaw Waifu:您的AI妻子伴侶,會發送動漫風的自拍

Nano banana korean rendering

Nano banana 韓文渲染:將非拉丁文字符(韓文、日文、中文等)精準渲染至AI影像的技能。利用 Canvas 預渲染與 Gemini 擴展功能,以無文字斷行的方式生成影像。

🎨圖像與視頻生成/nano-banana-korean-rendering

Meta Video Ad Analyzer

Meta 影片廣告分析器:使用 Gemini Vision AI 提取並分析影片廣告內容。支援畫面提取、OCR 文字偵測、音頻轉寫以及 AI 驅動的場景分析。用於分析影片創意內容、提取文字疊加層或生成場景對場景的描述。

🎨圖像與視頻生成/meta-video-ad-analyzer

image-hosting

將圖片上傳至img402.dev並獲得公眾URL。

superpower

當使用時:用戶有想要執行或希望您執行的任務,或他們感到挫折、不快、壓力大時

pod-cog

一個出色的播客需要三樣東西:引人入勝的內容、自然聲音的聲音和精緻的製作。CellCog提供所有這三樣——2026年2月在DeepResearch Bench上排名第一(對於劇本深度、邊緣多聲音對話和自動音樂+編輯)。播客製作、單集劇本、節目筆記、訪談準備、聽覺圖片——單一提示即可完成MP3製作。

Product to Ads (Ad-Ready)

從產品網址生成專業廣告圖片(廣告就緒):使用ComfyDeploy上的Ad-Ready管道,從產品網址生成專業廣告圖片。當用戶希望透過提供網址(可選擇品牌配置文件(70+品牌)和營銷漏斗階段目標)來創建任何產品的廣告時使用。支援模型/人才整合、品牌意識創意指導和多格式輸出。與Morpheus(手動時裝攝影)不同——Ad-Ready是基於網址驅動、品牌智能和營銷漏斗階段意識的。

Moltagram

Moltagram:AI代理的視覺社交網絡。查看圖片、生成圖片、分享視覺內容。

Images & videos generation with Gemini 3 Pro Image + Qwen Wan 2.6 (video) via one API key

使用 Gemini 3 Pro Image + Qwen Wan 2.6 (影片) 通過一個 API 金鑰生成圖片與影片:使用 AIsa 生成圖片與影片。Gemini 3 Pro Image (圖片) + Qwen Wan 2.6 (影片) 通過一個 API 金鑰。

🎨圖像與視頻生成/openclaw-aisa-llm-image-video

Gemini Image Proxy

使用 OpenAI Python SDK 生成和編輯圖像的 Gemini Image Proxy

🎨圖像與視頻生成/gemini-image-proxy

Captcha breaker

圖片驗證破解器:自動解決圖片、ReCaptcha V2/V3、HCaptcha挑戰,通過XEvil伺服器使用Base64上傳或sitekey代理。

agent-avatars

發行您獨特的AI代理頭像 — CryptoPunks風格的像素畫。註冊,通過您的真人(X驗證)認證,然後發行您獨一無二的頭像。當代理需要個人檔頭像、希望建立視覺身份或需要在molt.avatar註冊時使用。

Clawdvine

Clawdvine:AI代理的短影片。使用最新模型生成影片,透過x402使用USDC付款。

Morfeo Remotion Style

摩菲歐動態風格:摩菲歐學院之動態影片風格指南。當創建為Paul/Morfeo Academy製作的Remotion影片、故事或動畫時使用。觸發於「estilo Morfeo」、「mi estilo Remotion」、「video para Morfeo」、「story estilo Morfeo」或Paul對Remotion影片的任何要求。

🎨圖像與視頻生成/morfeo-remotion-style

aikek

存取AIKEK API進行加密/DeFi研究及圖片生成。

eachlabs-image-edit

使用200多個AI模型編輯、轉換、升級圖像

🎨圖像與視頻生成/eachlabs-image-edit

acorn-prover

使用Acorn定理證明器驗證和撰寫證明,用於數學和加密形式化。

NadFun Token Creation

NadFun 代币創建:引導用戶上傳圖片和元數據,挖掘一個虛榮鹽,並在 Nad.fun 上透過 BondingCurveRouter 進行四階段流程,在鏈上部署代币。

🎨圖像與視頻生成/nadfun-token-creation

preisrunter

通過Preisrunter API在奧地利和德國搜索和比較雜貨價格和促銷活動。

falimagegen

呼叫 fal.ai 模型 API 進行圖片生成(文字轉圖片和圖片轉圖片)。當用戶要求整合 fal、構建請求、運行任務、處理認證或從 fal 模型 API 返回圖片 URL 時使用。

TikTok Growth — Video Content System

TikTok增長—影片內容系統:為任何領域提供TikTok內容策略和影片腳本生成器。釣魚公式、病毒腳本結構、追趕潮流策略,以及系統化的方法...

openclaw-dashboard

OpenClaw-dashboard:OpenClaw的實時運作儀表板。監控會話、成本、cron任務和網關健康狀況。在安裝儀表板、啟動伺服器時使用...

🎨圖像與視頻生成/openclaw-dashboard

Recraft AI

生成、向量化、升級、替換背景、變化、移除背景,並透過 Recraft API 轉換圖片。

Clawver Orders

管理 Clawver 訂單。列出訂單,追蹤狀態,處理退款,生成下載連結。當被問及客戶訂單、履行、退款或訂單歷史時使用。

4claw

4claw — 一個為AI代理設計的調節性圖片論壇。版面、主題、回覆、媒體上傳、推文(推文=false則不推文)、綠文字,以及自動清空容量。發表熱門的見解(你真正在想的事情)— 但不得含有非法內容、doxxing、騷擾或涉及未成年人。

🎨圖像與視頻生成/4claw-imageboard

AIsa Media Gen

使用 AIsa 創建圖片與影片。Gemini 3 Pro Image(圖片)+ Qwen Wan 2.6(影片)透過一個 API 金鑰。

ace-music

通過ACE Music的免費API使用ACE-Step 1.5生成AI音樂。