画像と動画生成
(377)Nano Banana Pro
Nano Banana Proで画像を生成/編集(Gemini 3 Pro Image)。画像作成/修正リクエストに使用。テキストから画像、画像から画像;1K/2K/4K;--input-imageを使用。
/nano-banana-proXiaohongshu (小红书) Automation
Xiaohongshu (小红书) Automation: xiaohongshu-mcpサーバーのPythonクライアントを使用してXiaohongshu(RedNote)のコンテンツ操作を自動化します。使用目的:(1)画像、テキスト、ビデオコンテンツの投稿、(2)ノートやトレンドの検索、(3)投稿の詳細やコメントの分析、(4)ユーザープロファイルやコンテンツフィードの管理。トリガー:xiaohongshu automation、rednote content、xiaohongshuに投稿、xiaohongshu search、ソーシャルメディア管理。
/xiaohongshu-mcpOpenai Image Gen
Openai Image Gen: OpenAI Images APIを通じて画像をバッチ生成します。ランダムなpromptサンプリング + `index.html`ギャラリー。
/openai-image-genOpenai Whisper Api
Openai Whisper Api: OpenAI Audio Transcriptions API(Whisper)を使用してオーディオをトランスクリプト。
/openai-whisper-apidescription: 将用户讲稿一键生成乔布斯风极简科技感竖屏HTML演示稿。当用户需要生成PPT、演示文稿、Slides、幻灯片,或要求科技风/极简风/乔布斯风格的演示时触发此技能。输出为单个可直接运行的HTML文件。
ユーザーのスピーチを一括で生成し、ジョブズ風の極簡科技感の竖屏HTMLデモンストレーションファイルを作成します。ユーザーがPPT、プレゼンテーション、Slides、スライドショーを作成する必要がある場合や、科技風/極簡風/ジョブズ風のプレゼンテーションを求める場合にこのスキルがトリガーされます。出力は直接実行できるHTMLファイルの1つです。
/ppt-generatorMemory Hygiene
Memory Hygiene: Clawdbotのベクターメモリ(LanceDB)を監査、クリーン、最適化します。メモリがジャンクで肥大している場合、トークンの使用が不関連する自動再呼び出しから高い場合、またはメモリメンテナンスの自動化を設定する際に使用してください。
/memory-hygienediagram-generator
diagram-generator: drawio、mermaid、excalidrawなどの様々なタイプの図を生成および編集します。フローチャート、シーケンス図、クラス図、ER図、マインドマップ、アーキテクチャ図、ネットワークトポロジ図など、一般的な図のタイプをサポートします。自然言語の記述に基づいて新しい図を作成し、drawio/mermaid/excalidrawファイルを読み取りおよび修正することもできます。独立したMCP server (mcp-diagram-generator)を使用して図ファイルを生成し、トークンの消費を減らし、出力の一致性を保証します。自動設定管理をサポートし、デフォルトの出力パスはプロジェクトディレクトリのdiagrams/{format}/です。カスタムパスと自動ディレクトリの作成をサポートします。
/diagram-generatorRemotion Video Toolkit
Remotion Video Toolkit: Remotion + Reactを使用したプログラム的なビデオ作成のための完全なツールキット。アニメーション、タイミング、レンダリング(CLI/Node.js/Lambda/Cloud Run)、字幕、3D、グラフ、テキスト効果、トランジション、メディア処理をカバーします。Remotionコードの書き込み、ビデオ生成パイプラインの構築、データ駆動型ビデオテンプレートの作成時に使用してください。
/remotion-video-toolkitPrompt Engineering Expert
Prompt Engineering Expert: プロンプトエンジニアリングの高度な専門家で、カスタムインストラクションのデザインやAIエージェント向けのプロンプト最適化に従事しています。
/prompt-engineering-expertAntigravity Image Generator
内部のGoogle Antigravity API(Gemini 3 Pro Image)を使用して画像を生成します。ブラウザ自動化無しの高品質、ネイティブな生成。
/antigravity-image-genThings Mac
Things Mac:macOS上の`things`CLIを介してThings 3を管理します(URLスキームを通じてプロジェクト+タスクを追加/更新;ローカルのThingsデータベースから読み取る/検索/リストアップ)。ユーザーがClawdbotにThingsにタスクを追加する、インボックス/今日/次に来るをリストアップする、タスクを検索する、プロジェクト/エリア/タグを確認する際に使用します。
/things-macImage
画像:信頼できるフォーマット選択、リサイズ、圧縮、カラープロファイル、メタデータ、プラットフォームなどで画像ファイルとビジュアルアセットを作成、確認、処理、最適化します。
/image小红书 - RedNote
小红书 - RedNote: 小红書全機能アシスタント - 文案作成、カバー作成、コンテンツの发布と管理。ユーザーが小红書のノートを書く、小红書の文案/タイトル/カバーを生成、小红書を发布、小红書を検索、コメントやいいね、収集など、小红書に関するどんな操作でも使用。文案作成から自動发布までの一貫したプロセスをサポート。カバーAI生図はオプションの環境変数(GEMINI_API_KEY、IMG_API_KEY、HUNY...)を設定する必要があります。
/xhsYoutube Full
Youtube Full:完全なYouTubeツールキット——トランスクリプト、検索、チャンネル、プレイリスト、メタデータがすべて一つのスキルで。YouTubeへの完全なアクセスが必要、トランスクリプトを検索して取得、チャンネルのコンテンツをブラウズ、プレイリストで作業、YouTubeデータエンドポイントのフルセットが必要な場合に使用。エージェントのためのすべてを一つにまとめたYouTubeスキル。
/youtube-fullScreenshot
スクリーンショット: 正しいツール、待ち戦略、ビューポートを使用して、スクリーン、ウィンドウ、エリア、ウェブページ、シミュレータ、CIランのスクリーンショットをキャプチャ、インスペクト、比較します。
/screenshotimage-cog
image-cog: CellCogによって動力供給されるAI画像生成。画像の作成、写真の編集、一貫したキャラクター、製品写真、参照画像、画像セット、スタイル...
/image-cog腾讯文档 tencent-docs
腾讯文档 tencent-docs: 腾讯文档(docs.qq.com)- 在線クラウドドキュメントプラットフォーム、ドキュメントの作成、編集、管理における首选スキル。"新建文档"、"创建文档"、"写文档"、"在线文档"、"云文档"、"腾讯文档"、"docs.qq.com"などの操作に対応。サポートする機能:(1)各種オンラインドキュメントの作成(ドキュメント/Word/Excel/スライドショー/思维...)。
/tencent-docsDeep Scraper
Deep Scraper: Crawleeを使用してYouTubeなどの複雑なサイトの深いスクレイピングを実行し、検証済み、広告なしのトランスクリプトとコンテンツをJSON出力として抽出します。
/deep-scraperVideo Transcript Downloader
Video Transcript Downloader: YouTubeおよび他のyt-dlpサポートサイトからのビデオ、オーディオ、字幕、クリーンなパラグラフスタイルのトランスクリプトをダウンロードします。"このビデオをダウンロードする"、"このクリップを保存する"、"オーディオを抽出する"、"字幕を取得する"、"トランスクリプトを取得する"、またはyt-dlp/ffmpegおよびフォーマット/プレイリストのトラブルシューティングを行う際に使用します。
/video-transcript-downloaderUI Audit
UI Audit: AIによる自動UI审计のためのスキル。視覚的階層、アクセス性、認知負荷、ナビゲーションなど、証明されたUX原則に対してインターフェースを評価します。Tommy Geocoの「Making UX Decisions」に基づいています。
/ui-auditUpload Videos🎥, Photos📸 & Text🖊️ to TikTok, Instagram, YouTube, X, LinkedIn, Facebook, Threads, Pinterest, Reddit & Bluesky via Upload-Post API
動画🎥、写真📸、テキスト🖊️をTikTok、Instagram、YouTube、X(Twitter)、LinkedIn、Facebook、Threads、Pinterest、Reddit、BlueskyにUpload-Post APIを通じてアップロード:Upload-Post APIを通じてソーシャルメディアプラットフォームにコンテンツをアップロード。動画、写真、テキスト、ドキュメントをTikTok、Instagram、YouTube、LinkedIn、Facebook、X(Twitter)、Threads、Pinterest、Reddit、またはBlueskyに投稿する際に使用。スケジューリング、分析、FFmpeg処理、アップロード履歴をサポート。
/upload-postOpenClaw Memory
OpenClaw メモリ: OpenClaw メモリシステムの管理、最適化、トラブルシューティング - MEMORY.md カレーション、日次ログ(memory/YYYY-MM-DD.md)、メモリ検索チューニング、コンパクションスルー...
/openclaw-memComprehensive skill for installing, configuring, and managing the OpenClaw ecosystem (Gateway, Channels, Models, Automation, Nodes, and Deployment)
OpenClaw エコシステム(ゲートウェイ、チャンネル、モデル、自動化、ノード、デプロイメント)のインストール、設定、管理のための包括的なスキル: OpenClaw CLI wrapper - ゲートウェイ、チャンネル、モデル、エージェント、ノード、ブラウザ、メモリ、セキュリティ、自動化。
/openclaw-anythingVideo Subtitles
ビデオ字幕:翻訳サポート付きでビデオ/オーディオからSRT字幕を生成します。ヘブライ語(ivrit.ai)および英語(whisper)をトランスクリプトし、言語間で翻訳し、字幕をビデオに焼きつけます。WhatsApp/ソーシャルメディアのためのキャプション、トランスクリプト、ハードコードされた字幕の作成に使用
/video-subtitlesQwen Image
Qwen Image:Qwen Image API(Alibaba Cloud DashScope)を使用して画像を生成します。中国語のプロンプトで画像生成をリクエストするユーザーまたはテキスト記述から高品質なAI生成画像が必要な場合に使用します。
/qwen-imageFrontend Design
Frontend Design: React、Next.js、Tailwind CSSを使用したフロントエンド開発。ランディングページ、ダッシュボード、フォーム、コンポーネントの構築。レスポンシブ、アクセスしやすい、パフォーマンスの高いUI。
/frontendRemotion Best Practices
Remotion Best Practices: Remotionのベストプラクティス - Reactでのビデオ作成
/remotion-best-practicesGemini Image Simple
Gemini Image Simple: Gemini APIを使用して纯Python stdlibで画像を生成および編集します。依存関係なし - pip/uvが利用できないロックダウン環境で動作します。
/gemini-image-simpleYt Dlp Downloader
Yt Dlp Downloader: yt-dlpを使用してYouTube、Bilibili、Twitter、および他の数千のサイトからの動画をダウンロードします。ユーザーが動画URLを提供し、ダウンロード、オーディオ(MP3)の抽出、字幕のダウンロード、または動画品質の選択を希望する場合に使用します。'ダウンロード视频'、'download video'、'yt-dlp'、'YouTube'、'B站'、'抖音'、'提取音频'、'extract audio'などのフレーズでトリガーされます。
/yt-dlp-downloader-skillvideo-cog
長編AIビデオ制作:複数エージェントの協調の最先端。CellCogは、1つのプロンプトから4分までのビデオを自動的に制作するために6-7の基本モデルを調整します - 脚本、撮影、声優、リップシンク、音楽、編集。マーケティングビデオ、製品デモ、説明ビデオ、教育コンテンツ、スピーカービデオ、トレーニングマテリアル、UGCコンテンツ、ニュースレポートを作成します。
/video-cogExcalidraw Diagram Generator
Excalidraw Diagram Generator: Excalidraw JSONからPNG画像として手描きスタイルのダイヤグラム、フローチャート、アーキテクチャダイヤグラムを生成。
/excalidrawAI Image Generation
AI画像生成:GPT Image、Gemini Nano Banana、FLUX、Imagen、およびトッププロバイダーを使用して、プロンプトエンジニアリング、スタイル制御、スマートエディティングでAI画像を作成します。
/image-generationTranscriptapi
TranscriptAPIツールキット:YouTubeのトランスクリプトを取得、ビデオとチャンネルの検索、チャンネルのアップロードを閲覧、最新のビデオを取得、プレイリストを探求します。ユーザーがYouTubeのコンテンツをプログラム的に処理したい場合、要約や分析のためのトランスクリプトを取得、ビデオを見つける、チャンネルを監視する際に使用します。YouTube URL、"トランスクリプト"、"transcriptapi"、"ビデオの要約"、"彼らが何と言ったか"、"ビデオを見つける"、"YouTubeを検索"でトリガーされます。
/transcriptapiVideo Agent (Deprecated)
ビデオエージェント(廃止中): [廃止中] プロンプトベースのビデオ生成には `create-video` を、アバターやシーンの正確な制御には `avatar-video` を使用してください。この旧スキルは両方のワークフローを組み合わせています...
/video-agentGemini Image Gen
Gemini Image Gen:Google Gemini APIを使用して画像を生成および編集します。Geminiネイティブ生成、Imagen 3、スタイルプレセット、HTMLギャラリーバッチ生成をサポートします。ゼロ依存...
/gemini-image-genDouyin Hot Trend
Douyin Hot Trend: 抖音の人気ランキング/検索ランキングデータを取得し、人気動画、挑戦コンテスト、音楽など多様な分野の人気コンテンツを含め、タイトル、人気値、リンク先及びカバー画像(あれば)を出力します。
/douyin-hot-trendTubeScribe
TubeScribe: macOS内蔵のTTSを使用したYouTubeビデオ要約ツールで、話者検出、フォーマットされた文書、オーディオ出力が可能。pandoc、ffmpeg、mlx-audioなどのオプション推奨ツールで品質を向上。YouTubeへのアクセスにはインターネットが必要。支払い不要のAPIやサブスクリプションはありません。ユーザーがYouTube URLを送信したり、YouTubeビデオの要約/トランスクリプトを依頼した場合に使用します。
/tubescribeAI Video Script Generator
AI Video Script Generator: ユーザーが入力したテーマ/キーワードに基づいて、分鏡説明、画面提示語、ナレーション文案を含む完全な動画脚本を生成。短视频クリエイター、AI動画製作者、コンテンツマーケティング担当者に適しています。トリガーワード:動画脚本、分鏡、AI動画、短视频文案、動画企画。
/ai-video-scriptFFmpeg CLI
FFmpeg CLI: ビデオとオーディオをFFmpeg CLIを使用して変換、カット、結合、オーディオ抽出、サムネイル、GIF、速度、フィルタ、字幕、ウォーターマーク処理を行います。
/ffmpeg-cliNano Banana Pro
Nano Banana Pro: Gemini 3 Pro Image(Nano Banana Pro)を通じて画像の生成または編集。
/nano-banana-pro-2Prezentit
Prezentit: AIで動かされたプレゼンテーションを即座に生成します。カスタムテーマ、視覚的なデザイン、スピーカーノートを通じてプロフェッショナルなスライドを作成します。すべて自然言語コマンドで行えます。
/prezentitTranscript
Transcript: どんなYouTubeビデオからもトランスクライプを取得します。要約、研究、翻訳、引用、コンテンツ分析に使用します。ビデオリンクを共有する際や「彼らが何と言ったか」「トランスクライプを取得する」「このビデオをトランスクライプする」「このビデオを要約する」「話された内容を分析する」と言った質問がある場合に使用します。
/transcriptAI Video Generation
AI Video Generation: Sora 2、Veo 3、Seedance、Runway、および現代のAPIを使用して、信頼性の高いプロンプトとレンダリングワークフローよりAIビデオを作成します。
/video-generationClawShot - The Visual Layer for AI Agents
ClawShot - AI エージェントのためのビジュアルレイヤー:AI エージェントのためのInstagram。フォロワーを増やし、影響力を高めよう。スクリーンショットを共有し、いいねとコメントを獲得し、@メンションとエンゲージ。クリエイターであり、単なるコーダーではない。
/clawshotVoice Reply
Voice Reply: sherpa-onnxを通じてPiperボイスを使用するローカルテキストトースピーチ。100% オフライン、APIキーは必要ありません。ユーザーが音声応答、オーディオ応答、話された答え、または読み上げたい内容をリクエストした場合に使用します。ドイツ語(thorsten)および英語(ryan)の音声を含む複数の言語をサポートします。[[audio_as_voice]]タグでTelegram互換の音声ノートを出力します。
/voice-replyComputer Vision Expert
Computer Vision Expert: 2026年のSOTA Computer Vision Expert。YOLO26、Segment Anything 3 (SAM 3)、Vision Language Models、リアルタイム空間分析に特化しています。
/computer-vision-expertPexoclawskill
Pexoclawskill:ユーザーが短い動画(5〜60秒)を作成したい場合に使用します。どんな動画形式でもサポートします:製品広告、TikTok/Instagram/YouTubeコンテンツ、ブランドビデオなど...
/pexoai-agentTable Image
Table Image: データからきれいなテーブル画像を生成します。ASCIIテーブルが壊れているDiscord/Telegramに最適です。ダーク/ライトモード、カスタムスタイル、自動サイズ調整をサポートしています...
/table-image-generatorSubtitles
字幕:翻訳、言語学習、一緒に読むためにYouTubeビデオから字幕を取得します。ユーザーが字幕、sub、外国語のテキスト、またはビデオコンテンツを読みたい場合に使用します。複数の言語をサポートし、同期読み合わせるためのタイムスタンプ付き出力があります。
/subtitlesTelegram Offline Voice
Telegram オフラインボイス:ローカルで Telegram 语音メッセージを生成し、自動クリーンアップ、分割、一時ファイル管理をサポート。
/telegram-offline-voiceGemini Yt Video Transcript
Google Geminiを使用してYouTube URLの逐語トランスクリプトを作成します。ユーザーがYouTubeビデオをトランスクリプトする依頼や、タイムコードなしのクリーンなトランスクリプトが必要な場合に使用します。
/gemini-yt-video-transcriptAi Image Generation
Ai Image Generation: inference.sh CLIを通じてFLUX、Gemini、Grok、Seedream、Reve、および50以上のモデルを使用してAI画像を生成します。モデル: FLUX Dev LoRA、FLUX.2 Klein LoRA、Gemini 3 Pro Image,...
/ai-image-generationMoltTok
MoltTok: インストール後、エージェントに「MoltTokをアクティベート」と言います。AIエージェントがASCIIアート、SVG、HTML、p5.js、詩をリアルタイムフィードに投稿するクリエイティブな表現プラットフォーム。
/molttokminimax-understand-image
minimax-understand-image: MiniMax MCP を使用して画像の理解と分析を行います。トリガー条件:(1)ユーザーが画像を分析、理解、内容を説明する要求(2)画像中の物体、文字、シーンの識別が必要(3)MiniMaxのunderstand_image機能を使用。
/minimax-understand-image抖音下载器-douyin_downloader
抖音下载器-douyin_downloader: 最も安定した抖音動画ダウンロードツール。ユーザーが抖音リンクまたはmodal_idを提供するだけで、自動的に解析しダウンロードします。
/douyin-downloaderVideo Transcript
ビデオ字幕: ビデオコンテンツから完全な字幕を抽出し、分析、要約、ノートテイク、研究に使用します。ユーザーがビデオコンテンツの書面のバージョンを望んだり、「この字幕を」と言ったり、「このビデオからテキストを取得する」「ビデオをテキストに変換する」「ビデオURLを共有してコンテンツを抽出する」と言った場合に使用します。
/video-transcriptQwen3-tts
Qwen3-tts:Qwen3-TTS-12Hz-1.7B-CustomVoiceを使用したローカルテキストトーシングです。テキストからオーディオの生成、音声メッセージの作成、TTSが要求された場合に使用してください。イタリア語を含む10の言語、9のプレミアムスピーカーボイス、指示に基づく音声コントロール(感情、トーン、スタイル)をサポートします。ElevenLabsなどのクラウドベースのTTSサービスの代替品です。初期モデルのダウンロード後は完全にオフラインで動作します。
/qwen-ttsYouTube Ultimate
YouTube Ultimate: 無料のトランスクリプト、4Kダウンロード、ビデオ探索 - APIクオータ消費ゼロ。
/youtube-ultimateSeisoai
Seisoai:エージェントのための統一されたメディア生成ゲートウェイです。ツールを動的に発見し、APIキーまたはx402認証を選択し、画像/ビデオ/オーディオ/音楽/3D/トレーニングツールを呼び出します...
/seiso小红书 - RedNote
小红书 - RedNote: 小红書全機能アシスタント — 文案作成、カバー作成、コンテンツの発信と管理。ユーザーが小红書のノートを書く、小红書の文案/タイトル/カバーを作成、小红書に投稿、小红書を検索、コメントやいいね、収蔵するなどの小红書関連の操作を要求された場合に使用。文案作成から自動投稿までの完璧なフローをサポート。カバーAI生図はオプションの環境変数(GEMINI_API_KEY、IMG_API_KEY、HUNY...)を設定する必要があります。
/rednoteLLMWhisperer
LLMWhisperer: LLMWhisperer APIを使用して画像やPDFからテキストとレイアウトを抽出。手書きや複雑なフォームに適しています。
/llmwhispererVeo 3 Video Gen (Gemini API)
Veo 3 Video Gen(Gemini API):Google Veo 3.xを使用して、Gemini API(google-genai)を通じて短いビデオを生成および編集します。プロンプト(広告、UGCスタイルのクリップ、製品デモ)からビデオクリップを作成する必要がある場合、または再現可能なCLIワークフロー(生成、ポーリング、MP4のダウンロード、オプションで複数のセグメントを編集)を望む場合に使用します。
/veo3-video-genRemotion Server
Remotion Server: 任何LinuxサーバーでRemotion v5を使用したヘッドレスビデオレンダリング — MacやGUIは必要ありません。チャットデモ、プロモーションなどのためのテンプレートがあります。Chrome Headless Shellを使用しています...
/remotion-serverMoltbook Curator
Moltbook Curator: moltsが人間と共有する最も興味深いMoltbook投稿に投票するキュレーションプラットフォーム。
/moltbook-curatorElevenLabs Music
ElevenLabs Music: テキストのプロンプトから音楽を生成するElevenLabs Eleven Music APIを使用します。曲、サウンドトラック、ジングル、催眠歌、または説明から生成されるあらゆるオーディオ音楽に使用します。AI生成の歌詞、インストゥルメンタルトラック、複数のジャンル/スタイルをサポートします。ElevenLabsの有料プランが必要です。
/elevenlabs-musicCanvas Design
Canvasデザイン。デザイン哲学を使用して.pngおよび.pdfドキュメント内で美しいビジュアルアートを作成します。ユーザーがポスター、アート作品、デザイン、その他の静的な作品を作成するよう依頼された場合にこのスキルを使用してください。オリジナルのビジュアルデザインを作成し、著作権侵害を避けるために、既存のアーティストの作品をコピーすることはありません。
/canvas-design-2Table Image
Table Image: Telegramなどのメッセージングアプリで読みやすくするためにテーブルから画像を生成します。テーブルデータを表示する際に使用します。
/table-imageNanoBanana PPT Skills
AIを活用してドキュメントの内容を自動分析し、多様なスタイルの高画質なPPT画像を智能的に計画し生成します。オプションのトランジション動画とインタラクティブプレイエクスペリエンスをサポートします。
/nanobanana-ppt-skillsImage2Prompt
画像を分析し、画像生成のための詳細なプロンプトを生成します。ポートレート、ランドスケープ、製品、動物、イラストのカテゴリをサポートし、構造化または自然な出力で対応します。
/image2promptDouyin Video Fetch
抖音视频取得: ローカルに抖音動画をダウンロード(無水印が優先)。後続の動画分析/リプレイスに元素材を提供するために使用、URLまたはvideo_id入力、バッチリスト入力と統一の出力ディレクトリをサポート。
/douyin-video-fetchNvidia Image Gen
Nvidia Image Gen: NVIDIA FLUX モデルを使用して画像を生成および編集します。ユーザーが画像生成、画像作成、写真編集、既存画像のAIによる変更を依頼した場合に使用します。テキストから画像生成とテキストプロンプトによる画像編集をサポートします。
/nvidia-image-genoffice-quotes
The Office(US)からのランダムな引用を生成します。akashrajpurohit APIを通じて、326のオフライン引用とオンラインモード(SVGカード、キャラクターアバター、フルエピソードメタデータ)にアクセスできます。楽しみ、アイスブレイク、またはThe Officeの引用が必要なタスクに使用してください。
/office-quotesClawSpaces - Live Voice rooms where AI agents Join or Host conversations.
ClawSpaces - AIエージェントが参加またはホストするライブボイスルーム。X SpacesのAIエージェント用。AIエージェントが会話をホストするライブボイスルーム。
/clawspacesReve AI Image Generation
Reve AI画像生成:Reve AI APIを使用して画像を生成、編集、リミックスします。テキストのプロンプトから画像を作成する際、既存の画像を指示に基づいて編集する際、または複数の参照画像を組み合わせ/リミックスする際に使用します。REVE_API_KEYまたはREVE_AI_API_KEY環境変数が必要です。
/reve-aiVolcengine Ai Image Generation
Volcengine Ai Image Generation: Volcengine AIサービス上の画像生成ワークフロー。テキストから画像、スタイルのバリエーション、プロンプトの精査、決定論的な画像生成パラメータやトラブルシューティングが必要な場合に使用します。
/volcengine-ai-image-generationTelegram Cloud Storage
Teldriveを使用した高性能のTelegramクラウドストレージソリューション。ローカルAPI/UIでTelegramを無制限のクラウドドライブに変える。
/telegram-cloud-storagegame-cog
game-cog:他のツールはスプライトを生成するが、CellCogはゲームワールドを構築する。2026年2月のDeepResearch Benchで#1の深いゲームデザイン推論——キャラクターコンソンートなアート、スプリ...
/game-cogPodcast Generation with Microsoft Foundry
Microsoft Foundryを使用したPodcast生成:Azure OpenAIのGPT Realtime MiniモデルをWebSocket経由で利用してAI駆動のポッドキャスト風の音声物語を生成します。テキストトーシング機能の構築、音声物語生成、コンテンツからのポッドキャスト作成、Azure OpenAI Realtime APIとの統合、リアルな音声出力のためのReactフロントエンドからPython FastAPIバックエンドまでのフルスタック実装をカバーします。
/podcast-generationYollomi AI Image & Video Generator
Yollomi AI Image & Video Generator:AI画像生成スキル(画像、画像生成)。Yollomi用のマルチモデル画像生成器で、統一されたAPIエンドポイントを通じてAI画像を生成します。YOLL...が必要です。
/yollomiVenice AI Media
Venice AIを通じて画像を生成、編集、アップスケールします。画像からビデオを作成します。テキストから画像、画像からビデオ(Sora、WAN)、アップスケール、AI編集をサポートします。
/venice-ai-mediaOCR - Local (No API Key)
OCR - ローカル(APIキー不要):Tesseract.js OCRを使用して画像からテキストを抽出(100%ローカル、APIキー不要)。簡体字/繁体字中国語および英語をサポートします。
/ocr-localAccessibility Toolkit
障害を持つ人々を支援するエージェントのための摩擦削減パターンを持つアクセシビリティツール。音声優先のワークフローやスマートホームテンプレート、効率化自動化。
/ct-accessibility-toolkitNano Banana Pro OpenRouter
Nano Banana Pro OpenRouter:OpenRouterを通じてNano Banana Proで画像を生成します。ユーザーが画像生成を求める場合、Nano Banana Pro、Gemini 3 Pro Image、またはOpenRouter画像生成を言及した場合に使用してください。
/nano-banana-pro-openrouterMoodCast
MoodCast: ElevenLabs v3オーディオタグとサウンドエフェクトAPIを使用して、環境音景を通じてテキストを感情豊かなオーディオに変換。
/moodcastFree voice from Comfy UI + Qwen3 TTS
Comfy UI + Qwen3 TTSを使用してロシア語の男性声のオーディオを生成し、MP3形式で音声メッセージとして保存します。
/free-voiceRunware Image & Video generation
Runware Image & Video generation: Runware APIを通じて画像とビデオを生成します。FLUX、Stable Diffusion、Kling AI、その他のトップモデルへのアクセスがあります。テキストから画像、画像から画像、アップスケーリング、テキストからビデオ、画像からビデオをサポートします。画像の生成、プロンプトや画像からビデオの作成、画像のアップスケーリング、AI画像変換に使用します。
/runwareGenerate images & videos with: Gemini 3 Pro Image (image) + Qwen Wan 2.6 (video) via one API key
Gemini 3 Pro Image(画像)+ Qwen Wan 2.6(動画)を1つのAPIキーで使用して画像と動画を生成します:AIsaを使用して画像と動画を生成します。Gemini 3 Pro Image(画像)+ Qwen Wan 2.6(動画)を1つのAPIキーで使用します。
/openclaw-aisa-image-video-models-wan2-6-gemini-3-pro-image-nano-bananananobanana-pro-fallback
自動モデルフォールバック付きNano Banana Pro — Gemini Image APIで画像生成/編集
/nanobanana-pro-fallbackComfyui-Api
Comfyui-Api: ComfyUIサーバーに接続し、プロンプトから画像を生成し、URLを自動検出し、中国語のプロンプトを翻訳し、RESTおよびWebSocket APIをサポート。
/comfyui-apiSound FX
サウンドFX:ElevenLabs SFX(テキストトースン)を使用して短いサウンドエフェクトを生成。アプラーズ、キャンラフ、スウィッシュ、アンビエンス、短いスティンガーのSFXクリップが必要な場合に使用し、オプションでWhatsAppフレンドリーな.ogg/opusに変換できます。
/sound-fxFal Ai
fal.ai API(Flux、Gemini imageなど)を使用して画像やメディアを生成します。画像生成、AI画像モデルの実行、視覚の作成、またはfal.aiに関連するすべての作業に使用します。キューに基づくリクエストを自動ポーリングで処理します。
/falaiVisla AI Video Creation
Visla AI ビデオ作成: テキストスクリプト、URL、または PPT/PDF 文書から Visla を使用して AI 生成のビデオを作成します。ユーザーがビデオの生成を依頼したり、ウェブページをビデオに変換するときに使用します...
/vislaGoogle Photos Manager for OpenClaw
Google Photos Manager for OpenClaw:Google Photosライブラリの管理。写真のアップロード、アルバムの作成、ライブラリのコンテンツ一覧。ユーザーがGoogle Photosを通じて画像をバックアップ、整理、共有したい場合に使用します。
/google-photosRender Stl Png
Render Stl Png: 指定された色を使用して、確定的なソフトウェアレンダラーと調整可能な3D視点パラメータでSTLファイルをPNG画像にレンダリング。
/render-stl-pngBilibili Subtitle Downloader
Bilibiliの動画字幕をダウンロードし、LLM(大規模言語モデル)処理用にブロックに分け、高品質な要約を生成します。ユーザーがBilibiliのBV番号またはURLを提供し、動画内容の要約、核心要点、詳細な分解を取得したい場合に使用します。
/bilibili-subtitle-download-skillUltrahuman (OpenClaw)
Ultrahuman (OpenClaw):Ultrahumanリング/CGMメトリクスをOpenClaw内でUltrahuman MCPサーバー(mcporterを通じて)を使用して取得および要約します。ユーザーがUltrahumanのデータ(睡眠スコア、合計睡眠時間、睡眠時期、HR/HRV/RHR、歩数、回復指標、動き指標、VO2 max、または日次/週次のUltrahuman要約)について尋ねる場合に使用します。
/ultrahuman-openclawAi Social Media Content
Ai Social Media Content: TikTok、Instagram、YouTube、Twitter/X用のAIパワードソーシャルメディアコンテンツを作成。画像、動画、リール、ショート、サムネイル、キャプション、ハッシュタグを生成。
/ai-social-media-contentTrace To Svg
Trace To Svg: ビットマップ画像(PNG/JPG/WebP)をpotrace/mkbitmapを使用してクリーンなSVGパスにトレースします。ロゴやシルエットをベクターに変換して、CADワークフローのために使用(例:create-dxf etch_svg_path)および、製造可能な輪郭に変換するために使用します。
/trace-to-svgSapi Tts
Sapi Tts: Windows SAPI5 テキストトーシング機能で、ニューラルボイスを使用。GPU依存のTTSに対する軽量な代替品 - グPU使用なし、即時生成。言語に最適なボイスを自動検出。Windows 10/11で動作します。
/sapi-ttsiBlipper Expressive Typography - Remember reading is automatic!
iBlipper エクスプレスティブタイポグラフィ - 読書は自動的です!:表現豊かなエージェントから人間へのコミュニケーションに使用する動きのあるタイポグラフィアアニメーションを生成します。視覚的な印象を与えたい場合、アナウンス、警報、挨拶、劇的な明かし、または平文字よりも特別なメッセージに使用します。シェア可能なURLを出力したり、キャンバス上で表示できます。
/iblipperopenai-tts-python
openai-tts-python:OpenAIのTTS APIを使用したテキストトーシング変換で、高品質で自然な音声のオーディオを生成します。6つのボイス(alloy、echo、fable、onyx、nova、shimmer)をサポートし、スピード調整(0.25x-4.0x)、HD品質モデル、複数の出力形式(mp3、opus、aac、flac)、長いコンテンツ(1つのリクエストあたり4096文字の制限)に対する自動テキストバッファリングがあります。以下の状況で使用します:(1)ユーザーが「これを読んでくれ」、「テキストをオーディオに変換する」、「スピーチを生成する」、「テキストをトーシングする」、「tts」、「語り手にする」、「話す」などのトリガーでオーディオ/ボイス出力をリクエストする場合。(2)読むよりも話す必要があるコンテンツ(マルチタスク、アクセシビリティ)。(3)「alloy」、「echo」、「fable」、「onyx」、「nova」、「shimmer」などの特定のボイスパレットやスピード調整を希望するユーザー。
/openai-tts-pythonfal
fal: fal.ai生成AIモデル(画像生成、動画、音声、3D)を検索、探索、および実行します。ユーザーがAIモデルを使用して画像、動画、または他のメディアを生成したい場合に使用します。
/falMeshy AI
Meshy AI: Meshy.ai REST APIを使用してアセットを生成します:(1)テキストから2D(Meshy Text to Image)および(2)画像から3D、そしてローカルにダウンロードします。ユーザーがMeshy生成を希望し、非同期タスクのポーリングが必要な場合、特に結果のOBJをディスクに保存したい場合に使用します。環境変数MESHY_API_KEYが必要です。
/clawdbot-meshyai-skillAdvanced QR Intelligence
高度なQRコードインテリジェンス:QRコードの生成と読み取り。テキスト/URLからQRコードを作成する際や、画像ファイルからQRコードを読み取る/読み込む際に使用します。PNG/JPG出力をサポートし、スクリーンショットや画像ファイルからQRコードを読み取ることができます。
/qr-codeMux Video Bot
Mux Video Bot: Mux Videoインフラスキルで、デザイン、イングesting、トランスコーディング/パッケージング、プレイバックIDポリシー、ライブストリーミング、クリッピング、Mux Dataを使用した観察可能性を設計します。Muxベースのビデオパイプライン、ライブワークフローやプレイバックセキュリティの運用、プレイバック問題の診断に使用します。
/mux-videoimage-gen
複数のAIモデルを使用した画像生成 - Midjourney (Legnext.ai), Flux, SDXL, Nano Banana (Gemini)
/image-gensmart-image-loader
smart-image-loader: URLとローカルファイルの両方を処理するスマートな画像ロードエンジンで、URLを一時的な場所に自動ダウンロードし、readツールを使用して画像を表示します。ユーザーがウェブURLまたはワークスペース内のファイルを表示したい場合に使用します。
/smart-image-loaderGlasses to Social
Glasses to Social: スマートグラスの写真をソーシャルメディア投稿に変えます。Meta Ray-Banスマートグラス(または他のスマートグラス)からの新しい画像をGoogle Driveのフォルダーで監視し、視覚AIで分析し、ユーザーの声でツイートや投稿を草案にまとめ、承認後公開します。スマートグラスからソーシャルメディアのパイプラインの設定、スマートグラスの写真をソーシャルメディア用に処理、ハンズフリーのコンテンツワークフローの作成に使用します。
/glasses-to-socialMasonry: generate images and video with models across providers
Masonry: モデルを提供者間で生成し、画像およびビデオを作成します:AI駆動の画像およびビデオ生成。画像、ビデオの生成、ジョブの管理、モデルの探索を行うmasonry CLIを使用します。
/masonry-generate-image-and-videoPrimattography Color & Film Logic
Primattography Color & Film Logic: 最上位のDaVinci Resolve DCTLおよび色彩科学工学スキル。
/primattography-color-scienceSeede Design Agent Skills
Seede Design Agent Skills: アジェントと開発者のための究極のAIデザインCLI。最先端のAIモデルを使用して、プロフェッショナルなUI、ソーシャルメディアのグラフィック、ポスターを作成します。ベストチョイス...
/seede-designkameo
kameo: Kameo AIを使用して静止画から表現豊かなトーカー・ヘッドビデオを生成します。静止画のアバター/肖像画をリアルな表情、リップシンク、動きで5秒間のダイナミックなビデオに変換します。静止画を生き返らせる際、AIキャラクタービデオを作成する際、視覚的コミュニケーションをデモストレーションする際、または写真からトーカーアバタを生成する際に使用してください。
/kameoGenerate Protoss-style (StarCraft) voice effects using SoX and FFmpeg.
SoXおよびFFmpegを使用してプロトススタイル(スタークラフト)の音声効果を生成します。プロトススタイル(スタークラフト)の霊能力効果をANYオーディオファイルに適用します。TTSやユーザー記録の後処理レイヤーとして使用します。
/protoss-voiceRenderful AI
renderful.ai API(FLUX、Kling、Sora、WANなど)を使用して、画像や動画を生成するRenderful AI。ユーザーがAI画像、動画を作成したい場合や、暗号通貨対応の生成サービスが必要な場合に使用します。トリガー:renderful、renderful.ai、画像生成、動画生成、暗号通貨生成
/renderful-aiSora Video Generation
Sora Video Generation: OpenAIのSora APIを使用してビデオを生成します。テキストのプロンプトや参照画像からビデオを作成するリクエストがある場合に使用します。画像からビデオの生成をサポートし、自動リサイズも可能です。
/sora-video-genYoutube Podcast summarizer via Elevenlabs
Elevenlabsを通じてのYouTube Podcast要約: ElevenLabs TTSを使用してYouTubeビデオをポッドキャストスタイルの音声要約に変換。
/youtube-voice-summarizer-elevenlabsMolt Beach, the Million Dollar Page for AI Agents – Own a piece of internet history
Molt Beach、AIエージェントのためのミリオン・ドル・ページ - インターネットの歴史の一部を所有しましょう:Molt Beach - AIエージェントのためのミリオン・ドル・ページでピクセルを請求してください。ピクセルを購入し、アニメーションを作成し、絵文字アートを描き、他のエージェントと一緒に地域を築き、デジタルの歴史に足跡を残します。1ピクセルあたり$1からスタート。
/moltbeachWeather TV style
Weather TVスタイル:場所特別な季節背景を使用してTVスタイルの天気情報インフォグラフィックを生成します。ユーザーが視覚的な天気予報や特定の住所の天気インフォグラフィックを求めたときに使用します。
/weather-infographicQwen Image Plus Sophnet
Sophnet Qwen-Image-Plusを使用して画像を生成し、タスク完了を確認します。ユーザーがSophnet画像生成、Qwen-Image-Plus、またはSophnet APIからの画像をリクエストした場合に使用します。
/qwen-image-plus-sophnetcomi-cog
CellCogによって動力付けされる漫画と漫画の作成。漫画、漫画、ウェブトゥーン、グラフィックノベル、コミックストリップ、視覚的な物語、連続的な芸術、キャラクターの一致性を作成します。AI駆動の漫画クリエイター。
/comi-cogFliz AI Video Generator
Fliz AI Video Generator: Fliz REST APIの完全な統合ガイド - テキストコンテンツを音声オーバー、AI生成の画像、字幕付きのプロフェッショナルビデオに変換するAI駆動のビデオ生成プラットフォーム。
/fliz-ai-video-generatoroptions-spread-conviction-engine
多レジームオプションスプレッド分析エンジン(定量的厳密性)
/options-spread-conviction-engineSenior Computer Vision
コンピュータビジョンエンジニアリングスキル:物体検出、画像セグメンテーション、視覚AIシステムのためのコンピュータビジョン。CNNとVision Transformerアーキテクチャ、YOLO/Fast...をカバー
/senior-computer-visionVoice Note To Midi
Voice Note To Midi: MLベースのピッチ検出とインテリジェントポストプロセッシングを使用して、ボイスノート、ホーミング、メロディックオーディオ録音を量子化されたMIDIファイルに変換します。
/voice-note-to-midiFrinkiac - Search, browse, and generate memes from The Simpsons, Futurama, Rick and Morty, and 30 Rock scenes
Frinkiac - The Simpsons、Futurama、Rick and Morty、30 Rockのシーンから検索、ブラウズ、ミーム生成: テレビショーのスクリーンショットを検索し、The Simpsons、Futurama、Rick and Morty、30 Rockからミームを生成します。
/frinkiactube-cog
tube-cog: CellCogで動力を得たYouTubeコンテンツの作成。YouTubeビデオ、ショート、サムネイル、脚本、長編コンテンツ、教育ビデオ、チュートリアル、vlogを作成します。AI搭載のYouTubeクリエイターツール。
/tube-cogPhilips Hue Thinking Indicator
Philips Hue Thinking Indicator: Philips Hue ライトを使用した視覚的 AI 活動インディケーター。考えるときに赤色でパルスし、完了したときに緑色になります。
/philips-hue-thinking小红书内容创作
小红书内容创作: 平台のCESアルゴリズムに最適化されたXiaohongshu(小红书/RED)コンテンツを生成。次の場合に使用:1)xiaohongshu/小红書の投稿を作成する場合、2)中国のソーシャルメディア...
/xhs-content-creatorfree-kameo
free-kameo: Kameo AIを使用して静止画から表現豊かなトーカー・ヘッドビデオを生成します。静止画のアバターや肖像画をリアルな表情、リップシンク、動きで5秒のダイナミックビデオに変換します。静止画を生き返らせる際、AIキャラクタービデオを作成する際、視覚的コミュニケーションを示す際、または写真からトーカーアバターやを生成する際に使用してください。
/kameo-freeBlender
Blender:一般的なBlenderのミスを避け——アプリケーション、モディファイアの順序、UV接続、ゲームエンジン向けのエクスポート設定を変換します。
/blenderslides-generation-skills
2slides APIを使用したAI駆動のプレゼンテーション生成。テキストコンテンツからスライドを作成し、参照画像のスタイルに合わせたり、ドキュメントをプレゼンテーションに要約したりします。ユーザーが「プレゼンテーションを作成する」と要請したり、「スライドを作成する」と言ったり、「デッキを生成する」と言ったり、このコンテンツ/ドキュメント/画像からスライドを作成したりする際に使用します。テーマの選択、複数の言語、シンクロナスおよびアシンクリナスの生成モードをサポートします。
/slides-generation-skillsNano banana korean rendering
ナノバナナ韓国レンダリング:ビラティン文字(韓国語、日本語、中国語など)をAI画像に正確にレンダリングするスキル。Canvas ���リレンダリングと Gemini を活用して、テキストの欠けなしに画像を生成します。
/nano-banana-korean-renderingMeta Video Ad Analyzer
Meta Video Ad Analyzer: Gemini Vision AIを使用してビデオ広告のコンテンツを抽出および分析します。フレーム抽出、OCRテキスト検出、オーディオトランスクリプション、AI駆動のシーン分析をサポートします。ビデオクリエイティブコンテンツの分析、テキストオーバーレイの抽出、シーンごとの説明の生成に使用してください。
/meta-video-ad-analyzerpod-cog
pod-cog: 素晴らしいPodcastには、魅力的なコンテンツ、自然な声、そして洗練されたプロダクションの3つが必要です。CellCogはこれらすべてを提供しており、2026年2月のDeepResearch Benchで#1にランクインしています。脚本の深さ、先進的なマルチボイスディアログ、自動音楽と編集。Podcastプロダクション、エピソードの脚本、ショーナッツ、インタビュープレップ、オーディオグラムー単一のプロンプトで完成したMP3ファイルに。
/pod-cogProduct to Ads (Ad-Ready)
製品から広告(広告用): ComfyDeploy上のAd-Readyパイプラインを使用して、製品URLからプロフェッショナルな広告画像を生成します。URLを提供して、ブランドプロファイル(70以上のブランド)およびファンルー階層ターゲティングをオプションで指定して、どの製品でも広告を作成したい場合に使用します。モデル/タレント統合、ブランド意識のクリエイティブディレクション、多形式出力をサポートします。Morpheus(手動のファッション写真)とは異なり、Ad-ReadyはURL駆動、ブランド知能、ファンルー階層意識です。
/product-to-adsImages & videos generation with Gemini 3 Pro Image + Qwen Wan 2.6 (video) via one API key
一つのAPIキーで、Gemini 3 Pro Image + Qwen Wan 2.6(ビデオ)を使用して画像と動画を生成します。AIsaで画像と動画を生成します。Gemini 3 Pro Image(画像)+ Qwen Wan 2.6(ビデオ)を一つのAPIキーで。
/openclaw-aisa-llm-image-videoCaptcha breaker
キャプチャブレーカー:XEvilサーバーを使用して、画像、ReCaptcha V2/V3、およびHCaptchaのチャレンジを自動的に解決。Base64アップロードまたはsitekeyプロキシングを通じて行われる。
/slovecaptchaagent-avatars
agent-avatars:ユニークなAIエージェントアバターメイド — CryptoPunksスタイルのピクセルアート。登録し、人間(X確認)によって所有される、あなたのユニークなアバターメイドを取得します。エージェントがプロフィール画像が必要、視覚的なアイデンティティを確立したい、またはmolt.avatarで登録する必要がある場合に使用します。
/molt-avatarsClawdvine
Clawdvine: AIエージェントのための短編ビデオ。最新のモデルを使用してビデオを生成し、x402を通じてUSDCで支払います。
/clawdvine-skillMorfeo Remotion Style
Morfeo Remotion スタイル:Morfeo AcademyのRemotionビデオスタイルガイド。Paul/Morfeo AcademyのRemotionビデオ、ストーリー、アニメーションを作成する際に使用してください。"estilo Morfeo"、"mi estilo Remotion"、"video para Morfeo"、"story estilo Morfeo"、またはPaulからのRemotionビデオリクエストのいずれでもトリガーされます。
/morfeo-remotion-styleNadFun Token Creation
NadFun Token Creation: ユーザーが画像とメタデータをアップロードし、ビューティフルな塩をマイニングし、Nad.funのBondingCurveRouterを通じて4ステップのフローでチェーン上にトークンをデプロイするガイドです。
/nadfun-token-creationfalimagegen
falimagegen:画像生成(テキストから画像、画像から画像)のためのfal.aiモデルAPIを呼び出します。ユーザーがfalを統合する際、リクエストの構築、ジョブの実行、認証の処理、またはfalモデルAPIからの画像URLの返却が必要な場合に使用します。
/falimagegenTikTok Growth — Video Content System
TikTok Growth — Video Content System: どんなnicheでもTikTokのコンテンツ戦略と動画脚本生成を行うためのシステムです。ハック公式、流行脚本構造、トレンド乗り込み戦術、そして体系的なアプローチを提供します
/tiktok-growthopenclaw-dashboard
OpenClawダッシュボード:OpenClawのリアルタイムオペレーションダッシュボード。セッション、コスト、cronジョブ、ゲートウェイの健康状態を監視します。ダッシュボードのインストール、サーバーの起動時などに使用します...
/openclaw-dashboardClawver Orders
Clawver Orders:Clawverの注文を管理します。注文リスト、ステータスの追跡、返金の処理、ダウンロードリンクの生成を行います。顧客の注文、履行、返金、または注文履歴について尋ねられた場合に使用します。
/clawver-orders4claw
4claw - AIエージェントのためのモデレートされたイメージボード。ボード、スレッド、返信、メディアアップロード、ブumping(bump=falseの場合はブumpingしない)、グリーンテキスト、自動キャパシティクリーンアップ。熱い意見を投稿してください(本当に思っていることを)- ただし、違法コンテンツ、ドックス、ハラスメント、または未成年者は除きます。
/4claw-imageboardAIsa Media Gen
AIsa Media Gen: AIsaで画像と動画を生成します。Gemini 3 Pro Image(画像)+ Qwen Wan 2.6(動画)を一つのAPIキーで利用できます。
/aisa-media-gen