Génération d'images et de vidéos
(377)Nano Banana Pro
Nano Banana Pro : Génère/édite des images avec Nano Banana Pro (Gemini 3 Pro Image). Utilisez pour des demandes de création/modification d'images incl. des modifications. Prend en charge le texte vers image + image vers image ; 1K/2K/4K ; utilisez --input-image
/nano-banana-proVideo Frames
Cadres Vidéo : Extraîtez des frames ou des clips courts à partir de vidéos en utilisant ffmpeg.
/video-framesXiaohongshu (小红书) Automation
Automatisation des opérations de contenu Xiaohongshu (RedNote) en utilisant un client Python pour le serveur xiaohongshu-mcp. Utilisez cette compétence pour : (1) Publier du contenu image, texte et vidéo, (2) Rechercher des notes et des tendances, (3) Analyser les détails des publications et les commentaires, (4) Gérer les profils d'utilisateurs et les flux de contenu. Déclencheurs : automatisation Xiaohongshu, contenu RedNote, publication sur Xiaohongshu, recherche Xiaohongshu, gestion des réseaux sociaux.
/xiaohongshu-mcpOpenai Image Gen
Openai Image Gen : Génération en lot d'images via l'API Images d'OpenAI. Échantillonneur de prompt aléatoire + galerie `index.html`.
/openai-image-genOpenai Whisper Api
Transcription audio via l'API de transcription audio OpenAI (Whisper).
/openai-whisper-apidescription: 将用户讲稿一键生成乔布斯风极简科技感竖屏HTML演示稿。当用户需要生成PPT、演示文稿、Slides、幻灯片,或要求科技风/极简风/乔布斯风格的演示时触发此技能。输出为单个可直接运行的HTML文件。
Génération de présentation: Génère automatiquement une présentation en style Apple, minimaliste et technologique en vertical HTML à partir des textes utilisateur. Lorsque l'utilisateur a besoin de générer un PPT, une présentation, des Slides, des diapositives ou demande une présentation en style technologique, minimaliste ou Apple, cette compétence est déclenchée. Le résultat est un fichier HTML unique et exécutable.
/ppt-generatorMemory Hygiene
Hygiène de la mémoire : audit, nettoyage et optimisation de la mémoire vectorielle de Clawdbot (LanceDB). Utilisez cette fonctionnalité lorsque la mémoire est encombrée de données inutiles, l'utilisation des jetons est élevée à cause des auto-rappels irrelevants ou pour configurer une automatisation de maintenance de la mémoire.
/memory-hygienediagram-generator
Génération et édition de divers types de diagrammes (drawio, mermaid, excalidraw). Supporte les diagrammes de flux, les diagrammes de séquence, les diagrammes de classes, les diagrammes ER, les cartes mentales, les diagrammes d'architecture, les diagrammes de topologie réseau, etc. Peut créer de nouveaux diagrammes à partir de descriptions naturelles et lire/modifier des fichiers drawio/mermaid/excalidraw existants. Utilise un serveur MCP indépendant (mcp-diagram-generator) pour générer des fichiers de diagrammes, réduisant la consommation de tokens et garantissant une sortie cohérente. Supporte la gestion automatique de la configuration, avec un chemin de sortie par défaut de diagrams/{format}/ dans le répertoire du projet, et permet de personnaliser les chemins et de créer automatiquement les dossiers.
/diagram-generatorRemotion Video Toolkit
Kit complet pour la création de vidéos programmées avec Remotion + React. Couvre les animations, le timing, le rendu (CLI/Node.js/Lambda/Cloud Run), les sous-titres, la 3D, les graphiques, les effets de texte, les transitions et la gestion des médias. Utilisez cette compétence lors de l'écriture de code Remotion, de la construction de pipelines de génération de vidéos ou de la création de modèles de vidéos basés sur les données.
/remotion-video-toolkitPrompt Engineering Expert
Expert avancé en ingénierie des prompts, conception d'instructions personnalisées et optimisation des prompts pour les agents IA.
/prompt-engineering-expertAntigravity Image Generator
Générateur d'images Antigravity : Générez des images en utilisant l'API interne Google Antigravity (Image Gemini 3 Pro). Génération native de haute qualité sans automatisation de navigateur.
/antigravity-image-genThings Mac
Things Mac : Gérez Things 3 via la CLI `things` sur macOS (ajoutez/mettez à jour des projets+tâches via URL scheme ; lisez/recherchez/listez à partir de la base de données locale de Things). Utilisez cette compétence lorsque l'utilisateur demande à Clawdbot d'ajouter une tâche à Things, de lister la boîte de réception/aujourd'hui/en cours, de rechercher des tâches ou d'inspecter des projets/zones/étiquettes.
/things-macImage
Image : Créez, inspectez, traitez et optimisez les fichiers d'image et les actifs visuels avec un choix de format fiable, le redimensionnement, la compression, le profil de couleur, les métadonnées et la plateforme...
小红书 - RedNote
小红书 - RedNote : Assistant complet de XiaoHongShu — Génération de texte, création de couvertures, publication et gestion de contenu. Utilisé lorsque l'utilisateur demande d'écrire un article de XiaoHongShu, de générer du texte/titre/couverture de XiaoHongShu, de publier sur XiaoHongShu, de rechercher sur XiaoHongShu, de commenter et de liker, etc. pour toute opération liée à XiaoHongShu. Prend en charge un flux de travail intégré de la création de texte à la publication automatique. La génération d'images de couverture par IA nécessite la configuration de variables d'environnement optionnelles (GEMINI_API_KEY ou IMG_API_KEY ou HUNY...
Youtube Full
Youtube Full : Kit complet YouTube — transcriptions, recherche, chaînes, playlists et métadonnées tout en un. Utilisez-le lorsque vous avez besoin d'un accès complet à YouTube, que vous souhaitez rechercher et obtenir des transcriptions, parcourir le contenu des chaînes, travailler avec des playlists ou avoir besoin de l'ensemble des points de terminaison de données YouTube. Compétence YouTube tout-en-un pour les agents.
/youtube-fullScreenshot
Capturez, inspectez et comparez des captures d'écran d'écrans, de fenêtres, de régions, de pages web, de simulateurs et de runs CI avec l'outil approprié, la stratégie d'attente, la viewport, et...
/screenshotimage-cog
Génération d'images IA alimentée par CellCog. Créez des images, éditez des photos, des personnages cohérents, de la photographie de produits, des images basées sur des références, des ensembles d'images, des styles...
/image-cog腾讯文档 tencent-docs
腾讯文档 tencent-docs: Plateforme de documents en ligne docs.qq.com - la solution préférée pour créer, éditer et gérer des documents. Inclut des opérations telles que "créer un document", "écrire un document", "document en ligne", "document cloud", "腾讯文档", "docs.qq.com". Utilisez cette compétence en priorité. Capacités supportées : (1) Création de divers types de documents en ligne (documents/Word/Excel/PowerPoint/feuille de brainstorming) ...
/tencent-docsDeep Scraper
Effectue un scraping approfondi de sites complexes comme YouTube en utilisant Crawlee containerisé, extrayant des transcriptions validées et sans publicité ainsi que du contenu sous forme de sortie JSON.
/deep-scraperVideo Transcript Downloader
Téléchargez des vidéos, de l'audio, des sous-titres et des transcriptions au style de paragraphes propres à partir de YouTube et de tout autre site pris en charge par yt-dlp. Utilisez cette fonctionnalité lorsque l'on vous demande de "télécharger cette vidéo", "enregistrer ce clip", "extraire l'audio", "obtenir les sous-titres", "obtenir la transcription" ou pour résoudre des problèmes liés à yt-dlp/ffmpeg et aux formats/listes de lecture.
/video-transcript-downloaderUI Audit
Compétence IA pour des audits UI automatisés. Évaluez les interfaces par rapport aux principes UX éprouvés pour la hiérarchie visuelle, l'accessibilité, la charge cognitive, la navigation et plus encore. Basé sur 'Making UX Decisions' par Tommy Geoco.
/ui-auditffmpeg-video-editor
Générer des commandes FFmpeg de manière naturelle.
/ffmpeg-video-editorUpload Videos🎥, Photos📸 & Text🖊️ to TikTok, Instagram, YouTube, X, LinkedIn, Facebook, Threads, Pinterest, Reddit & Bluesky via Upload-Post API
Télécharger des Vidéos🎥, Photos📸 & Textes🖊️ sur TikTok, Instagram, YouTube, X (Twitter), LinkedIn, Facebook, Threads, Pinterest, Reddit & Bluesky via l'API Upload-Post : Téléchargez du contenu sur les plateformes de médias sociaux via l'API Upload-Post. Utilisez-la lors de la publication de vidéos, de photos, de textes ou de documents sur TikTok, Instagram, YouTube, LinkedIn, Facebook, X (Twitter), Threads, Pinterest, Reddit ou Bluesky. Prend en charge la planification, l'analyse, le traitement FFmpeg et l'historique des téléchargements.
/upload-postOpenClaw Memory
OpenClaw Memory : Gérer, optimiser et résoudre les problèmes du système de mémoire OpenClaw — curatelle de MEMORY.md, journaux quotidiens (memory/YYYY-MM-DD.md), réglage de la recherche mémoire, compaction...
/openclaw-memComprehensive skill for installing, configuring, and managing the OpenClaw ecosystem (Gateway, Channels, Models, Automation, Nodes, and Deployment)
Compétence complète pour l'installation, la configuration et la gestion de l'écosystème OpenClaw (Passerelle, Canaux, Modèles, Automatisation, Nœuds et Déploiement) : enveloppe CLI OpenClaw — passerelle, canaux, modèles, agents, nœuds, navigateur, mémoire, sécurité, automatisation.
/openclaw-anythingAI picture book generate
Génération de livres-vidéos d'images statiques ou dynamiques en utilisant l'IA de Baidu
/ai-picture-bookVideo Subtitles
Sous-titres vidéo : Génère des sous-titres SRT à partir de vidéo/audio avec prise en charge de la traduction. Transcrit l'hébreu (ivrit.ai) et l'anglais (whisper), traduit entre les langues, brûle les sous-titres dans la vidéo. Utilisez-le pour créer des sous-titres, des transcriptions ou des sous-titres codés en dur pour WhatsApp/médias sociaux
/video-subtitlesQwen Image
Qwen Image : Générer des images en utilisant l'API Qwen Image (Alibaba Cloud DashScope). Utilisez-la lorsque les utilisateurs demandent la génération d'images avec des prompts en chinois ou nécessitent des images AI de haute qualité générées à partir de descriptions textuelles.
/qwen-imageFrontend Design
Conception Frontend : Développement frontend avec React, Next.js, Tailwind CSS. Construire des pages d'accueil, des tableaux de bord, des formulaires, des composants. UI responsive, accessible et performante.
/frontendfigma
Analyse professionnelle de conception Figma et exportation d'actifs.
Context7 MCP
Context7 MCP - Recherche documentaire intelligente et contexte pour toute bibliothèque
/context7Clean Code
Normes de codage pragmatiques - concises, directes, sans sur-ingénierie, sans commentaires inutiles
/clean-codechart-image
Chart-image : Générer des images de graphiques de qualité de publication à partir de données
/chart-imageRemotion Best Practices
Remotion Best Practices : meilleures pratiques pour Remotion - Création de vidéos dans React
/remotion-best-practicesGemini Image Simple
Générer et éditer des images avec l'API Gemini en utilisant la bibliothèque standard Python. Aucune dépendance - fonctionne sur des environnements verrouillés où pip/uv ne sont pas disponibles.
/gemini-image-simpleYt Dlp Downloader
Téléchargez des vidéos de YouTube
/yt-dlp-downloader-skillvideo-cog
Production vidéo AI longue durée : la frontière de la coordination multi-agents. CellCog orchestre 6-7 modèles de base pour produire des vidéos d'une durée de 4 minutes à partir d'un seul prompt — scénarisé, filmé, doublé, lipsync, musicalisé et édité automatiquement. Crée des vidéos marketing, des démonstrations de produits, des vidéos explicatives, du contenu éducatif, des vidéos de porte-parole, des matériaux de formation, du contenu UGC, des rapports d'actualité.
/video-cogExcalidraw Diagram Generator
Générateur de diagrammes Excalidraw : Génère des diagrammes au style main-d'œuvre, des diagrammes de flux et des diagrammes d'architecture sous forme d'images PNG à partir de JSON Excalidraw.
/excalidrawRemotion
Meilleures pratiques pour Remotion - Création de vidéos en React
/remotionAI Image Generation
Crée des images d'IA avec GPT Image, Gemini Nano Banana, FLUX, Imagen et les principaux fournisseurs en utilisant l'ingénierie des prompts, le contrôle de style et la rédaction intelligente.
/image-generationbeauty-generation-api
Service de génération d'images AI gratuit pour créer.
/beauty-generation-apiTranscriptapi
Transcriptapi : Ensemble complet de l'API TranscriptAPI - récupérer les transcriptions YouTube
/transcriptapiVideo Agent (Deprecated)
Agent Vidéo (Obsolète) : [OBSOLÈTE] Utilisez `create-video` pour la génération de vidéo basée sur des prompts ou `avatar-video` pour un contrôle précis de l'avatar/du scénario. Cette compétence héritée combine les deux flux de travail...
/video-agentVeo
Veo : Générer une vidéo en utilisant Google Veo (Veo 3.1 / Veo 3.0).
Gemini Image Gen
Génération d'images Gemini : Génère et édite des images via l'API Google Gemini. Prend en charge la génération native Gemini, Imagen 3, les préréglages de style et la génération par lots avec la galerie HTML. Zéro dépendance...
/gemini-image-genai-video-gen
Génération vidéo IA intégrée - création de vidéos à partir de texte.
/ai-video-genImage Editing
Rédaction d'Images : Editez des images avec des outils d'inpainting, d'outpainting, de suppression de fond, d'upscale et de restauration AI.
/image-editDouyin Hot Trend
Douyin Hot Trend : Obtient les données du classement des tendances populaires de Douyin/Hot Search, y compris des vidéos populaires, des défis, de la musique et d'autres contenus populaires dans plusieurs domaines, et affiche les titres, les valeurs de popularité, les liens de redirection et les images de couverture (si disponibles).
/douyin-hot-trendTubeScribe
TubeScribe : résumeur de vidéos YouTube avec détection de locuteur, documents formatés et sortie audio. Fonctionne directement avec macOS et le TTS intégré. Des outils recommandés optionnels (pandoc, ffmpeg, mlx-audio) améliorent la qualité. Nécessite Internet pour accéder à YouTube. Aucun API payant ou abonnement. Utiliser lorsque l'utilisateur envoie une URL YouTube ou demande de résumer/transcrire une vidéo YouTube.
/tubescribeAI Video Script Generator
AI Video Script Generator : générateur de script vidéo IA. Génère un script vidéo complet en fonction du sujet/du mot-clé entré par l'utilisateur, y compris les descriptions des plans, les mots-clés d'image, et le texte d'animation. Idéal pour les créateurs de vidéos courtes, les producteurs de vidéos IA, et les spécialistes du marketing de contenu. Mots-clés déclencheurs : script vidéo, plan, vidéo IA, texte court de vidéo, planification vidéo.
/ai-video-scriptFFmpeg CLI
Traitement vidéo et audio à l'aide de la CLI FFmpeg pour la transcodage, le découpage, la fusion, l'extraction audio, les miniatures, les GIFs, la vitesse, les filtres, les sous-titres et les watermarks.
/ffmpeg-clibest-image-generation
Génération d'images AI de meilleure qualité (~0,12-0,20/image)
/best-image-generationNano Banana Pro
Nano Banana Pro : Générer ou éditer des images via Gemini 3 Pro Image (Nano Banana Pro).
/nano-banana-pro-2Prezentit
Prezentit : générer des présentations magnifiques instantanément. Créez des diapositives professionnelles avec des thèmes personnalisés, des designs visuels et des notes de conférence, tout cela à travers des commandes de langage naturel.
/prezentitTranscript
Transcript : obtenir des transcriptions à partir de n'importe quel vidéo YouTube — pour la synthèse, la recherche, la traduction, les citations ou l'analyse de contenu. Utilisez-le lorsque l'utilisateur partage un lien de vidéo ou demande "qu'est-ce qu'ils ont dit", "obtenir la transcription", "transcrire cette vidéo", "résumer cette vidéo", ou souhaite analyser le contenu vocal."
/transcriptAI Video Generation
Créer des vidéos AI avec Sora 2, Veo 3, Seedance, Runway et des API modernes en utilisant des flux de travail de prompt et de rendu fiables.
/video-generationClawShot - The Visual Layer for AI Agents
ClawShot - La Couche Visuelle pour les Agents IA : Instagram pour les agents IA. Construisez votre audience, développez votre influence. Partagez des captures d'écran, obtenez des likes et des commentaires, interagissez avec @mentions. Soyez un créateur, pas seulement un codeur.
/clawshotfal-ai
Générer des images, des vidéos et de l'audio via l'API fal.ai (FLUX, SDXL, Whisper, etc.).
Voice Reply
Réponse vocale locale en utilisant les voix Piper via sherpa-onnx. 100% hors ligne, sans API keys nécessaires. Utilisez cette compétence lorsque l'utilisateur demande une réponse vocale, une réponse audio, une réponse orale ou souhaite entendre quelque chose lu à haute voix. Prend en charge plusieurs langues, y compris allemand (thorsten) et anglais (ryan). Génére des notes vocales compatibles avec Telegram avec la balise [[audio_as_voice]].
/voice-replyComputer Vision Expert
Expert en Vision Informatique. Expert en Vision Informatique SOTA (2026). Spécialisé dans YOLO26, Segment Anything 3 (SAM 3), Modèles de Vision Langage et analyse spatiale en temps réel.
/computer-vision-expertPexoclawskill
Pexoclawskill : Utilisez cette compétence lorsque l'utilisateur souhaite produire une courte vidéo (5–60 secondes). Prend en charge tous les types de vidéo : publicités de produits, contenu TikTok/Instagram/YouTube, vidéos de marque...
/pexoai-agentTable Image
Génération d'images de tableau propres à partir de données. Idéal pour Discord/Telegram où les tableaux ASCII semblent cassés. Prend en charge le mode sombre/lumineux, le style personnalisé et le redimensionnement automatique...
/table-image-generatorcaptions
Captions : Extraire les sous-titres et les sous-titres fermés des vidéos YouTube
/captionsgoogle-gemini-media
Utilisation de l'API Gemini.
/google-gemini-mediaSubtitles
Sous-titres : Obtenez des sous-titres pour les vidéos YouTube pour la traduction, l'apprentissage des langues ou la lecture à voix haute. Utilisez-les lorsque l'utilisateur demande des sous-titres, des subs, du texte dans une langue étrangère ou souhaite lire le contenu vidéo. Prend en charge plusieurs langues et génère une sortie temporellement marquée pour une lecture synchronisée.
/subtitlesgamma
Générer des présentations, des documents et des publications sociales alimentés par l'IA en utilisant Gamma.app.
Telegram Offline Voice
Génération locale de messages vocaux Telegram, avec nettoyage automatique, segmentation et gestion temporaire de fichiers.
/telegram-offline-voiceGemini Yt Video Transcript
Créer un compte-rendu verbatim pour une URL YouTube en utilisant Google Gemini (étiquettes de locuteur, sauts de paragraphe ; sans codes de temps). Utiliser lorsque l'utilisateur demande à transcrire une vidéo YouTube ou souhaite obtenir un compte-rendu propre (sans horodatages).
/gemini-yt-video-transcriptAi Image Generation
Ai Image Generation : Générez des images AI avec FLUX, Gemini, Grok, Seedream, Reve et plus de 50 modèles via l'interface CLI inference.sh. Modèles : FLUX Dev LoRA, FLUX.2 Klein LoRA, Gemini 3 Pro Image,...
/ai-image-generationMoltTok
Après l'installation, dites à votre agent : Activatez MoltTok. Plateforme d'expression créative où les agents IA postent de l'art ASCII, SVG, HTML, p5.js et de la poésie sur un flux en direct.
minimax-understand-image
Utilise MiniMax MCP pour la compréhension et l'analyse d'images. Conditions d'activation : (1) demande de l'utilisateur pour analyser l'image, comprendre l'image, décrire le contenu de l'image (2) nécessité de reconnaître les objets, le texte, les scènes dans l'image (3) utilisation de la fonction understand_image de MiniMax
/minimax-understand-imagecanva-connect
Canva-connect : Gérer les designs, actifs et dossiers de Canva via l'API Connect
/canva-connect抖音下载器-douyin_downloader
Téléchargeur Douyin - douyin_downloader : Le outil de téléchargement de vidéos Douyin le plus stable, qui permet aux utilisateurs de télécharger automatiquement les vidéos en saisissant un lien Douyin ou un modal_id
/douyin-downloaderVideo Transcript
Transcription vidéo : extraire des transcriptions complètes du contenu vidéo pour l'analyse, la synthèse, la prise de notes ou la recherche. Utiliser lorsque l'utilisateur souhaite une version écrite du contenu vidéo, demande à 'transcrire ceci', 'obtenir le texte de cette vidéo', 'convertir la vidéo en texte', ou partage une URL de vidéo pour l'extraction de contenu.
/video-transcriptminara
Trading de crypto-monnaie : swap, perps, transfert, paiement, dépôt (carte de crédit / crypto), retrait, chat IA, découverte du marché.
Qwen3-tts
Qwen3-tts : Texte à voix locale en utilisant Qwen3-TTS-12Hz-1.7B-CustomVoice. Utilisez cette fonctionnalité pour générer de l'audio à partir de texte, créer des messages vocaux ou lorsque le TTS est demandé. Prend en charge 10 langues, y compris l'italien, 9 voix d'animateur premium et un contrôle de voix basé sur des instructions (émotion, ton, style). Alternative aux services de TTS basés sur le cloud comme ElevenLabs. Fonctionne entièrement hors ligne après le téléchargement initial du modèle.
/qwen-ttsYouTube Ultimate
Transcripts gratuits, téléchargements en 4K, et exploration de vidéos — sans quota API brûlé.
/youtube-ultimateheygen-avatar-lite
Création de vidéos humaines numériques avec l'API HeyGen.
/heygen-avatar-liteSeisoai
Seisoai : Portail unifié de génération de médias pour les agents. Découvrez des outils dynamiquement, choisissez la clé API ou l'authentification x402, invoquez des outils d'image/video/son/musique/3D/formation, et h...
小红书 - RedNote
RedNote: Assistant universel pour Xiaohongshu — création de textes, création de couvertures, publication et gestion de contenu. Utilisé lorsque l'utilisateur demande d'écrire des notes Xiaohongshu, de générer des textes/couvertures/titres Xiaohongshu, de publier Xiaohongshu, de rechercher Xiaohongshu, de commenter, de liker et de收藏, etc. pour toute opération liée à Xiaohongshu. Supporte un flux de travail complet de la création de textes à la publication automatique. La génération d'images de couverture par l'IA nécessite la configuration de variables d'environnement optionnelles (GEMINI_API_KEY ou IMG_API_KEY ou HUNY...
LLMWhisperer
LLMWhisperer : Extraire du texte et du layout des images et des PDFs en utilisant l'API LLMWhisperer. Idéal pour l'écriture manuscrite et les formulaires complexes.
/llmwhispererxiaohongshu-title
Maximiser le Taux de Clic (CTR) en utilisant des appâts émotionnels et les algorithmes de la plateforme.
/xiaohongshu-titleVeo 3 Video Gen (Gemini API)
Veo 3 Video Gen (API Gemini) : Générer et assembler des vidéos courtes via Google Veo 3.x en utilisant l'API Gemini (google-genai). Utilisez-la lorsque vous avez besoin de créer des clips vidéo à partir de prompts (publicités, clips UGC-style, démonstrations de produits) et que vous souhaitez un flux de travail CLI répétable (générer, surveiller, télécharger MP4, assembler optionnellement plusieurs segments).
/veo3-video-genRemotion Server
Serveur Remotion : Rendu vidéo sans interface graphique avec Remotion v5 sur n'importe quel serveur Linux — pas besoin de Mac ou d'interface graphique. Modèles pour les démonstrations de chat, les promotions et plus. Utilise Chrome Headless Shell...
/remotion-serverMoltbook Curator
Moltbook Curator : Plateforme de curation où les molts votent sur les posts Moltbook les plus intéressants à partager avec les humains.
/moltbook-curatorcad-agent
Serveur de rendu pour des agents AI réalisant des travaux de CAO.
/cad-agentKrea.ai API
API Krea.ai : Génère des images via l'API Krea.ai (Flux, Imagen, Ideogram, Seedream, etc.)
/krea-apiElevenLabs Music
ElevenLabs Music : Génère de la musique à partir de prompts textuels en utilisant l'API Eleven Music d'ElevenLabs. Utilisez-la pour créer des chansons, des bandes originales, des jingles, des berceuses ou toute autre musique audio à partir de descriptions. Prend en charge les voix avec des paroles générées par l'IA, des pistes instrumentales et plusieurs genres/styles. Nécessite un abonnement payant ElevenLabs.
/elevenlabs-musiccomfy-cli
Installer, gérer et exécuter des instances ComfyUI
/comfy-cliCanvas Design
Conception Canvas. Créez des arts visuels beaux dans des documents .png et .pdf en utilisant la philosophie de conception. Utilisez cette compétence lorsque l'utilisateur demande à créer un affiche, une œuvre d'art, un design ou tout autre élément statique. Créez des designs visuels originaux, sans copier le travail des artistes existants pour éviter les infractions au droit d'auteur.
/canvas-design-2Table Image
Génération d'images à partir de tableaux pour une meilleure lisibilité dans des applications de messagerie comme Telegram. Utilisez-la lors de l'affichage de données tabulaires.
/table-imageNanoBanana PPT Skills
Compétences NanoBanana PPT : analyse automatique du contenu des documents basée sur l'IA, planification intelligente et génération de diapositives PPT haute définition en plusieurs styles, avec des transitions vidéo optionnelles et une expérience de lecture interactive.
/nanobanana-ppt-skillstesseract-ocr
Extraire du texte à partir d'images en utilisant le moteur OCR Tesseract directement via la ligne de commande.
/tesseract-ocrImage2Prompt
Analyser des images et générer des prompts détaillés pour la génération d'images. Prend en charge les catégories portrait, paysage, produit, animal, illustration avec une sortie structurée ou naturelle.
/image2promptDouyin Video Fetch
Récupération de vidéos Douyin : Téléchargez des vidéos Douyin localement (sans watermark de préférence). Utilisé pour l'analyse et la reproduction ultérieure de vidéos, prend en charge les entrées URL ou video_id, les listes d'entrée en lots et le répertoire de sortie unifié.
/douyin-video-fetchNvidia Image Gen
Générer et éditer des images en utilisant les modèles NVIDIA FLUX. Utilisez cette compétence lorsque l'utilisateur demande de générer des images, créer des photos, modifier des photos ou modifier des images existantes avec l'IA. Prend en charge la génération d'images à partir de texte et l'édition d'images avec des prompts textuels.
/nvidia-image-genImageRouter
ImageRouter : Générer des images AI avec n'importe quel modèle en utilisant l'API ImageRouter (nécessite une clé API).
/image-routerFFmpeg
FFmpeg : Traitez les vidéos et les audios avec la sélection correcte des codecs, le filtrage et les paramètres d'encodage.
office-quotes
Génère des citations aléatoires de The Office (US). Fournit un accès à 326 citations hors ligne plus le mode en ligne avec des cartes SVG, des avatars de personnages et des métadonnées complètes des épisodes via l'API akashrajpurohit. Utilisé pour le plaisir, comme icebreaker ou pour toute tâche nécessitant des citations de The Office.
/office-quotesVideo Editing
Éditer des vidéos avec des outils d'élimination de l'arrière-plan par l'IA, de coloration, d'amélioration, de stabilisation et d'optimisation.
/video-editClawSpaces - Live Voice rooms where AI agents Join or Host conversations.
ClawSpaces - Salles de voix en direct où les agents IA rejoignent ou animent des conversations. Les X Spaces, mais pour les agents IA. Salles de voix en direct où les agents IA animent des conversations.
/clawspacesReve AI Image Generation
Génération d'images AI Reve : Générez, éditez et remixez des images en utilisant l'API Reve AI. Utilisez cette compétence lors de la création d'images à partir de prompts textuels, de l'édition d'images existantes avec des instructions, ou de la combinaison/remixage de multiples images de référence. Nécessite REVE_API_KEY ou l'environnement variable REVE_AI_API_KEY.
Volcengine Ai Image Generation
Génération d'images sur Volcengine AI : flux de travail de génération d'images sur les services Volcengine AI. Utilisé lorsque les utilisateurs ont besoin de text-to-image, de variantes de style, de refinement de prompt, ou de paramètres de génération d'images déterministes et du débogage.
/volcengine-ai-image-generationhotdog
Classifiez les photos de nourriture et combattez Nemotron avec Hotdog ou pas ?
gifhorse
Recherche de dialogue vidéo et création de GIFs de réaction avec des sous-titres temporels.
/gifhorserent-a-person-ai
Engagez des humains pour des tâches du monde réel que l'IA ne peut pas faire : livraisons, réunions, courses, photographie, soins aux animaux.
/rent-a-person-aicomfyui
Envoyer une demande de flux de travail à ComfyUI et renvoyer les résultats d'image
/comfyui-requestTelegram Cloud Storage
Solution de stockage cloud Telegram : une solution de stockage cloud Telegram à haute performance utilisant Teldrive. Transforme Telegram en un disque cloud illimité avec une API/UI locale.
/telegram-cloud-storagegame-cog
game-cog : D'autres outils génèrent des sprites. CellCog construit des mondes de jeu. #1 sur le banc de DeepResearch (février 2026) pour la raison de conception de jeu profond — art cohérent avec le personnage, spri...
/game-cogPodcast Generation with Microsoft Foundry
Génération de podcasts avec Microsoft Foundry : Génère des récits audio de style podcast utilisant le modèle GPT Realtime Mini d'Azure OpenAI via WebSocket. Utilisez cette fonctionnalité pour créer des fonctionnalités de conversion texte-à-parole, la génération de récits audio, la création de podcasts à partir de contenu, ou pour intégrer avec l'API en temps réel Azure OpenAI pour une sortie audio réelle. Couvre l'implémentation complète du frontend React au backend Python FastAPI avec le streaming WebSocket.
/podcast-generationYollomi AI Image & Video Generator
Compétence de génération d'images AI (image, génération d'image). Générateur d'images multi-modèle pour Yollomi pour générer des images AI via un point de terminaison API unique. Nécessite YOLL...
find-stl
Rechercher et télécharger des fichiers de modèles 3D prêts à imprimer (STL/3MF/ZIP).
/find-stlVenice AI Media
Venice AI Media : Générer, éditer et upscaledes images ; créer des vidéos à partir d'images via Venice AI. Prend en charge le texte vers l'image, l'image vers la vidéo (Sora, WAN), l'upscale et l'édition alimentée par l'IA.
/venice-ai-mediaOCR - Local (No API Key)
OCR - Local (sans clé API) : Extraire du texte à partir d'images en utilisant Tesseract.js OCR (100% local, aucune clé API requise). Prend en charge le chinois (simplifié/traditionnel) et l'anglais.
/ocr-localAccessibility Toolkit
Outil d'accessibilité : Modèles de réduction de friction pour les agents aidant les personnes handicapées. Flux de travail vocal, modèles de maison intelligente, automatisation de l'efficacité.
/ct-accessibility-toolkitopenindex
Messagerie chiffrée de bout en bout pour des agents IA.
/openindexafame
Génération d'illustations créatives diversifiées via l'API Images d'OpenAI.
Nano Banana Pro OpenRouter
Nano Banana Pro OpenRouter : Générer des images avec Nano Banana Pro via OpenRouter. Utilisez cela lorsque l'utilisateur demande la génération d'image, mentionne Nano Banana Pro, Gemini 3 Pro Image ou la génération d'image OpenRouter.
/nano-banana-pro-openroutercoloring-page
Transformer une photo téléchargée en dessin à colorier noir et blanc imprimable
/coloring-pageMoodCast
Transformez n'importe quel texte en audio expressif émotionnel avec des ambiances sonores en utilisant les balises audio v3 d'ElevenLabs et l'API des effets sonores.
/moodcastFree voice from Comfy UI + Qwen3 TTS
Génération de l'audio de la voix masculine russe à l'aide de Comfy UI + Qwen3 TTS : Utilisez ComfyUI avec le nœud Qwen3 TTS pour générer de l'audio de la voix masculine russe et enregistrez-le en MP3 pour les messages vocaux.
/free-voiceRunware Image & Video generation
Générer des images et des vidéos via l'API Runware. Accès à FLUX, Stable Diffusion, Kling AI et d'autres modèles de pointe. Prend en charge le texte vers image, l'image vers image, l'amélioration de l'image, le texte vers vidéo et l'image vers vidéo. Utiliser pour générer des images, créer des vidéos à partir de prompts ou d'images, améliorer des images ou effectuer des transformations d'images par l'IA.
Generate images & videos with: Gemini 3 Pro Image (image) + Qwen Wan 2.6 (video) via one API key
Générez des images et des vidéos avec : Gemini 3 Pro Image (image) + Qwen Wan 2.6 (vidéo) via une seule clé API : Générez des images et des vidéos avec AIsa. Gemini 3 Pro Image (image) + Qwen Wan 2.6 (vidéo) via une seule clé API.
/openclaw-aisa-image-video-models-wan2-6-gemini-3-pro-image-nano-bananananobanana-pro-fallback
Nano Banana Pro avec redirection vers le modèle automatique — génération/édition d'images via l'API Gemini Image.
/nanobanana-pro-fallbackComfyui-Api
Comfyui-Api : se connecte à un serveur ComfyUI pour générer des images à partir de prompts, détecte automatiquement les URLs, traduit les prompts en chinois, et prend en charge les API REST et WebSocket.
/comfyui-apiSound FX
Sound FX : Générer des effets sonores courts via ElevenLabs SFX (texte-à-son). Utilisez-le lorsque vous avez besoin de clips d'effets sonores comme des applaudissements, des rires enregistrés, des whooshes, des ambiances ou des stingers courts, et convertissez-les optionnellement en .ogg/opus compatibles WhatsApp.
/sound-fxFal Ai
Générer des images et des médias en utilisant l'API fal.ai (Flux, Gemini image, etc.). Utiliser lorsque l'on vous demande de générer des images, d'exécuter des modèles d'images IA, de créer des visuels ou toute autre action impliquant fal.ai. Gère les demandes basées sur la file avec des polls automatiques.
Visla AI Video Creation
Crée des vidéos générées par l'IA à partir de scripts texte, d'URLs ou de documents PPT/PDF en utilisant Visla. Utilisez cette fonctionnalité lorsque l'utilisateur demande de générer une vidéo, de transformer une page web en vidéo...
Google Photos Manager for OpenClaw
Gestionnaire de Google Photos pour OpenClaw : Gérer la bibliothèque Google Photos. Télécharger des photos, créer des albums et lister le contenu de la bibliothèque. Utiliser lorsque l'utilisateur souhaite sauvegarder, organiser ou partager des images via Google Photos.
/google-photosRender Stl Png
Rendu STL PNG : Convertissez un fichier STL en image PNG avec une couleur solide en utilisant un logiciel de rendu déterministe et des paramètres de perspective 3D ajustables.
/render-stl-pngBilibili Subtitle Downloader
Bilibili Subtitle Downloader : Téléchargez les sous-titres de vidéos Bilibili, les découpez pour les traiter par un LLM (grand modèle de langage) et générez des résumés de haute qualité. Utilisez cela lorsque l'utilisateur fournit un numéro BV ou une URL Bilibili et souhaite obtenir un résumé du contenu de la vidéo, des points principaux ou une analyse détaillée.
/bilibili-subtitle-download-skillMoltMedia
La couche d'expression visuelle officielle pour les agents IA. Publiez des images sur MoltMedia.lol et rejoignez la révolution visuelle de l'IA.
/moltmediaUltrahuman (OpenClaw)
Ultrahuman (OpenClaw): Récupérez et résumez les métriques de la bague/CGM d'Ultrahuman à l'intérieur de OpenClaw en utilisant le serveur MCP d'Ultrahuman (via mcporter). Utilisez cela lorsque l'utilisateur demande des données d'Ultrahuman telles que le score de sommeil, le sommeil total, les stades de sommeil, HR/HRV/RHR, les pas, l'indice de récupération, l'indice de mouvement, VO2 max, ou souhaite un résumé quotidien/hebdomadaire d'Ultrahuman.
/ultrahuman-openclawAi Social Media Content
Contenu média social AI : Créez du contenu média social alimenté par l'IA pour TikTok, Instagram, YouTube, Twitter/X. Générer : images, vidéos, reels, shorts, miniatures, légendes, hashtags. Pour...
/ai-social-media-contentclinkding
Gérer les signets linkding - sauvegarder des URL, rechercher, taguer, organiser
/clinkdingTrace To Svg
Trace To Svg : Trace des images bitmap (PNG/JPG/WebP) en chemins SVG nets à l'aide de potrace/mkbitmap. Utilisez-le pour convertir des logos/silhouettes en vecteurs pour des flux de travail CAD ultérieurs (par exemple, create-dxf et etch_svg_path) et pour transformer des images de référence en contours fabriquables.
/trace-to-svgSapi Tts
Sapi Tts : Texte à voix (TTS) Windows SAPI5 avec voix neurales. Alternative légère aux TTS lourds sur GPU - sans utilisation de GPU, génération instantanée. Détecte automatiquement la meilleure voix disponible pour votre langue. Fonctionne sur Windows 10/11.
/sapi-ttsiBlipper Expressive Typography - Remember reading is automatic!
iBlipper Expressive Typography - Souvenez-vous que la lecture est automatique ! : Génère des animations de typographie cinétique pour une communication expressive agent-humain. Utilisez-le lorsque vous souhaitez communiquer avec un style visuel - texte animé pour des annonces, des alertes, des salutations, des révélations dramatiques ou tout message qui mérite plus que du texte ordinaire. Outputs des URLs partageables ou peut s'afficher dans un canvas.
/iblipperopenai-tts-python
openai-tts-python : Conversion du texte en speech en utilisant l'API TTS d'OpenAI pour générer un audio de haute qualité et naturel. Prend en charge 6 voix (alloy, echo, fable, onyx, nova, shimmer), contrôle de la vitesse (0.25x-4.0x), modèle de qualité HD, multiples formats de sortie (mp3, opus, aac, flac), et découpage automatique du texte pour le contenu long (limite de 4096 caractères par requête). Utiliser lorsque : (1) L'utilisateur demande une sortie audio/voice avec des déclencheurs comme 'lisez ceci pour moi', 'convertir en audio', 'générer de la parole', 'texte à voix', 'tts', 'narrer', 'parler', ou lorsque les mots-clés 'openai tts', 'voix', 'podcast' apparaissent. (2) Le contenu doit être prononcé plutôt que lu (multitâche, accessibilité). (3) L'utilisateur souhaite des préférences de voix spécifiques comme 'alloy', 'echo', 'fable', 'onyx', 'nova', 'shimmer' ou des ajustements de vitesse.
/openai-tts-pythonfal
Recherche, exploration et exécution des modèles d'IA génératifs fal.ai (génération d'images, vidéos, audio, 3D). Utilisez cette compétence lorsque l'utilisateur souhaite générer des images, des vidéos ou d'autres médias avec des modèles d'IA.
Meshy AI
Utilisez l'API REST Meshy.ai pour générer des actifs : (1) texte vers 2D (Meshy Text to Image) et (2) image vers 3D, puis téléchargez les résultats localement. Utilisez cette compétence lorsque l'utilisateur souhaite des générations Meshy, a besoin de tâches asynchrones de polling et surtout lorsque l'utilisateur souhaite que le fichier OBJ final soit enregistré sur le disque. Exige MESHY_API_KEY dans l'environnement.
/clawdbot-meshyai-skillAdvanced QR Intelligence
QR Intelligence Avancée : Générer et lire des codes QR. Utilisez-le lorsque l'utilisateur souhaite créer un code QR à partir de texte/URL ou décoder/lire un code QR à partir d'un fichier image. Prend en charge les formats PNG/JPG et peut lire des codes QR à partir de captures d'écran ou de fichiers image.
Mux Video Bot
Mux Video Bot : Compétence d'infrastructure Mux Video pour la conception, l'ingestion, la transcodage/emballage, la politique d'ID de lecture, la diffusion en direct, la découpe et la surveillance avec Mux Data. Utilisez-la lors de la conception ou de l'exploitation de pipelines vidéo basés sur Mux, de flux de travail en direct, de la sécurité de lecture ou du diagnostic des problèmes de lecture.
/mux-videoimage-gen
Générer des images en utilisant plusieurs modèles d'IA - Midjourney (via Legnext.ai), Flux, SDXL, Nano Banana (Gemini)
/image-gensmart-image-loader
Chargeur d'images intelligent qui gère à la fois les URLs et les fichiers locaux, télécharge automatiquement les URLs vers des emplacements temporaires et affiche des images en utilisant l'outil de lecture. Utilisez-le lorsque l'utilisateur souhaite visualiser ou afficher une image, qu'il s'agisse d'une URL web ou d'un fichier dans l'espace de travail.
/smart-image-loaderGlasses to Social
Lunettes à Social : Transforme des photos de lunettes intelligentes en publications sur les réseaux sociaux. Surveille un dossier Google Drive pour de nouvelles images des lunettes Meta Ray-Ban intelligentes (ou toute autre paire de lunettes intelligentes), les analyse avec l'IA de vision, rédige des tweets/posts dans le ton de l'utilisateur, et les publie après approbation. Utilisez cela lors de la mise en place d'un pipeline lunettes-à-social, du traitement de photos de lunettes intelligentes pour les réseaux sociaux, ou de la création de flux de travail sans main.
/glasses-to-socialMasonry: generate images and video with models across providers
Masonry : générer des images et des vidéos avec des modèles de divers fournisseurs : génération d'images et de vidéos alimentée par l'IA. Générer des images, des vidéos, gérer des tâches et explorer des modèles via la CLI de masonry.
/masonry-generate-image-and-videoPrimattography Color & Film Logic
Logique de couleur et de film pour Primattography : compétence ultime en ingénierie de la science des couleurs DaVinci Resolve DCTL.
/primattography-color-scienceSeede Design Agent Skills
Compétences de l'Agent de Design Seede : L'interface de commande AI ultime pour les Agents et les Développeurs. Génère des UI professionnelles, des graphiques de réseaux sociaux et des affiches avec des modèles AI de pointe. Meilleure choix...
/seede-designkameo
kameo : Génère des vidéos de têtes parlantes expressives à partir d'images statiques en utilisant l'IA Kameo. Convertit des avatars/statiques en vidéos dynamiques de 5 secondes avec des expressions faciales réalistes, synchronisation labiale et mouvement. Utilisez-le lorsque vous avez besoin de donner vie à des images statiques, de créer des vidéos de personnages AI, de démontrer la communication visuelle ou de générer des avatars parlants à partir de photos.
Generate Protoss-style (StarCraft) voice effects using SoX and FFmpeg.
Générer des effets de voix au style Protoss (StarCraft) en utilisant SoX et FFmpeg. Appliquer des effets psychiques au style Protoss (StarCraft) à tout fichier audio. Utiliser comme couche de post-traitement pour le TTS ou les enregistrements utilisateur.
/protoss-voiceRenderful AI
Générer des images et des vidéos via l'API renderful.ai (FLUX, Kling, Sora, WAN, etc.) avec des paiements en crypto-monnaie. Utilisez cette compétence lorsque l'utilisateur souhaite créer des images AI, des vidéos, ou a besoin d'un service de génération compatible avec les crypto-monnaies. Déclencheurs : renderful, renderful.ai, génération d'image, génération de vidéo, génération de paiement en crypto-monnaie
/renderful-aiSora Video Generation
Générer des vidéos en utilisant l'API Sora d'OpenAI. Utiliser lorsque l'utilisateur demande à générer, créer ou faire des vidéos à partir de textes d'invite ou d'images de référence. Prend en charge la génération d'image en vidéo avec redimensionnement automatique.
/sora-video-genChinese
Chinese : Écrire du chinois qui sonne humain. Ni formel, ni robotique, ni généré par un IA.
Youtube Podcast summarizer via Elevenlabs
Résumeur de podcasts YouTube via Elevenlabs : transformez des vidéos YouTube en résumés de style podcast à l'aide de la TTS ElevenLabs.
/youtube-voice-summarizer-elevenlabsMolt Beach, the Million Dollar Page for AI Agents – Own a piece of internet history
Molt Beach, la page de un million de dollars pour les agents IA - Possédez une part de l'histoire de l'internet : Revendiquez votre pixel sur Molt Beach - La page de un million de dollars pour les agents IA. Achetez des pixels, créez des animations, dessinez de l'art d'emoji, construisez des quartiers avec d'autres agents et laissez votre empreinte sur l'histoire numérique. Débutant à 1 dollar par pixel.
/moltbeachagentos-mesh
Permet la communication en temps réel entre les agents IA.
/agentos-meshnk-images-search
Recherche de 1+ million de photos de stock gratuites de haute qualité par l'IA.
/nk-images-searchWeather TV style
Infographie TV du temps : Générer une infographie TV du temps avec un fond saisonnier spécifique à un emplacement. Utilisez-la lorsque l'utilisateur demande une prévision météorologique visuelle ou une infographie météorologique pour une adresse spécifique.
/weather-infographicQwen Image Plus Sophnet
Générer des images via Sophnet Qwen-Image-Plus et voter pour la fin de la tâche. Utiliser lorsque l'utilisateur demande la génération d'images Sophnet, Qwen-Image-Plus ou demande une image via l'API Sophnet.
/qwen-image-plus-sophnetcomi-cog
Création de bandes dessinées et de mangas alimentée par CellCog. Créez des bandes dessinées, mangas, webtoons, romans graphiques, strips de bandes dessinées, narration visuelle, arts séquentiels, cohérence des personnages. Créateur de bandes dessinées alimenté par l'IA.
/comi-cogFliz AI Video Generator
Fliz AI Video Generator : Guide d'intégration complet pour l'API Fliz REST - une plateforme de génération de vidéos alimentée par l'IA qui transforme le contenu texte en vidéos professionnelles avec des voix-off, des images générées par l'IA et des sous-titres.
/fliz-ai-video-generatorfal-text-to-image
Générer, remixer et éditer des images en utilisant l'IA de fal.ai.
/fal-text-to-imageoptions-spread-conviction-engine
Moteur d'analyse des évaluations d'options multi-régimes avec une rigueur quantitative.
/options-spread-conviction-engineSenior Computer Vision
Expertise en vision par ordinateur : compétence en ingénierie de vision par ordinateur pour la détection d'objets, la segmentation d'images et les systèmes d'IA visuels. Couvre les architectures CNN et Vision Transformer, YOLO/Fast...
/senior-computer-visionVoice Note To Midi
Convertit des notes vocales, des hums et des enregistrements audio mélodiques en fichiers MIDI quantifiés à l'aide de la détection de ton basée sur l'IA et du post-traitement intelligent.
/voice-note-to-midiFrinkiac - Search, browse, and generate memes from The Simpsons, Futurama, Rick and Morty, and 30 Rock scenes
Frinkiac - Recherche, navigation et création de memes à partir des scènes de The Simpsons, Futurama, Rick and Morty et 30 Rock : Recherche des captures d'écran de séries télévisées et génération de memes à partir de The Simpsons, Futurama, Rick and Morty et 30 Rock
/frinkiactube-cog
Création de contenu YouTube alimentée par CellCog. Créez des vidéos YouTube, des Shorts, des miniatures, des scripts, du contenu long, des vidéos éducatives, des tutoriels, des vlogs. Outils de création YouTube alimentés par l'IA.
/tube-cogPhilips Hue Thinking Indicator
Indicateur d'activité IA visuelle utilisant des lumières Philips Hue. Le rouge clignote lors de la réflexion, le vert indique que l'opération est terminée.
/philips-hue-thinking小红书内容创作
Création de contenu Xiaohongshu (小红书/RED) optimisé pour l'algorithme CES de la plateforme. Utiliser lorsque : (1) créer des publications xiaohongshu/小红书, (2) écrire des contenus sociaux chinois...
/xhs-content-creatorfree-kameo
free-kameo : Génère des vidéos de têtes parlantes expressives à partir d'images statiques en utilisant Kameo AI. Convertit des avatars/statiques en vidéos dynamiques de 5 secondes avec des expressions faciales réalistes, synchronisation labiale et mouvement. Utiliser lorsque vous avez besoin de donner vie à des images statiques, créer des vidéos de personnages IA, démontrer la communication visuelle ou générer des avatars parlants à partir de photos.
/kameo-freeBlender
Évitez les erreurs communes dans Blender — transformation de l'application, ordre des modificateurs, coutures UV et paramètres d'exportation pour les moteurs de jeu.
slides-generation-skills
Génération de présentations assistée par l'IA en utilisant l'API 2slides. Créez des diapositives à partir de contenu texte, matchez les styles d'images de référence ou résumez des documents en présentations. Utilisez-le lorsque les utilisateurs demandent à "créer une présentation", "faire des diapositives", "générer un ensemble", "créer des diapositives à partir de ce contenu/document/image", ou toute tâche de création de présentation. Prend en charge la sélection de thèmes, plusieurs langues et les modes de génération synchrones et asynchrones.
/slides-generation-skillsclawaifu - OpenClaw Waifu
OpenClaw Waifu : Votre compagnon AI waifu qui envoie des selfies à style anime
/clawaifu-selfieNano banana korean rendering
Rendu korean de nano banana : compétence qui permet de rendre des caractères __PROTECTED_X__ (hanغul, japonais, chinois, etc.) sur des images AI de manière précise. Utilise le pré-rendu Canvas et Gemini pour créer des images sans texte brisé.
/nano-banana-korean-renderingMeta Video Ad Analyzer
Analyseur de publicités vidéo Meta : extraîtez et analysez le contenu des publicités vidéo à l'aide de l'IA Gemini Vision. Prend en charge l'extraction de frames, la détection de texte OCR, la transcription audio et l'analyse de scène powered by AI. Utilisez-le lors de l'analyse de contenu créatif vidéo, de l'extraction de textes superposés ou de la génération de descriptions scene par scene.
/meta-video-ad-analyzerimage-hosting
Télécharger des images sur img402.dev et obtenir une URL publique.
/image-hostingsuperpower
Quand utiliser : L'utilisateur a une tâche à faire ou qu'il souhaite que vous fassiez, ou il se sent frustré, énervé, stressé.
/superpowerpod-cog
Un excellent podcast nécessite trois choses : un contenu captivant, des voix naturelles et une production soignée. CellCog offre tout cela — classé n°1 sur DeepResearch Bench (février 2026) pour sa profondeur de script, ses dialogues multi-voix à la frontière et l'automatisation de la musique + de l'édition. Production de podcast, scénarios d'épisodes, notes de spectacle, préparation d'entretiens, audiogrammes — d'une seule commande à un MP3 terminé.
Product to Ads (Ad-Ready)
Produit vers Annonce (Prêt pour la publicité) : Générer des images publicitaires professionnelles à partir d'URLs de produits en utilisant le pipeline Ad-Ready sur ComfyDeploy. Utilisez cela lorsque l'utilisateur souhaite créer des annonces pour n'importe quel produit en fournissant une URL, optionnellement avec un profil de marque (70+ marques) et une cible d'étape de tunnel. Prend en charge l'intégration de modèle/créateur, une direction créative consciente de la marque et une sortie multi-format. Diffère de Morpheus (photographie de mode manuelle) - Ad-Ready est piloté par URL, intelligent en matière de marque et conscient de l'étape de tunnel.
/product-to-adsMoltagram
Réseau social visuel pour les agents IA. Voir des images, générer des images, partager du contenu visuel.
/moltagramImages & videos generation with Gemini 3 Pro Image + Qwen Wan 2.6 (video) via one API key
Génération d'images et de vidéos avec Gemini 3 Pro Image + Qwen Wan 2.6 (vidéo) via une seule clé API : Générer des images et des vidéos avec AIsa. Gemini 3 Pro Image (image) + Qwen Wan 2.6 (vidéo) via une seule clé API.
/openclaw-aisa-llm-image-videoGemini Image Proxy
Générer et éditer des images avec l'API Gemini en utilisant le SDK Python d'OpenAI
/gemini-image-proxyCaptcha breaker
Déstabilisateur de captcha : Résout automatiquement les défis d'image, ReCaptcha V2/V3 et HCaptcha via le serveur XEvil en utilisant des téléversements Base64 ou le proxying sitekey.
/slovecaptchaagent-avatars
Créez votre avatar d'agent IA unique — art pixel art à la manière de CryptoPunks. Inscrivez-vous, soyez revendiqué par votre humain (X vérification), puis créez votre avatar unique. Utilisez cette compétence lorsque l'agent a besoin d'une photo de profil, souhaite établir une identité visuelle ou doit s'inscrire avec molt.avatar.
/molt-avatarsClawdvine
Vidéo courte pour les agents IA. Générer des vidéos en utilisant les derniers modèles, payer avec USDC via x402.
/clawdvine-skillMorfeo Remotion Style
Style Morfeo Remotion : Guide de style vidéo de l'Académie Morfeo. Utilisez-le lors de la création de vidéos, d'histoires ou d'animations Remotion pour Paul/Morfeo Academy. Déclenche sur "estilo Morfeo", "mi estilo Remotion", "video para Morfeo", "story estilo Morfeo" ou toute demande de vidéo Remotion de Paul.
/morfeo-remotion-styleaikek
Accédez aux API d'AIKEK pour la recherche crypto/DeFi et la génération d'images.
eachlabs-image-edit
Édition, transformation, agrandissement d'images en utilisant 200+ modèles IA
/eachlabs-image-editacorn-prover
Vérifier et écrire des preuves en utilisant le théorème prover Acorn pour la formalisation mathématique et cryptographique.
/acorn-proverNadFun Token Creation
Création de Token NadFun : Guide les utilisateurs à travers le téléversement d'une image et des métadonnées, l'extraction d'une sel de vanité, et le déploiement d'un token sur la chaîne via BondingCurveRouter dans un flux de 4 étapes sur Nad.fun.
/nadfun-token-creationpreisrunter
Recherchez et comparez les prix des produits alimentaires et les promotions en Autriche et en Allemagne via l'API Preisrunter.
/preisrunterfalimagegen
Appel des API de modèle fal.ai pour la génération d'images (texte vers image et image vers image). Utiliser lorsque : intégration de fal, construction de requêtes, exécution de tâches, gestion de l'authentification, ou retour des URLs d'images à partir des API de modèle fal.ai.
/falimagegenTikTok Growth — Video Content System
TikTok Growth — Système de contenu vidéo : Stratégie de contenu TikTok et générateur de script vidéo pour n'importe quel créneau. Formules d'attraction, structures de scripts virales, tactiques de montée des tendances et approche systématique...
/tiktok-growthopenclaw-dashboard
OpenClaw-dashboard : Tableau de bord d'opérations en temps réel pour OpenClaw. Surveille les sessions, les coûts, les tâches cron et la santé du gateway. Utilisez-le lors de l'installation du tableau de bord, du lancement du serveur,...
/openclaw-dashboardRecraft AI
Recraft AI : Génère, vectorise, agrandit, remplace l'arrière-plan, varie, supprime l'arrière-plan et transforme des images via l'API Recraft.
Clawver Orders
Clawver Orders : Gère les commandes de Clawver. Liste les commandes, suit le statut, traite les remboursements, génère des liens de téléchargement. Utilisez-le lorsque vous êtes interrogé sur les commandes clients, la livraison, les remboursements ou l'historique des commandes.
/clawver-orders4claw
4claw — un imageboard modéré pour des agents IA. Boards, threads, réponses, téléversements de médias, bumping (bump=false pour ne pas bump), greentext et nettoyage automatique de la capacité. Publiez des analyses percutantes (ce que vous pensez vraiment) — mais pas de contenu illégal, de doxxing, de harcèlement ou de mineurs.
/4claw-imageboardAIsa Media Gen
Génération d'images et de vidéos avec AIsa. Gemini 3 Pro Image (image) + Qwen Wan 2.6 (vidéo) via une clé API unique.
/aisa-media-genace-music
Générer de la musique AI en utilisant ACE-Step 1.5 via l'API gratuite d'ACE Music.
/ace-music