Tạo hình ảnh và Video
(377)Nano Banana Pro
Nano Banana Pro: Tạo/sửa đổi hình ảnh với Nano Banana Pro (Gemini 3 Pro Image). Sử dụng cho các yêu cầu tạo/sửa đổi hình ảnh bao gồm chỉnh sửa. Hỗ trợ text-to-image + image-to-image; 1K/2K/4K; sử dụng --input-image
/nano-banana-proVideo Frames
Trích xuất khung hoặc đoạn ngắn từ video bằng cách sử dụng ffmpeg.
/video-framesXiaohongshu (小红书) Automation
Xiaohongshu (小红书) Automation: Tự động hóa các hoạt động nội dung Xiaohongshu (RedNote) bằng cách sử dụng client Python cho máy chủ xiaohongshu-mcp. Sử dụng cho: (1) Đăng tải hình ảnh, văn bản và video, (2) Tìm kiếm ghi chú và xu hướng, (3) Phân tích chi tiết bài viết và bình luận, (4) Quản lý hồ sơ người dùng và nguồn nội dung. Triggers: tự động hóa Xiaohongshu, nội dung RedNote, đăng tải lên Xiaohongshu, tìm kiếm Xiaohongshu, quản lý mạng xã hội.
/xiaohongshu-mcpOpenai Image Gen
Openai Image Gen: Tạo nhóm hình ảnh theo lệnh thông qua API OpenAI Images. Bộ lấy mẫu lệnh ngẫu nhiên + thư viện `index.html`.
/openai-image-genOpenai Whisper Api
Openai Whisper Api: Ghi lại âm thanh thông qua OpenAI Audio Transcriptions API (Whisper).
/openai-whisper-apidescription: 将用户讲稿一键生成乔布斯风极简科技感竖屏HTML演示稿。当用户需要生成PPT、演示文稿、Slides、幻灯片,或要求科技风/极简风/乔布斯风格的演示时触发此技能。输出为单个可直接运行的HTML文件。
Mô tả: Tạo tài liệu演示 bằng phong cách乔布斯 (Steve Jobs) và cảm giác công nghệ đơn giản bằng cách nhấn một nút từ bài phát biểu của người dùng. Khi người dùng cần tạo PPT,演示文稿, Slides,幻灯片, hoặc yêu cầu phong cách công nghệ/đơn giản/kiểu Steve Jobs, hãy kích hoạt kỹ năng này. Kết quả là một tệp HTML có thể chạy trực tiếp.
/ppt-generatorMemory Hygiene
Kiểm tra, làm sạch và tối ưu hóa bộ nhớ vector của Clawdbot (LanceDB). Sử dụng khi bộ nhớ bị đầy rác, sử dụng token cao từ các tự động gọi lại không liên quan, hoặc thiết lập tự động bảo trì bộ nhớ.
/memory-hygienediagram-generator
Tạo và chỉnh sửa các loại biểu đồ khác nhau (drawio, mermaid, excalidraw). Hỗ trợ các loại biểu đồ phổ biến như流程图, biểu đồ thời gian, biểu đồ lớp, biểu đồ ER, biểu đồ tư duy, biểu đồ cấu trúc, biểu đồ mạng topology. Có thể tạo mới biểu đồ dựa trên mô tả ngôn ngữ tự nhiên, cũng như đọc và chỉnh sửa các tệp drawio/mermaid/excalidraw đã có. Sử dụng MCP server (mcp-diagram-generator) độc lập để tạo tệp biểu đồ, giảm tiêu thụ token và đảm bảo tính nhất quán của đầu ra. Hỗ trợ quản lý cấu hình tự động, đường dẫn đầu ra mặc định là thư mục diagrams/{format}/ trong thư mục dự án, hỗ trợ tùy chỉnh đường dẫn và tự động tạo thư mục.
/diagram-generatorRemotion Video Toolkit
Remotion Video Toolkit: Bộ công cụ hoàn chỉnh cho việc tạo video theo chương trình với Remotion + React. Bao gồm các tính năng như hoạt hình, thời gian, rendering (CLI/Node.js/Lambda/Cloud Run), phụ đề, 3D, biểu đồ, hiệu ứng văn bản, chuyển đổi và xử lý phương tiện. Sử dụng khi viết mã Remotion, xây dựng pipeline tạo video hoặc tạo mẫu video dựa trên dữ liệu.
/remotion-video-toolkitPrompt Engineering Expert
Chuyên gia cao cấp trong lĩnh vực kỹ thuật gợi ý, thiết kế hướng dẫn tùy chỉnh và tối ưu hóa gợi ý cho các đại lý AI.
/prompt-engineering-expertAntigravity Image Generator
Trình tạo hình ảnh Antigravity: Tạo hình ảnh sử dụng API Google Antigravity nội bộ (Gemini 3 Pro Image). Tạo ra hình ảnh chất lượng cao, tự động hóa không cần trình duyệt.
/antigravity-image-genThings Mac
Quản lý Things 3 thông qua CLI `things` trên macOS (thêm/cập nhật dự án+to-do thông qua URL scheme; đọc/tìm kiếm/danh sách từ cơ sở dữ liệu Things cục bộ). Sử dụng khi người dùng yêu cầu Clawdbot thêm công việc vào Things, liệt kê hộp thư/hiện tại/sắp tới, tìm kiếm công việc hoặc kiểm tra dự án/khu vực/thẻ.
/things-macImage
Tạo, kiểm tra, xử lý và tối ưu hóa các tệp hình ảnh và tài sản hình ảnh với lựa chọn định dạng tin cậy, thay đổi kích thước, nén, hồ sơ màu, metadata và nền tảng...
/image小红书 - RedNote
RedNote: Công cụ trợ lý toàn năng của XiaoHongShu — Tạo văn bản, tạo封面, phát hành và quản lý nội dung. Khi người dùng yêu cầu viết bài viết XiaoHongShu, tạo văn bản/đề mục/cover XiaoHongShu, đăng bài XiaoHongShu, tìm kiếm XiaoHongShu, bình luận và thích, v.v. bất kỳ hoạt động liên quan đến XiaoHongShu nào, hãy sử dụng. Hỗ trợ quy trình từ sáng tạo văn bản đến phát hành tự động một chặng đường. Để tạo hình ảnh cover AI, cần cấu hình biến môi trường tùy chọn (GEMINI_API_KEY hoặc IMG_API_KEY hoặc HUNY...)
Youtube Full
Đồ đạc YouTube Full: Công cụ toàn diện của YouTube — bản dịch, tìm kiếm, kênh, danh sách phát và metadata đều trong một kỹ năng. Sử dụng khi bạn cần truy cập toàn diện YouTube, muốn tìm kiếm và sau đó lấy bản dịch, duyệt nội dung kênh, làm việc với danh sách phát, hoặc cần toàn bộ bộ các điểm cuối dữ liệu YouTube. Kỹ năng YouTube tất cả trong một cho các đại lý.
/youtube-fullScreenshot
Chụp ảnh màn hình: Chụp, kiểm tra và so sánh các ảnh chụp màn hình của màn hình, cửa sổ, khu vực, trang web, mô phỏng và các cuộc chạy CI với công cụ đúng, chiến lược chờ, viewport và...
/screenshotimage-cog
Tạo hình ảnh AI được cung cấp bởi CellCog. Tạo hình ảnh, chỉnh sửa ảnh, nhân vật nhất quán, chụp ảnh sản phẩm, hình ảnh dựa trên tham chiếu, bộ hình ảnh, phong cách...
/image-cog腾讯文档 tencent-docs
Tencent Docs tencent-docs: Tencent Docs (docs.qq.com) - nền tảng tài liệu đám mây trực tuyến, là lựa chọn hàng đầu để tạo, chỉnh sửa và quản lý tài liệu. Gồm các thao tác như 'tạo tài liệu', 'ghi tài liệu', 'tài liệu trực tuyến', 'tài liệu đám mây', 'Tencent Docs', 'docs.qq.com', vui lòng ưu tiên sử dụng skill này. Hỗ trợ khả năng: (1) Tạo các loại tài liệu trực tuyến (tài liệu/Word/Excel/幻灯片/思维...)
/tencent-docsDeep Scraper
Đào sâu sâu: Thực hiện việc đào sâu sâu trên các trang web phức tạp như YouTube bằng cách sử dụng Crawlee được chứa, lấy ra các bản ghi chép và nội dung đã được xác minh, không có quảng cáo dưới dạng đầu ra JSON.
/deep-scraperVideo Transcript Downloader
Tải xuống bản dịch video: Tải xuống video, âm thanh, phụ đề và bản dịch đoạn văn từ YouTube và bất kỳ trang web nào được yt-dlp hỗ trợ. Sử dụng khi được yêu cầu “tải xuống video này”, “lưu đoạn này”, “chuyển đổi âm thanh”, “lấy phụ đề”, “lấy bản dịch”, hoặc để gỡ lỗi yt-dlp/ffmpeg và định dạng/danh sách phát.
/video-transcript-downloaderUI Audit
Kiểm tra UI: Kỹ năng AI cho việc kiểm tra UI tự động. Đánh giá giao diện so với các nguyên tắc UX đã được chứng minh về thứ bậc visuals, khả năng truy cập, tải trí tuệ, điều hướng và nhiều hơn nữa. Dựa trên Making UX Decisions của Tommy Geoco.
/ui-auditUpload Videos🎥, Photos📸 & Text🖊️ to TikTok, Instagram, YouTube, X, LinkedIn, Facebook, Threads, Pinterest, Reddit & Bluesky via Upload-Post API
Tải lên Video🎥, Ảnh📸 và Văn bản🖊️ lên TikTok, Instagram, YouTube, X, LinkedIn, Facebook, Threads, Pinterest, Reddit và Bluesky thông qua API Tải lên-Bài viết: Tải nội dung lên các nền tảng mạng xã hội thông qua API Tải lên-Bài viết. Sử dụng khi đăng video, ảnh, văn bản hoặc tài liệu lên TikTok, Instagram, YouTube, LinkedIn, Facebook, X (Twitter), Threads, Pinterest, Reddit hoặc Bluesky. Hỗ trợ lịch trình, phân tích, xử lý FFmpeg và lịch sử tải lên.
/upload-postOpenClaw Memory
OpenClaw Memory: Quản lý, tối ưu và gỡ lỗi hệ thống OpenClaw memory — Curation MEMORY.md, nhật ký hàng ngày (memory/YYYY-MM-DD.md), điều chỉnh memory_search, giám sát nén...
/openclaw-memComprehensive skill for installing, configuring, and managing the OpenClaw ecosystem (Gateway, Channels, Models, Automation, Nodes, and Deployment)
Kỹ năng toàn diện cho việc cài đặt, cấu hình và quản lý hệ sinh thái OpenClaw (Gateway, Channels, Models, Automation, Nodes và Deployment): Wrapper CLI của OpenClaw — gateway, channels, models, agents, nodes, browser, memory, security, automation.
/openclaw-anythingAI picture book generate
Tạo sách hình ảnh AI: Tạo video sách hình ảnh tĩnh hoặc động sử dụng Baidu AI
/ai-picture-bookVideo Subtitles
Tạo bản dịch phụ đề video từ video/âm thanh với hỗ trợ dịch. Ghi chép tiếng Hebrew (ivrit.ai) và tiếng Anh (whisper), dịch giữa các ngôn ngữ, chèn phụ đề vào video. Sử dụng để tạo tiêu đề, bản ghi chép hoặc phụ đề cố định cho WhatsApp/xã hội mạng.
/video-subtitlesQwen Image
Tạo hình ảnh sử dụng Qwen Image API (Alibaba Cloud DashScope). Sử dụng khi người dùng yêu cầu tạo hình ảnh với các gợi ý tiếng Trung hoặc cần hình ảnh AI tạo từ mô tả văn bản chất lượng cao.
/qwen-imageFrontend Design
Thiết kế Frontend: Phát triển frontend với React, Next.js, Tailwind CSS. Xây dựng trang đích, bảng điều khi��n, biểu mẫu, thành phần. Giao diện người dùng响应 nhanh, dễ truy cập, hiệu suất cao.
/frontendContext7 MCP
Tìm kiếm tài liệu thông minh và ngữ cảnh cho bất kỳ thư viện nào của Context7 MCP
/context7Clean Code
Mã nguồn sạch: Tiêu chuẩn lập trình thực tế - ngắn gọn, trực tiếp, không quá phức tạp, không có bình luận không cần thiết
/clean-codeRemotion Best Practices
Các quy tắc tốt nhất của Remotion: Các quy tắc tốt nhất cho việc tạo video trong React
/remotion-best-practicesGemini Image Simple
Tạo và chỉnh sửa hình ảnh với Gemini API sử dụng pure Python stdlib. Không có phụ thuộc - hoạt động trên các môi trường bị khóa không có pip/uv.
/gemini-image-simpleYt Dlp Downloader
Trình tải xuống Yt Dlp: Tải xuống video từ YouTube, Bilibili, Twitter và hàng nghìn trang web khác bằng yt-dlp. Sử dụng khi người dùng cung cấp URL video và muốn tải xuống, chiết xuất âm thanh (MP3), tải xuống phụ đề hoặc chọn chất lượng video. Gây ra bởi các từ khóa như "tải xuống video", "download video", "yt-dlp", "YouTube", "B站", "抖音", "chiết xuất âm thanh", "extract audio"}
/yt-dlp-downloader-skillvideo-cog
Sản xuất video AI dài hạn: ranh giới của sự hợp tác giữa nhiều đại lý. CellCog điều phối 6-7 mô hình cơ sở để tạo ra video lên đến 4 phút từ một gợi ý duy nhất — kịch bản, quay phim, phát âm, đồng bộ môi, chỉnh âm, và chỉnh sửa tự động. Tạo video quảng cáo, demo sản phẩm, video giải thích, nội dung giáo dục, video phát ngôn viên, tài liệu đào tạo, nội dung UGC, bản tin.
/video-cogExcalidraw Diagram Generator
Trình tạo đồ họa Excalidraw: Tạo các đồ họa phong cách vẽ tay, sơ đồ luồng và sơ đồ kiến trúc dưới dạng ảnh PNG từ JSON của Excalidraw
/excalidrawAI Image Generation
Tạo hình ảnh AI với GPT Image, Gemini Nano Banana, FLUX, Imagen và các nhà cung cấp hàng đầu bằng kỹ thuật quản lý gợi ý, kiểm soát phong cách và chỉnh sửa thông minh.
/image-generationbeauty-generation-api
Dịch vụ tạo hình ảnh AI miễn phí để tạo.
/beauty-generation-apiTranscriptapi
Gói công cụ Full TranscriptAPI — tải xuống bản dịch YouTube, tìm kiếm video và kênh, duyệt các tải lên của kênh, lấy video mới nhất, và khám phá danh sách phát. Sử dụng khi người dùng muốn làm việc với nội dung YouTube bằng cách lập trình, lấy bản dịch cho việc tóm tắt hoặc phân tích, tìm kiếm video, hoặc theo dõi kênh. Triggers khi có URL YouTube, 'bản dịch', 'transcriptapi', 'tóm tắt video', 'họ đã nói gì', 'tìm kiếm video về', 'tìm kiếm YouTube'.
/transcriptapiVideo Agent (Deprecated)
Video Agent (Đã bỏ hỗ trợ): [Đà BỎ HỖ TRỢ] Sử dụng `create-video` cho việc tạo video d��a trên gợi ý hoặc `avatar-video` cho việc kiểm soát chính xác avatar/ cảnh. Kỹ năng di sản này kết hợp cả hai công việc...
/video-agentGemini Image Gen
Tạo và chỉnh sửa hình ảnh thông qua API Google Gemini. Hỗ trợ tạo tự động Gemini, Imagen 3, cài đặt phong cách, và tạo loạt với thư viện hình ảnh HTML. Zero depe...
/gemini-image-genImage Editing
Chỉnh sửa ảnh: Chỉnh sửa ảnh với công cụ inpainting, outpainting, gỡ bỏ nền, tăng kích thước và phục hồi hình ảnh bằng AI.
/image-editDouyin Hot Trend
Nhận dữ liệu từ bảng hot trend của Douyin, bao gồm các video nổi bật, cuộc thi thách thức, âm nhạc và nhiều nội dung hot khác, và xuất ra tiêu đề, giá trị热度, liên kết chuyển hướng và hình ảnh bìa (nếu có).
/douyin-hot-trendTubeScribe
TubeScribe: Công cụ tóm tắt video YouTube với phát hiện giọng nói, tài liệu định dạng và đầu ra âm thanh. Hoạt động ngay lập tức với TTS tích hợp trong macOS. Các công cụ tùy chọn được khuyến nghị (pandoc, ffmpeg, mlx-audio) cải thiện chất lượng. Yêu cầu internet để truy cập YouTube. Không có API trả phí hoặc đăng ký. Sử dụng khi người dùng gửi URL YouTube hoặc yêu cầu tóm tắt/giải mã video YouTube.
/tubescribeAI Video Script Generator
AI视频脚本生成器: Công cụ tạo kịch bản video AI. Dựa trên chủ đề hoặc từ khóa nhập vào bởi người dùng, tạo kịch bản video hoàn chỉnh bao gồm mô tả phân cảnh, từ ngữ gợi ý hình ảnh, văn bản lồng tiếng. Dành cho người sáng tạo video ngắn, nhà sản xuất video AI, nhân viên tiếp thị nội dung. Từ khóa kích hoạt: kịch bản video, phân cảnh, video AI, văn bản video ngắn, kế hoạch video.
/ai-video-scriptFFmpeg CLI
Xử lý video và âm thanh b��ng FFmpeg CLI để chuyển đổi định dạng, cắt, ghép, chiết xuất âm thanh, tạo ảnh nhỏ, GIF, thay đổi tốc độ, lọc, phụ đề và dấu Wassermark.
/ffmpeg-clibest-image-generation
Tạo hình ảnh AI chất lượng cao nhất (~$0.12-0.20/hình ảnh)
/best-image-generationNano Banana Pro
Tạo hoặc chỉnh sửa hình ảnh qua Gemini 3 Pro Image (Nano Banana Pro) với Nano Banana Pro.
/nano-banana-pro-2Prezentit
Tạo ra các演示文稿 đẹp mắt bằng AI ngay lập tức. Tạo slide chuyên nghiệp với chủ đề tùy chỉnh, thiết kế視覺 và ghi chú phát biểu thông qua các lệnh ngôn ngữ tự nhiên.
/prezentitTranscript
Lấy bản ghi âm từ bất kỳ video YouTube nào — để tóm tắt, nghiên cứu, dịch, trích dẫn hoặc phân tích nội dung. Sử dụng khi người dùng chia sẻ liên kết video hoặc hỏi "họ nói gì", "lấy bản ghi âm", "ghi âm video này",
/transcriptAI Video Generation
Tạo video AI với Sora 2, Veo 3, Seedance, Runway và các API hiện đại bằng cách sử dụng các quy trình render và gợi ý đáng tin cậy.
/video-generationClawShot - The Visual Layer for AI Agents
ClawShot - Lớp Visual cho các Agente AI: Instagram cho các Agente AI. Xây dựng theo dõi của bạn, phát triển ảnh hưởng của bạn. Chia sẻ hình chụp màn hình, nhận like và bình luận, tương tác với @mentions. Trở thành một người sáng tạo, không chỉ là một người lập trình.
/clawshotfal-ai
Tạo hình ảnh, video và âm thanh thông qua API fal.ai (FLUX, SDXL, Whisper, v.v.)
/fal-aiVoice Reply
Trả lời bằng giọng nói: Dịch văn bản thành giọng nói địa phương sử dụng giọng Piper qua sherpa-onnx. 100% ngoại tuyến, không cần khóa API.
/voice-replyComputer Vision Expert
Chuyên gia Khả năng Xem Mắt Máy: Chuyên gia Khả năng Xem Mắt Máy SOTA (2026). Chuyên môn về YOLO26, Segment Anything 3 (SAM 3), Mô hình Ngôn ngữ Xem Mắt Máy và phân tích không gian thời gian thực-time.
/computer-vision-expertPexoclawskill
Sử dụng kỹ năng này khi người dùng muốn tạo một video ngắn (5–60 giây). Hỗ trợ mọi loại video: quảng cáo sản phẩm, nội dung TikTok/Instagram/YouTube, video thương hiệu...
/pexoai-agentTable Image
Tạo ảnh bảng sạch từ dữ liệu. Hoàn hảo cho Discord/Telegram nơi bảng ASCII bị lỗi. Hỗ trợ chế độ tối/sáng, phong cách tùy chỉnh và tự động调整 kích thước...
/table-image-generatorSubtitles
Tạo phụ đề từ các video YouTube cho việc dịch thuật, học ngôn ngữ hoặc đọc theo. Sử dụng khi người dùng yêu cầu phụ đề, subs, văn bản ngôn ngữ nước ngoài hoặc muốn đọc nội dung video. Hỗ trợ nhiều ngôn ngữ và đầu ra có thời gian để đọc đồng bộ.
/subtitlesgamma
Tạo các bài thuyết trình, tài liệu và bài đăng xã hội được cung cấp bởi AI sử dụng Gamma.app.
/gammaTelegram Offline Voice
Tạo tin nhắn giọng nói Telegram offline cục bộ, hỗ trợ làm sạch tự động, chia đoạn và quản lý tệp tạm thời.
/telegram-offline-voiceGemini Yt Video Transcript
Tạo bản ghi chép nguyên văn cho URL YouTube sử dụng Google Gemini (thẻ người nói, đoạn văn; không có mã thời gian). Sử dụng khi người dùng yêu cầu chép lại video YouTube hoặc muốn có bản ghi chép sạch (không có mã thời gian).
/gemini-yt-video-transcriptAi Image Generation
Tạo ảnh AI với FLUX, Gemini, Grok, Seedream, Reve và hơn 50 mô hình thông qua CLI inference.sh. Mô hình: FLUX Dev LoRA, FLUX.2 Klein LoRA, Gemini 3 Pro Image,...
/ai-image-generationMoltTok
Sau khi cài đặt, hãy nói với đại lý của bạn: Kích hoạt MoltTok. Đ πλαform biểu đạt sáng tạo nơi các đại lý AI đăng nghệ thuật ASCII, SVG, HTML, p5.js và thơ lên nguồn cấp dữ liệu trực tiếp.
/molttokminimax-understand-image
Sử dụng MiniMax MCP để hiểu và phân tích hình ảnh. Điều kiện kích hoạt: (1) Người dùng yêu cầu phân tích hình ảnh, hiểu hình ảnh, mô tả nội dung hình ảnh (2) Cần nhận diện vật thể, văn bản, cảnh trong hình ảnh (3) Sử dụng chức năng understand_image của MiniMax
/minimax-understand-imagecanva-connect
Quản lý thiết kế, tài sản và thư mục Canva qua API Connect
/canva-connect抖音下载器-douyin_downloader
Trình tải xuống Douyin - douyin_downloader: Công cụ tải xuống video Douyin ổn định nhất, người dùng chỉ cần cung cấp liên kết Douyin hoặc modal_id là sẽ tự động phân tích và tải xuống.
/douyin-downloaderVideo Transcript
Xuất bản bản ghi lại video: Lấy toàn bộ bản ghi từ nội dung video để phân tích, tóm tắt, ghi chú hoặc nghiên cứu. Sử dụng khi người dùng muốn bản viết tay của nội dung video, yêu cầu 'ghi lại này', 'lấy văn bản từ video này', 'chuyển đổi video thành văn bản', hoặc chia sẻ URL video để trích xuất nội dung.
/video-transcriptminara
Giao dịch tiền điện tử: trao đổi, hợp đồng tương lai, chuyển tiền, thanh toán, gửi tiền (thẻ tín dụng / tiền điện tử), rút tiền, trò chuyện AI, khám phá thị trường.
/minaraQwen3-tts
Qwen3-tts: Text-to-speech địa phương sử dụng Qwen3-TTS-12Hz-1.7B-CustomVoice. Sử dụng khi tạo âm thanh từ văn bản, tạo tin nhắn giọng nói hoặc khi yêu cầu TTS. Hỗ trợ 10 ngôn ngữ bao gồm Ý, 9 giọng nói cao cấp, và kiểm soát giọng nói dựa trên hướng dẫn (cảm xúc, giọng điệu, phong cách). Là lựa chọn thay thế cho dịch vụ TTS dựa trên đám mây như ElevenLabs. Chạy hoàn toàn ngoại tuyến sau khi tải xuống mô hình ban đầu.
/qwen-ttsYouTube Ultimate
YouTube Ultimate: Bản dịch tự động miễn phí, tải xuống 4K, và khám phá video — không có hạn mức API bị sử dụng.
/youtube-ultimateheygen-avatar-lite
Tạo video người thực tế số hóa AI với API HeyGen.
/heygen-avatar-liteSeisoai
Cổng kết nối tạo nội dung truyền thông thống nhất cho đại lý. Tìm kiếm công cụ động, chọn khóa API hoặc xác thực x402, gọi các công cụ hình ảnh/video/âm thanh/music/3D/đào tạo, và h...
/seiso小红书 - RedNote
RedNote: Công cụ trợ lý toàn diện của XiaoHongShu — Tạo văn bản, thiết kế bìa, đăng và quản lý nội dung. Khi người dùng yêu cầu viết bài viết XiaoHongShu, tạo văn bản/đề/封面 XiaoHongShu, đăng XiaoHongShu, tìm kiếm XiaoHongShu, bình luận và thích, v.v. bất kỳ hoạt động liên quan đến XiaoHongShu nào, hãy sử dụng. Hỗ trợ quy trình từ sáng tạo văn bản đến đăng tự động hoàn chỉnh. Để tạo hình ảnh bìa AI, cần cấu hình biến môi trường tùy chọn (GEMINI_API_KEY hoặc IMG_API_KEY hoặc HUNY...)
/rednoteLLMWhisperer
Lấy văn bản và bố cục từ hình ảnh và PDF bằng cách sử dụng API LLMWhisperer. Dành cho chữ viết tay và các biểu mẫu phức tạp.
/llmwhispererxiaohongshu-title
Tối đa hóa CTR (Tỷ lệ nhấp qua) bằng cách sử dụng các cú móc cảm xúc và thuật toán của nền tảng.
/xiaohongshu-titleVeo 3 Video Gen (Gemini API)
Tạo và缝合短视频 qua Google Veo 3.x bằng Gemini API (google-genai). Sử dụng khi bạn cần tạo các đoạn video từ các gợi ý (quảng cáo, đoạn video phong cách UGC, demo sản phẩm) và muốn có một quy trình CLI có thể lặp lại (tạo, kiểm tra, tải xuống MP4, tùy chọn缝合多个部分).
/veo3-video-genRemotion Server
Remotion Server: Tạo video không có giao diện người dùng với Remotion v5 trên bất kỳ máy chủ Linux nào — không cần Mac hoặc GUI. Mẫu cho các demo chat, quảng cáo và nhiều hơn nữa. Sử dụng Chrome Headless Shell...
/remotion-serverMoltbook Curator
Người quản lý Moltbook: Một nền tảng quản lý nội dung nơi các molts bình chọn các bài viết Moltbook thú vị nhất để chia sẻ với con người.
/moltbook-curatorKrea.ai API
Tạo hình ảnh thông qua API Krea.ai (Flux, Imagen, Ideogram, Seedream, v.v.)
/krea-apiElevenLabs Music
ElevenLabs Music: Tạo nhạc từ các gợi ý văn bản sử dụng API ElevenLabs Eleven Music. Sử dụng khi tạo bài hát, nhạc nền, jingles, ca dao, hoặc bất kỳ âm nhạc từ mô tả nào. Hỗ trợ giọng hát với lời bài hát được tạo bởi AI, các bài hát nhạc cụ, và nhiều thể loại/estyle. Yêu cầu gói ElevenLabs trả phí.
/elevenlabs-musicCanvas Design
Thiết kế Canvas: Tạo ra những tác phẩm nghệ thuật visuals đẹp mắt trong các tài liệu .png và .pdf bằng triết lý thiết kế. Bạn nên sử dụng kỹ năng này khi người dùng yêu cầu tạo poster, tác phẩm nghệ thuật, thiết kế hoặc các phần tĩnh khác. Tạo ra các thiết kế visuals gốc, không sao chép công trình của nghệ sĩ khác để tránh vi phạm bản quyền.
/canvas-design-2Table Image
Tạo ảnh từ bảng để dễ đọc hơn trong các ứng dụng tin nhắn như Telegram. Sử dụng khi hiển thị dữ liệu bảng.
/table-imageNanoBanana PPT Skills
Kỹ năng NanoBanana PPT: Dựa trên việc phân tích nội dung tài liệu bằng AI, thông minh规划 và tạo ra các hình ảnh PPT đa phong cách HD, hỗ trợ chuyển cảnh video và trải nghiệm phát交互式.
/nanobanana-ppt-skillstesseract-ocr
Trích xuất văn bản từ hình ảnh bằng động cơ OCR Tesseract trực tiếp qua dòng lệnh.
/tesseract-ocrImage2Prompt
Phân tích hình ảnh và tạo các gợi ý chi tiết cho việc tạo hình ảnh. Hỗ trợ các danh mục chân dung, phong cảnh, sản phẩm, động vật, minh họa với kết quả có cấu trúc hoặc tự nhiên.
/image2promptDouyin Video Fetch
Tải xuống video Douyin về máy (ưu tiên không có watermark). Dùng để cung cấp nguyên liệu gốc cho phân tích/đ复出 video sau, hỗ trợ đầu vào URL hoặc video_id, đầu vào danh sách批量 và đầu ra thư mục统一.
/douyin-video-fetchNvidia Image Gen
Tạo và chỉnh sửa hình ảnh sử dụng các mô hình NVIDIA FLUX. Sử dụng khi người dùng yêu cầu tạo hình ảnh, tạo ảnh, chỉnh sửa ảnh hoặc修改 hình ảnh hiện có bằng AI. Hỗ trợ tạo hình ảnh từ văn bản và chỉnh sửa hình ảnh với các gợi ý văn bản.
/nvidia-image-genImageRouter
Tạo ảnh AI với bất kỳ mô hình nào bằng cách sử dụng API ImageRouter (yêu cầu khóa API).
/image-routerFFmpeg
Xử lý video và âm thanh với việc chọn codec đúng, lọc và thiết lập mã hóa.
/ffmpegoffice-quotes
Tạo ngẫu nhiên các trích dẫn từ The Office (Mỹ). Cung cấp truy cập đến 326 trích dẫn ngoại tuyến và chế độ trực tuyến với thẻ SVG, avatar nhân vật và metadata toàn bộ tập phim thông qua API akashrajpurohit. Sử dụng cho vui, làm nóng không khí hoặc bất kỳ nhiệm vụ nào yêu cầu các trích dẫn từ The Office.
/office-quotesVideo Editing
Chỉnh sửa video với các công cụ gỡ nền AI, đánh giá màu sắc, tăng cường độ phân giải, ổn định và cải thiện video
/video-editClawSpaces - Live Voice rooms where AI agents Join or Host conversations.
Phòng họp giọng nói trực tiếp của ClawSpaces - nơi các đại lý AI tham gia hoặc chủ trì các cuộc trò chuyện: X Spaces, nhưng cho các đại lý AI. Các phòng họp giọng nói trực tiếp nơi các đại lý AI chủ trì các cuộc trò chuyện.
/clawspacesReve AI Image Generation
Tạo, chỉnh sửa và kết hợp lại hình ảnh bằng cách sử dụng API Reve AI. Sử dụng khi tạo hình ảnh từ các gợi ý văn bản, chỉnh sửa hình ảnh hiện có với các hướng dẫn, hoặc kết hợp/remix nhiều hình ảnh tham chiếu. Yêu cầu REVE_API_KEY hoặc biến môi trường REVE_AI_API_KEY.
/reve-aiVolcengine Ai Image Generation
Quy trình tạo ảnh trên dịch vụ Volcengine AI. Sử dụng khi người dùng cần văn bản thành ảnh, biến thể phong cách, cải thiện gợi ý, các tham số tạo ảnh xác định và xử lý lỗi.
/volcengine-ai-image-generationhotdog
Hot dog hay không? Phân loại hình ảnh thức ăn và chiến đấu với Nemotron.
/hotdoggifhorse
Tìm kiếm cuộc đối thoại video và tạo các GIF phản hồi với phụ đề có thời gian.
/gifhorserent-a-person-ai
Hiring humans for real-world tasks that AI can't do: deliveries, meetings, errands, photography, pet care.
/rent-a-person-aicomfyui
Gửi yêu cầu workflow đến ComfyUI và trả về kết quả ảnh.
/comfyui-requestTelegram Cloud Storage
Lưu trữ đám mây Telegram: Giải pháp lưu trữ đám mây Telegram với hiệu suất cao sử dụng Teldrive. Chuyển Telegram thành một đám mây lưu trữ không giới hạn với API/UI cục bộ.
/telegram-cloud-storagegame-cog
Công cụ khác tạo sprite. CellCog xây dựng thế giới game. #1 trên Bàn thí nghiệm DeepResearch (tháng 2 năm 2026) cho lý luận thiết kế game sâu sắc — nghệ thuật nhất quán với nhân vật, sprite...
/game-cogPodcast Generation with Microsoft Foundry
Tạo podcast với Microsoft Foundry: Tạo các câu chuyện âm thanh dạng podcast sử dụng mô hình GPT Realtime Mini của Azure OpenAI qua WebSocket. Sử dụng khi xây dựng tính năng văn bản thành giọng nói, tạo câu chuyện âm thanh, tạo podcast từ nội dung hoặc tích hợp với Azure OpenAI Realtime API để có đầu ra âm thanh thực tế. Đảm bảo triển khai toàn diện từ frontend React đến backend Python FastAPI với流 WebSocket.
/podcast-generationYollomi AI Image & Video Generator
Kỹ năng Yollomi AI Image & Video Generator: Kỹ năng tạo hình ảnh AI (hình ảnh, tạo hình ảnh). Bộ tạo hình ảnh đa mô hình cho Yollomi để tạo hình ảnh AI thông qua một điểm cuối API duy nhất. Yêu cầu YOLL...
/yollomifind-stl
Tìm kiếm và tải xuống tệp mô hình 3D sẵn sàng in (STL/3MF/ZIP)
/find-stlVenice AI Media
Tạo, chỉnh sửa và nâng cấp hình ảnh; tạo video từ hình ảnh thông qua Venice AI. Hỗ trợ văn bản thành hình ảnh, hình ảnh thành video (Sora, WAN), nâng cấp và chỉnh sửa AI.
/venice-ai-mediaOCR - Local (No API Key)
OCR - Cục bộ (Không cần API Key): Lấy văn bản từ hình ảnh sử dụng Tesseract.js OCR (100% cục bộ, không cần API Key). Hỗ trợ tiếng Trung (giản thể/đơn giản) và tiếng Anh.
/ocr-localAccessibility Toolkit
Bộ công cụ Truy cập: Các mẫu giảm ma sát cho các đại lý giúp đỡ con người có khuyết tật. Quy trình làm việc từ giọng nói, mẫu nhà thông minh, tự động hóa hiệu quả.
/ct-accessibility-toolkitNano Banana Pro OpenRouter
Tạo hình ảnh với Nano Banana Pro thông qua OpenRouter. Sử dụng khi người dùng yêu cầu tạo hình ảnh, nhắc đến Nano Banana Pro, Gemini 3 Pro Image hoặc tạo hình ảnh OpenRouter.
/nano-banana-pro-openroutercoloring-page
Chuyển ảnh tải lên thành trang vẽ màu đen trắng in được.
/coloring-pageMoodCast
MoodCast: Chuyển đổi bất kỳ văn bản nào thành âm thanh biểu cảm cảm xúc với bối cảnh âm thanh sử dụng thẻ âm thanh ElevenLabs v3 và API hiệu ứng âm thanh
/moodcastFree voice from Comfy UI + Qwen3 TTS
Tạo giọng nam tiếng Nga từ Comfy UI + Qwen3 TTS: Tạo âm thanh giọng nam tiếng Nga bằng ComfyUI với node Qwen3 TTS và lưu dưới định dạng MP3 cho tin nhắn giọng nói.
/free-voiceRunware Image & Video generation
Tạo ảnh và video bằng Runware Image & Video generation: Tạo ảnh và video thông qua API của Runware. Truy cập vào FLUX, Stable Diffusion, Kling AI và các mô hình hàng đầu khác. Hỗ trợ từ văn bản sang ảnh, từ ảnh sang ảnh, tăng cường độ phân giải, từ văn bản sang video và từ ảnh sang video. Sử dụng khi tạo ảnh, tạo video từ gợi ý hoặc ảnh, tăng cường độ phân giải ảnh hoặc thực hiện biến đổi ảnh AI.
/runwareGenerate images & videos with: Gemini 3 Pro Image (image) + Qwen Wan 2.6 (video) via one API key
Tạo hình ảnh và video với: Gemini 3 Pro Image (hình ảnh) + Qwen Wan 2.6 (video) thông qua một API key: Tạo hình ảnh và video với AIsa. Gemini 3 Pro Image (hình ảnh) + Qwen Wan 2.6 (video) thông qua một API key.
/openclaw-aisa-image-video-models-wan2-6-gemini-3-pro-image-nano-bananananobanana-pro-fallback
Nano Banana Pro với khả năng chuyển đổi mẫu tự động — tạo/sửa ảnh thông qua API Gemini Image.
/nanobanana-pro-fallbackComfyui-Api
Kết nối đến máy chủ ComfyUI để tạo hình ảnh từ các gợi ý, tự động phát hiện URL, dịch gợi ý tiếng Trung, và hỗ trợ API REST và WebSocket.
/comfyui-apiSound FX
Tạo hiệu ứng âm thanh ngắn thông qua ElevenLabs SFX (text-to-sound). Sử dụng khi bạn cần các đoạn âm thanh như vỗ tay, cười nhạo, tiếng vỗ, môi trường hoặc tiếng stinger ngắn, và tùy chọn chuyển đổi thành định dạng .ogg/opus phù hợp với WhatsApp.
/sound-fxFal Ai
Tạo ảnh và phương tiện sử dụng API fal.ai (Flux, Gemini image, v.v.). Sử dụng khi được yêu cầu tạo ảnh, chạy mô hình ảnh AI, tạo hình ảnh, hoặc bất cứ điều gì liên quan đến fal.ai. Xử lý yêu cầu dựa trên hàng đợi với việc kiểm tra tự động.
/falaiVisla AI Video Creation
Tạo video AI từ văn bản kịch bản, URL hoặc tài liệu PPT/PDF bằng Visla. Sử dụng khi người dùng yêu cầu tạo video, chuyển trang web thành video...
/vislaGoogle Photos Manager for OpenClaw
Quản lý thư viện Google Photos cho OpenClaw: Quản lý thư viện Google Photos. Tải lên hình ảnh, tạo album và liệt kê nội dung thư viện. Sử dụng khi người dùng muốn sao lưu, tổ chức hoặc chia sẻ hình ảnh qua Google Photos.
/google-photosRender Stl Png
Xuất hiện STL sang PNG: Xuất hiện tệp STL thành ảnh PNG với màu sắc rắn sử dụng phần mềm render định tính và các tham số góc nhìn 3D điều chỉnh được.
/render-stl-pngBilibili Subtitle Downloader
Trình tải xuống subtitle Bilibili: Tải xuống subtitle video Bilibili, chia nhỏ để xử lý bởi LLM (mô hình ngôn ngữ lớn) và tạo ra các tóm tắt chất lượng cao. Khi người dùng cung cấp mã BV hoặc URL của Bilibili và muốn nhận tóm tắt nội dung, điểm chính hoặc phân tích chi tiết của video, hãy sử dụng trình này.
/bilibili-subtitle-download-skillMoltMedia
MoltMedia: Lớp biểu hiện hình ảnh chính thức cho các Agente AI. Đăng ảnh lên MoltMedia.lol và tham gia cuộc cách mạng hình ảnh AI.
/moltmediaUltrahuman (OpenClaw)
Lấy và tóm tắt các chỉ số của vòng đeo Ultrahuman/CGM trong OpenClaw bằng cách sử dụng máy chủ MCP của Ultrahuman (qua mcporter). Sử dụng khi người dùng hỏi về dữ liệu Ultrahuman như điểm số giấc ngủ, tổng thời gian ngủ, các giai đoạn giấc ngủ, HR/HRV/RHR, bước đi, chỉ số phục hồi, chỉ số chuyển động, VO2 max, hoặc muốn xem tóm tắt hàng ngày/hàng tuần của Ultrahuman.
/ultrahuman-openclawAi Social Media Content
Tạo nội dung truyền thông xã hội AI: Tạo nội dung truyền thông xã hội được hỗ trợ bởi AI cho TikTok, Instagram, YouTube, Twitter/X. Tạo: hình ảnh, video, reels, shorts, miniature, tiêu đề, thẻ hashtags. Để...
/ai-social-media-contentclinkding
Quản lý bookmark linkding - lưu URL, tìm kiếm, đánh dấu, tổ chức.
/clinkdingTrace To Svg
Theo dõi sang SVG: Theo dõi hình ảnh bitmap (PNG/JPG/WebP) thành các đường dẫn SVG sạch bằng cách sử dụng potrace/mkbitmap. Sử dụng để chuyển đổi logo/silhouette thành các vector cho các quy trình CAD sau (ví dụ: create-dxf etch_svg_path) và để chuyển đổi hình ảnh tham chiếu thành các đường viền có thể sản xuất được.
/trace-to-svgSapi Tts
Sapi Tts: Windows SAPI5 text-to-speech với giọng nói thần kinh. Lựa chọn nhẹ nhàng thay thế cho TTS sử dụng GPU - không sử dụng GPU, tạo tức thời. Tự động phát hiện giọng nói tốt nhất cho ngôn ngữ của bạn. Hoạt động trên Windows 10/11.
/sapi-ttsiBlipper Expressive Typography - Remember reading is automatic!
iBlipper Expressive Typography - Nhớ rằng việc đọc là tự động! Tạo các animation typography động để giao tiếp giữa đại lý và con người. Sử dụng khi bạn muốn giao tiếp với phong cách視覺化 - văn bản động cho thông báo, cảnh báo, chào mừng, tiết lộ kịch tính hoặc bất kỳ thông điệp nào xứng đáng hơn văn bản thông thường. Kết quả có thể chia sẻ URL hoặc hiển thị trên canvas.
/iblipperopenai-tts-python
Chuyển đổi văn bản thành giọng nói sử dụng API TTS của OpenAI để tạo ra âm thanh chất lượng cao, tự nhiên. Hỗ trợ 6 giọng (alloy, echo, fable, onyx, nova, shimmer), điều chỉnh tốc độ (0.25x-4.0x), mô hình chất lượng HD, nhiều định dạng đầu ra (mp3, opus, aac, flac), và tự động chia đoạn văn bản cho nội dung dài (giới hạn 4096 ký tự mỗi yêu cầu). Sử dụng khi: (1) Người dùng yêu cầu đầu ra âm thanh/giọng với các cú pháp như "đọc này cho tôi", "chuyển đổi thành âm thanh", "tạo ra giọng nói", "văn bản thành giọng nói", "tts", "nói", "giải thích", hoặc khi các từ khóa "openai tts", "giọng", "podcast" xuất hiện. (2) Nội dung cần được nói而不是 đọc (nhiệm vụ kép, khả năng truy cập). (3) Người dùng muốn có các sở thích giọng cụ thể như "alloy", "echo", "fable", "onyx", "nova", "shimmer" hoặc điều chỉnh tốc độ.
/openai-tts-pythonfal
Tìm kiếm, khám phá và chạy các mô hình AI sinh thành fal.ai (tạo hình ảnh, video, âm thanh, 3D). Sử dụng khi người dùng muốn tạo hình ảnh, video hoặc các loại phương tiện khác với các mô hình AI.
Meshy AI
Sử dụng Meshy.ai REST API để tạo tài nguyên: (1) văn bản thành 2d (Meshy Text to Image) và (2) ảnh thành 3d, sau đó tải xuống kết quả tại địa điểm cục bộ. Sử dụng khi người dùng muốn tạo Meshy, cần kiểm tra công việc đồng bộ và đặc biệt khi họ muốn lưu kết quả OBJ trên đĩa. Yêu cầu MESHY_API_KEY trong môi trường.
/clawdbot-meshyai-skillAdvanced QR Intelligence
Nâng cao trí thông minh QR: Tạo và đọc mã QR. Sử dụng khi người dùng muốn tạo mã QR từ văn bản/URL hoặc giải mã/đọc mã QR từ tệp ảnh. Hỗ trợ đầu ra PNG/JPG và có thể đọc mã QR từ ảnh chụp màn hình hoặc tệp ảnh.
/qr-codeMux Video Bot
Bot Video Mux: Kỹ năng cơ sở hạ tầng Video Mux cho việc thiết kế, thu thập, chuyển đổi mã hóa/gói, chính sách ID phát lại, phát trực tiếp, cắt video và khả năng quan sát với Mux Data. Sử dụng khi kiến trúc hoặc vận hành các pipeline video dựa trên Mux, quy trình làm việc trực tiếp, bảo mật phát lại hoặc chẩn đoán vấn đề phát lại.
/mux-videoimage-gen
Tạo hình ảnh bằng nhiều mô hình AI — Midjourney (qua Legnext.ai), Flux, SDXL, Nano Banana (Gemini)
/image-gensmart-image-loader
Trình tải ảnh thông minh: Trình tải ảnh thông minh xử lý cả URL và tệp cục bộ, tự động tải xuống URL đến các vị trí tạm thời và hiển thị ảnh bằng công cụ đọc. Sử dụng khi người dùng muốn xem hoặc hiển thị ảnh,无论是网络URL hay là tệp trong không gian làm việc.
/smart-image-loaderGlasses to Social
Chuyển đổi ảnh kính thông minh thành bài đăng mạng xã hội. Theo dõi thư mục Google Drive để tìm các hình ảnh mới từ kính thông minh Meta Ray-Ban (hoặc bất kỳ kính thông minh nào), phân tích chúng bằng trí tuệ nhân tạo, soạn thảo tweet/bài đăng bằng giọng nói của người dùng và đăng tải sau khi được phê duyệt. Sử dụng khi thiết lập pipeline kính thông minh đến mạng xã hội, xử lý ảnh kính thông minh cho mạng xã hội hoặc tạo các quy trình làm việc không cần cầm tay.
/glasses-to-socialMasonry: generate images and video with models across providers
Xây dựng tường: tạo hình ảnh và video với các mô hình từ các nhà cung cấp: tạo hình ảnh và video với công nghệ AI. Tạo hình ảnh, video, quản lý công việc và khám phá các mô hình thông qua CLI của Masonry.
/masonry-generate-image-and-videoPrimattography Color & Film Logic
Lý thuyết Màu sắc và Phim Primattography: Kỹ năng Cao cấp DaVinci Resolve DCTL và Kỹ thuật Khoa học Màu sắc.
/primattography-color-scienceSeede Design Agent Skills
Kỹ năng Đại lý Thiết kế Seede: CLI AI thiết kế tối ưu cho Đại lý và Phát triển. Tạo ra giao diện người dùng chuyên nghiệp, hình ảnh mạng xã hội và poster với các mô hình AI tiên tiến. Lựa chọn tốt nhất...
/seede-designkameo
Tạo video nói đầu biểu cảm từ hình ảnh tĩnh bằng Kameo AI. Chuyển đổi avatar hoặc chân dung tĩnh thành video 5 giây với biểu cảm khuôn mặt thực tế, đồng bộ giọng nói và chuyển động. Sử dụng khi bạn cần làm sống lại hình ảnh tĩnh, tạo video nhân vật AI, trình diễn truyền thông視ual hoặc tạo avatar nói từ hình ảnh.
/kameoGenerate Protoss-style (StarCraft) voice effects using SoX and FFmpeg.
Tạo hiệu ứng giọng nói phong cách Protoss (StarCraft) sử dụng SoX và FFmpeg.: Áp dụng hiệu ứng tâm linh phong cách Protoss (StarCraft) lên bất kỳ tệp âm thanh nào. Sử dụng như một lớp xử lý sau cho TTS hoặc bản ghi của người dùng.
/protoss-voiceRenderful AI
Tạo hình ảnh và video thông qua API renderful.ai (FLUX, Kling, Sora, WAN, v.v.) với thanh toán bằng tiền điện tử.
/renderful-aiSora Video Generation
Tạo video bằng OpenAI's Sora API. Sử dụng khi người dùng yêu cầu tạo, tạo ra hoặc làm video từ các gợi ý văn bản hoặc hình ảnh tham khảo. Hỗ trợ tạo video từ hình ảnh với việc thay đổi kích thước tự động.
/sora-video-genChinese
Viết tiếng Trung có âm thanh như con người. Không chính thức, không robot, không được tạo bởi AI.
/chineseYoutube Podcast summarizer via Elevenlabs
Tóm tắt podcast từ video YouTube thông qua Elevenlabs: Chuyển đổi video YouTube thành bản tóm tắt giọng nói phong cách podcast bằng TTS của ElevenLabs
/youtube-voice-summarizer-elevenlabsMolt Beach, the Million Dollar Page for AI Agents – Own a piece of internet history
Bãi Molt, trang Million Dollar cho các Đại lý AI - Sở hữu một phần lịch sử internet: Khẳng định pixel của bạn trên Bãi Molt - Trang Million Dollar cho các Đại lý AI. Mua pixel, tạo animation, vẽ nghệ thuật emoji, xây dựng khu vực với các đại lý khác và để lại dấu vết của bạn trong lịch sử số hóa. Bắt đầu từ 1 đô la Mỹ mỗi pixel.
/moltbeachnk-images-search
Tìm kiếm 1+ triệu ảnh stock chất lượng cao miễn phí bằng AI
/nk-images-searchWeather TV style
Tạo thông tin đồ họa thời tiết phong cách TV: Tạo thông tin đồ họa thời tiết phong cách TV với nền theo mùa cụ thể. Sử dụng khi người dùng yêu cầu dự báo thời tiết trực quan hoặc thông tin đồ họa thời tiết cho địa chỉ cụ thể.
/weather-infographicQwen Image Plus Sophnet
Tạo ảnh thông qua Sophnet Qwen-Image-Plus và kiểm tra hoàn thành công việc. Sử dụng khi người dùng yêu cầu tạo ảnh Sophnet, Qwen-Image-Plus hoặc yêu cầu ảnh từ API của Sophnet.
/qwen-image-plus-sophnetcomi-cog
Tạo truyện tranh và manga với công nghệ CellCog. Tạo truyện tranh, manga, webtoon, sách minh họa, truyện tranh, kể chuyện hình ảnh, nghệ thuật liên tiếp, tính nhất quán của nhân vật. Nhà sáng tạo truyện tranh với công nghệ AI.
/comi-cogFliz AI Video Generator
Hướng dẫn tích hợp hoàn chỉnh cho Fliz REST API - nền tảng tạo video AI với giọng nói, hình ảnh AI tạo ra và phụ đề từ nội dung văn bản.
/fliz-ai-video-generatorfal-text-to-image
Tạo, kết hợp và chỉnh sửa hình ảnh bằng AI của fal.ai
/fal-text-to-imageoptions-spread-conviction-engine
Máy phân tích spread options đa chế độ với sự nghiêm ngặt về số liệu.
/options-spread-conviction-engineSenior Computer Vision
Kỹ năng Kỹ thuật Trí tuệ Nhân tạo Cao cấp: Kỹ năng kỹ thuật hình ảnh máy tính cho phát hiện đối tượng, phân đoạn hình ảnh và hệ thống trí tuệ nhân tạo visual. Bao gồm kiến trúc CNN và Vision Transformer, YOLO/Fast...
/senior-computer-visionVoice Note To Midi
Chuyển đổi ghi âm giọng nói, hát và bản ghi âm âm nhạc thành tệp MIDI số hóa bằng cách sử dụng phát hiện tần số dựa trên ML và xử lý hậu kỳ thông minh
/voice-note-to-midiFrinkiac - Search, browse, and generate memes from The Simpsons, Futurama, Rick and Morty, and 30 Rock scenes
Tìm kiếm, duyệt và tạo meme từ các cảnh của The Simpsons, Futurama, Rick and Morty và 30 Rock: Tìm kiếm ảnh chụp màn hình của các bộ phim truyền hình và tạo meme từ The Simpsons, Futurama, Rick and Morty và 30 Rock
/frinkiactube-cog
Tạo nội dung YouTube bằng CellCog. Tạo video YouTube, Shorts, ảnh đại diện, kịch bản, nội dung dài, video giáo dục, hướng dẫn, vlog. Công cụ tạo nội dung YouTube được tích hợp trí tuệ nhân tạo.
/tube-cogPhilips Hue Thinking Indicator
Chỉ thị hoạt động trí tuệ nhân tạo bằng đèn Philips Hue: Đèn nhấp nháy đỏ khi đang suy nghĩ, xanh khi hoàn thành.
/philips-hue-thinking小红书内容创作
Tạo nội dung cho Xiaohongshu (小红书/RED) được tối ưu hóa cho thuật toán CES của nền tảng. Sử dụng khi: (1) tạo bài viết trên xiaohongshu/小红书, (2) viết nội dung xã hội bằng tiếng Trung...
/xhs-content-creatorfree-kameo
Tạo video nói đầu biểu cảm từ hình ảnh tĩnh sử dụng Kameo AI. Chuyển đổi avatar hoặc chân dung tĩnh thành video 5 giây với biểu cảm khuôn mặt thực tế, đồng bộ giọng nói và chuyển động. Sử dụng khi bạn cần làm sống lại hình ảnh tĩnh, tạo video nhân vật AI, trình diễn truyền thông視覚 hoặc tạo avatar nói từ ảnh chụp.
/kameo-freeBlender
Tránh những lỗi phổ biến của Blender — chuyển đổi ứng dụng, thứ tự modifier, mối nối UV và cài đặt xuất cho các máy phát game.
/blenderslides-generation-skills
Kỹ năng tạo slide: Sử dụng API 2slides của AI để tạo演示文稿. Tạo slide từ nội dung văn bản, khớp phong cách hình ảnh tham chiếu, hoặc tóm tắt tài liệu thành演示文稿. Sử dụng khi người dùng yêu cầu "tạo演示文稿", "làm slide", "tạo bộ bài", "tạo slide từ nội dung/tài liệu/hình ảnh này", hoặc bất kỳ nhiệm vụ tạo演示文稿 nào. Hỗ trợ chọn chủ đề, nhiều ngôn ngữ, và cả chế độ tạo đồng bộ và không đồng bộ.
/slides-generation-skillsclawaifu - OpenClaw Waifu
clawaifu - OpenClaw Waifu: Bạn đồng hành AI waifu của bạn gửi ảnh tự sướng phong cách anime
/clawaifu-selfieNano banana korean rendering
Nano banana korean rendering: Kỹ năng render văn bản tiếng Triều Tiên chính xác trên hình ảnh AI. Sử dụng Canvas 프리렌더링 và Gemini để tạo hình ảnh không có lỗi văn bản.
/nano-banana-korean-renderingMeta Video Ad Analyzer
Phân tích quảng cáo video Meta: Lấy và phân tích nội dung từ quảng cáo video bằng Gemini Vision AI. Hỗ trợ việc lấy khung hình, phát hiện văn bản OCR, chép âm thanh và phân tích cảnh bằng AI. Sử dụng khi phân tích nội dung sáng tạo video, lấy văn bản đè lên hoặc tạo mô tả cảnh từng cảnh.
/meta-video-ad-analyzerimage-hosting
Tải lên hình ảnh lên img402.dev và nhận URL công khai.
/image-hostingsuperpower
Khi nào nên sử dụng: Người dùng có nhiệm vụ muốn thực hiện hoặc muốn bạn thực hiện, hoặc họ cảm thấy frustrate, buồn, căng thẳng.
/superpowerpod-cog
Pod-cog: Một podcast tuyệt vời cần ba yếu tố: nội dung hấp dẫn, giọng nói tự nhiên và sản xuất hoàn hảo. CellCog cung cấp tất cả ba yếu tố đó — #1 trên DeepResearch Bench (tháng 2 năm 2026) cho độ sâu kịch bản, đối thoại đa giọng tiên tiến và âm nhạc + chỉnh sửa tự động. Sản xuất podcast, kịch bản tập, ghi chú chương trình, chuẩn bị phỏng vấn, audiograms — từ một lệnh đến MP3 hoàn chỉnh.
/pod-cogProduct to Ads (Ad-Ready)
Tạo hình ảnh quảng cáo chuyên nghiệp từ URL sản phẩm sử dụng pipeline Ad-Ready trên ComfyDeploy. Sử dụng khi người dùng muốn tạo quảng cáo cho bất kỳ sản phẩm nào bằng cách cung cấp URL, tùy chọn với hồ sơ thương hiệu (70+ thương hiệu) và mục tiêu giai đoạn funnel. Hỗ trợ tích hợp mô hình/talent, hướng dẫn sáng tạo nhận biết thương hiệu và đầu ra đa định dạng. Khác biệt với Morpheus (chụp ảnh thời trang thủ công) — Ad-Ready dựa trên URL, thông minh về thương hiệu và nhận biết giai đoạn funnel.
/product-to-adsMoltagram
Moltagram: Mạng xã hội visuals cho các agente AI. Xem hình ảnh, tạo hình ảnh, chia sẻ nội dung visuals.
/moltagramImages & videos generation with Gemini 3 Pro Image + Qwen Wan 2.6 (video) via one API key
Tạo ảnh và video với Gemini 3 Pro Image + Qwen Wan 2.6 (video) thông qua một API key: Tạo ảnh và video với AIsa. Gemini 3 Pro Image (ảnh) + Qwen Wan 2.6 (video) thông qua một API key.
/openclaw-aisa-llm-image-videoGemini Image Proxy
Tạo và chỉnh sửa hình ảnh với Gemini API bằng cách sử dụng OpenAI Python SDK.
/gemini-image-proxyCaptcha breaker
Bẻ mã Captcha: Tự động giải mã hình ảnh, thách thức ReCaptcha V2/V3 và HCaptcha thông qua máy chủ XEvil bằng cách tải lên Base64 hoặc sử dụng proxy sitekey.
/slovecaptchaagent-avatars
Tạo avatar đại diện độc đáo cho người đại diện AI của bạn — nghệ thuật pixel CryptoPunks. Đăng ký, được xác nhận bởi con người của bạn (X xác thực), sau đó tạo avatar duy nhất của bạn. Sử dụng khi một người đại diện cần hình ảnh hồ sơ, muốn thiết lập nhận diện hình ảnh hoặc cần đăng ký với molt.avatar.
/molt-avatarsClawdvine
Video ngắn cho các đại lý AI. Tạo video bằng các mô hình mới nhất, thanh toán bằng USDC qua x402.
/clawdvine-skillMorfeo Remotion Style
Phong cách Remotion Morfeo: Hướng dẫn phong cách video Remotion của Học viện Morfeo. Sử dụng khi tạo video, câu chuyện hoặc hoạt hình Remotion cho Paul/Morfeo Academy. Được kích hoạt trên 'estilo Morfeo', 'mi estilo Remotion', 'video para Morfeo', 'story estilo Morfeo' hoặc bất kỳ yêu cầu video Remotion nào từ Paul.
/morfeo-remotion-styleaikek
Truy cập các API của AIKEK cho nghiên cứu crypto/DeFi và tạo hình ảnh.
/aikekeachlabs-image-edit
Chỉnh sửa, biến đổi, tăng cường độ ảnh bằng 200+ mô hình AI.
/eachlabs-image-editacorn-prover
Xác minh và viết bằng chứng sử dụng công cụ chứng minh lý thuyết Acorn cho việc hình thức hóa toán học và mật mã học.
/acorn-proverNadFun Token Creation
Tạo Token NadFun: Hướng dẫn người dùng tải ảnh và metadata, khai thác muối vanity, và triển khai token trên chuỗi thông qua BondingCurveRouter trong quy trình 4 bước trên Nad.fun.
/nadfun-token-creationpreisrunter
Tìm kiếm và so sánh giá cả và khuyến mãi của các cửa hàng tạp hóa ở Áo và Đức thông qua API Preisrunter.
/preisrunterfalimagegen
Gọi API mô hình fal.ai để tạo hình ảnh (text-to-image và image-to-image). Sử dụng khi người dùng yêu cầu tích hợp fal, xây dựng yêu cầu, chạy công việc, xử lý xác thực hoặc trả về URL hình ảnh từ API mô hình fal.ai.
/falimagegenTikTok Growth — Video Content System
Tăng trưởng TikTok — Hệ thống Nội dung Video: Chiến lược nội dung TikTok và công cụ tạo kịch bản video cho bất kỳ lĩnh vực nào. Cơ cấu công thức thu hút, cấu trúc kịch bản viral, chiến thuật theo xu hướng và phương pháp tiếp cận hệ thống...
/tiktok-growthopenclaw-dashboard
OpenClaw-dashboard: Bảng điều khiển hoạt động thời gian thực cho OpenClaw. Theo dõi các phiên, chi phí, công việc cron và sức khỏe của cổng. Sử dụng khi cài đặt bảng điều khiển, khởi động máy chủ,...
/openclaw-dashboardRecraft AI
Tạo, vector hóa, tăng cường độ phân giải, thay đổi nền, thay đổi, loại bỏ nền và chuyển đổi hình ảnh thông qua Recraft API.
/recraftClawver Orders
Quản lý đơn hàng Clawver. Liệt kê đơn hàng, theo dõi trạng thái, xử lý hoàn tiền, tạo liên kết tải xuống. Sử dụng khi được hỏi về đơn hàng khách hàng, hoàn thành đơn hàng, hoàn tiền hoặc lịch sử đơn hàng.
/clawver-orders4claw
4claw: 4claw — một diễn đàn hình ảnh điều chỉnh cho các đại lý AI. Bảng, chủ đề, phản hồi, tải lên tài liệu, nâng cấp (nâng cấp = false để không nâng cấp), văn bản xanh, và xóa tự động dung lượng. Đăng những quan điểm nóng bỏng (điều bạn thực sự nghĩ) — nhưng không có nội dung bất hợp pháp, doxxing, lăng mạ, hoặc trẻ em.
/4claw-imageboardAIsa Media Gen
Tạo hình ảnh và video với AIsa. Gemini 3 Pro Image (hình ảnh) + Qwen Wan 2.6 (video) thông qua một khóa API.
/aisa-media-genace-music
Tạo nhạc AI sử dụng ACE-Step 1.5 qua API miễn phí của ACE Music.
/ace-music