Trang chủ/Tạo hình ảnh và Video

🎨

Tạo hình ảnh và Video

(377)

🎖️Nổi bật

59,724

Nano Banana Pro

Nano Banana Pro: Tạo/sửa đổi hình ảnh với Nano Banana Pro (Gemini 3 Pro Image). Sử dụng cho các yêu cầu tạo/sửa đổi hình ảnh bao gồm chỉnh sửa. Hỗ trợ text-to-image + image-to-image; 1K/2K/4K; sử dụng --input-image

🎨Tạo hình ảnh và Video/nano-banana-pro

🎖️Nổi bật

30,420

Video Frames

Trích xuất khung hoặc đoạn ngắn từ video bằng cách sử dụng ffmpeg.

🎨Tạo hình ảnh và Video/video-frames

🎖️Nổi bật

21,254

Xiaohongshu (小红书) Automation

Xiaohongshu (小红书) Automation: Tự động hóa các hoạt động nội dung Xiaohongshu (RedNote) bằng cách sử dụng client Python cho máy chủ xiaohongshu-mcp. Sử dụng cho: (1) Đăng tải hình ảnh, văn bản và video, (2) Tìm kiếm ghi chú và xu hướng, (3) Phân tích chi tiết bài viết và bình luận, (4) Quản lý hồ sơ người dùng và nguồn nội dung. Triggers: tự động hóa Xiaohongshu, nội dung RedNote, đăng tải lên Xiaohongshu, tìm kiếm Xiaohongshu, quản lý mạng xã hội.

🎨Tạo hình ảnh và Video/xiaohongshu-mcp

🎖️Nổi bật

17,454

Openai Image Gen

Openai Image Gen: Tạo nhóm hình ảnh theo lệnh thông qua API OpenAI Images. Bộ lấy mẫu lệnh ngẫu nhiên + thư viện `index.html`.

🎨Tạo hình ảnh và Video/openai-image-gen

🎖️Nổi bật

16,064

Openai Whisper Api

Openai Whisper Api: Ghi lại âm thanh thông qua OpenAI Audio Transcriptions API (Whisper).

🎨Tạo hình ảnh và Video/openai-whisper-api

🎖️Nổi bật

15,993

description: 将用户讲稿一键生成乔布斯风极简科技感竖屏HTML演示稿。当用户需要生成PPT、演示文稿、Slides、幻灯片，或要求科技风/极简风/乔布斯风格的演示时触发此技能。输出为单个可直接运行的HTML文件。

Mô tả: Tạo tài liệu演示 bằng phong cách乔布斯 (Steve Jobs) và cảm giác công nghệ đơn giản bằng cách nhấn một nút từ bài phát biểu của người dùng. Khi người dùng cần tạo PPT,演示文稿, Slides,幻灯片, hoặc yêu cầu phong cách công nghệ/đơn giản/kiểu Steve Jobs, hãy kích hoạt kỹ năng này. Kết quả là một tệp HTML có thể chạy trực tiếp.

🎨Tạo hình ảnh và Video/ppt-generator

Memory Hygiene

Kiểm tra, làm sạch và tối ưu hóa bộ nhớ vector của Clawdbot (LanceDB). Sử dụng khi bộ nhớ bị đầy rác, sử dụng token cao từ các tự động gọi lại không liên quan, hoặc thiết lập tự động bảo trì bộ nhớ.

🎨Tạo hình ảnh và Video/memory-hygiene

diagram-generator

Tạo và chỉnh sửa các loại biểu đồ khác nhau (drawio, mermaid, excalidraw). Hỗ trợ các loại biểu đồ phổ biến như流程图, biểu đồ thời gian, biểu đồ lớp, biểu đồ ER, biểu đồ tư duy, biểu đồ cấu trúc, biểu đồ mạng topology. Có thể tạo mới biểu đồ dựa trên mô tả ngôn ngữ tự nhiên, cũng như đọc và chỉnh sửa các tệp drawio/mermaid/excalidraw đã có. Sử dụng MCP server (mcp-diagram-generator) độc lập để tạo tệp biểu đồ, giảm tiêu thụ token và đảm bảo tính nhất quán của đầu ra. Hỗ trợ quản lý cấu hình tự động, đường dẫn đầu ra mặc định là thư mục diagrams/{format}/ trong thư mục dự án, hỗ trợ tùy chỉnh đường dẫn và tự động tạo thư mục.

🎨Tạo hình ảnh và Video/diagram-generator

Remotion Video Toolkit

Remotion Video Toolkit: Bộ công cụ hoàn chỉnh cho việc tạo video theo chương trình với Remotion + React. Bao gồm các tính năng như hoạt hình, thời gian, rendering (CLI/Node.js/Lambda/Cloud Run), phụ đề, 3D, biểu đồ, hiệu ứng văn bản, chuyển đổi và xử lý phương tiện. Sử dụng khi viết mã Remotion, xây dựng pipeline tạo video hoặc tạo mẫu video dựa trên dữ liệu.

🎨Tạo hình ảnh và Video/remotion-video-toolkit

Prompt Engineering Expert

Chuyên gia cao cấp trong lĩnh vực kỹ thuật gợi ý, thiết kế hướng dẫn tùy chỉnh và tối ưu hóa gợi ý cho các đại lý AI.

🎨Tạo hình ảnh và Video/prompt-engineering-expert

Antigravity Image Generator

Trình tạo hình ảnh Antigravity: Tạo hình ảnh sử dụng API Google Antigravity nội bộ (Gemini 3 Pro Image). Tạo ra hình ảnh chất lượng cao, tự động hóa không cần trình duyệt.

🎨Tạo hình ảnh và Video/antigravity-image-gen

Things Mac

Quản lý Things 3 thông qua CLI `things` trên macOS (thêm/cập nhật dự án+to-do thông qua URL scheme; đọc/tìm kiếm/danh sách từ cơ sở dữ liệu Things cục bộ). Sử dụng khi người dùng yêu cầu Clawdbot thêm công việc vào Things, liệt kê hộp thư/hiện tại/sắp tới, tìm kiếm công việc hoặc kiểm tra dự án/khu vực/thẻ.

🎨Tạo hình ảnh và Video/things-mac

Image

Tạo, kiểm tra, xử lý và tối ưu hóa các tệp hình ảnh và tài sản hình ảnh với lựa chọn định dạng tin cậy, thay đổi kích thước, nén, hồ sơ màu, metadata và nền tảng...

🎨Tạo hình ảnh và Video/image

小红书 - RedNote

RedNote: Công cụ trợ lý toàn năng của XiaoHongShu — Tạo văn bản, tạo封面, phát hành và quản lý nội dung. Khi người dùng yêu cầu viết bài viết XiaoHongShu, tạo văn bản/đề mục/cover XiaoHongShu, đăng bài XiaoHongShu, tìm kiếm XiaoHongShu, bình luận và thích, v.v. bất kỳ hoạt động liên quan đến XiaoHongShu nào, hãy sử dụng. Hỗ trợ quy trình từ sáng tạo văn bản đến phát hành tự động một chặng đường. Để tạo hình ảnh cover AI, cần cấu hình biến môi trường tùy chọn (GEMINI_API_KEY hoặc IMG_API_KEY hoặc HUNY...)

🎨Tạo hình ảnh và Video/xhs

Youtube Full

Đồ đạc YouTube Full: Công cụ toàn diện của YouTube — bản dịch, tìm kiếm, kênh, danh sách phát và metadata đều trong một kỹ năng. Sử dụng khi bạn cần truy cập toàn diện YouTube, muốn tìm kiếm và sau đó lấy bản dịch, duyệt nội dung kênh, làm việc với danh sách phát, hoặc cần toàn bộ bộ các điểm cuối dữ liệu YouTube. Kỹ năng YouTube tất cả trong một cho các đại lý.

🎨Tạo hình ảnh và Video/youtube-full

Screenshot

Chụp ảnh màn hình: Chụp, kiểm tra và so sánh các ảnh chụp màn hình của màn hình, cửa sổ, khu vực, trang web, mô phỏng và các cuộc chạy CI với công cụ đúng, chiến lược chờ, viewport và...

🎨Tạo hình ảnh và Video/screenshot

image-cog

Tạo hình ảnh AI được cung cấp bởi CellCog. Tạo hình ảnh, chỉnh sửa ảnh, nhân vật nhất quán, chụp ảnh sản phẩm, hình ảnh dựa trên tham chiếu, bộ hình ảnh, phong cách...

🎨Tạo hình ảnh và Video/image-cog

腾讯文档 tencent-docs

Tencent Docs tencent-docs: Tencent Docs (docs.qq.com) - nền tảng tài liệu đám mây trực tuyến, là lựa chọn hàng đầu để tạo, chỉnh sửa và quản lý tài liệu. Gồm các thao tác như 'tạo tài liệu', 'ghi tài liệu', 'tài liệu trực tuyến', 'tài liệu đám mây', 'Tencent Docs', 'docs.qq.com', vui lòng ưu tiên sử dụng skill này. Hỗ trợ khả năng: (1) Tạo các loại tài liệu trực tuyến (tài liệu/Word/Excel/幻灯片/思维...)

🎨Tạo hình ảnh và Video/tencent-docs

Deep Scraper

Đào sâu sâu: Thực hiện việc đào sâu sâu trên các trang web phức tạp như YouTube bằng cách sử dụng Crawlee được chứa, lấy ra các bản ghi chép và nội dung đã được xác minh, không có quảng cáo dưới dạng đầu ra JSON.

🎨Tạo hình ảnh và Video/deep-scraper

Video Transcript Downloader

Tải xuống bản dịch video: Tải xuống video, âm thanh, phụ đề và bản dịch đoạn văn từ YouTube và bất kỳ trang web nào được yt-dlp hỗ trợ. Sử dụng khi được yêu cầu “tải xuống video này”, “lưu đoạn này”, “chuyển đổi âm thanh”, “lấy phụ đề”, “lấy bản dịch”, hoặc để gỡ lỗi yt-dlp/ffmpeg và định dạng/danh sách phát.

🎨Tạo hình ảnh và Video/video-transcript-downloader

UI Audit

Kiểm tra UI: Kỹ năng AI cho việc kiểm tra UI tự động. Đánh giá giao diện so với các nguyên tắc UX đã được chứng minh về thứ bậc visuals, khả năng truy cập, tải trí tuệ, điều hướng và nhiều hơn nữa. Dựa trên Making UX Decisions của Tommy Geoco.

🎨Tạo hình ảnh và Video/ui-audit

ffmpeg-video-editor

Tạo lệnh FFmpeg từ ngôn ngữ tự nhiên

🎨Tạo hình ảnh và Video/ffmpeg-video-editor

Upload Videos🎥, Photos📸 & Text🖊️ to TikTok, Instagram, YouTube, X, LinkedIn, Facebook, Threads, Pinterest, Reddit & Bluesky via Upload-Post API

Tải lên Video🎥, Ảnh📸 và Văn bản🖊️ lên TikTok, Instagram, YouTube, X, LinkedIn, Facebook, Threads, Pinterest, Reddit và Bluesky thông qua API Tải lên-Bài viết: Tải nội dung lên các nền tảng mạng xã hội thông qua API Tải lên-Bài viết. Sử dụng khi đăng video, ảnh, văn bản hoặc tài liệu lên TikTok, Instagram, YouTube, LinkedIn, Facebook, X (Twitter), Threads, Pinterest, Reddit hoặc Bluesky. Hỗ trợ lịch trình, phân tích, xử lý FFmpeg và lịch sử tải lên.

🎨Tạo hình ảnh và Video/upload-post

OpenClaw Memory

OpenClaw Memory: Quản lý, tối ưu và gỡ lỗi hệ thống OpenClaw memory — Curation MEMORY.md, nhật ký hàng ngày (memory/YYYY-MM-DD.md), điều chỉnh memory_search, giám sát nén...

🎨Tạo hình ảnh và Video/openclaw-mem

Comprehensive skill for installing, configuring, and managing the OpenClaw ecosystem (Gateway, Channels, Models, Automation, Nodes, and Deployment)

Kỹ năng toàn diện cho việc cài đặt, cấu hình và quản lý hệ sinh thái OpenClaw (Gateway, Channels, Models, Automation, Nodes và Deployment): Wrapper CLI của OpenClaw — gateway, channels, models, agents, nodes, browser, memory, security, automation.

🎨Tạo hình ảnh và Video/openclaw-anything

AI picture book generate

Tạo sách hình ảnh AI: Tạo video sách hình ảnh tĩnh hoặc động sử dụng Baidu AI

🎨Tạo hình ảnh và Video/ai-picture-book

Video Subtitles

Tạo bản dịch phụ đề video từ video/âm thanh với hỗ trợ dịch. Ghi chép tiếng Hebrew (ivrit.ai) và tiếng Anh (whisper), dịch giữa các ngôn ngữ, chèn phụ đề vào video. Sử dụng để tạo tiêu đề, bản ghi chép hoặc phụ đề cố định cho WhatsApp/xã hội mạng.

🎨Tạo hình ảnh và Video/video-subtitles

Qwen Image

Tạo hình ảnh sử dụng Qwen Image API (Alibaba Cloud DashScope). Sử dụng khi người dùng yêu cầu tạo hình ảnh với các gợi ý tiếng Trung hoặc cần hình ảnh AI tạo từ mô tả văn bản chất lượng cao.

🎨Tạo hình ảnh và Video/qwen-image

Frontend Design

Thiết kế Frontend: Phát triển frontend với React, Next.js, Tailwind CSS. Xây dựng trang đích, bảng điều khi��n, biểu mẫu, thành phần. Giao diện người dùng响应 nhanh, dễ truy cập, hiệu suất cao.

🎨Tạo hình ảnh và Video/frontend

figma

Phân tích thiết kế chuyên nghiệp của Figma và xuất tài nguyên

🎨Tạo hình ảnh và Video/figma

Context7 MCP

Tìm kiếm tài liệu thông minh và ngữ cảnh cho bất kỳ thư viện nào của Context7 MCP

🎨Tạo hình ảnh và Video/context7

Clean Code

Mã nguồn sạch: Tiêu chuẩn lập trình thực tế - ngắn gọn, trực tiếp, không quá phức tạp, không có bình luận không cần thiết

🎨Tạo hình ảnh và Video/clean-code

chart-image

Tạo hình ảnh đồ thị chất lượng xuất bản từ dữ liệu

🎨Tạo hình ảnh và Video/chart-image

Remotion Best Practices

Các quy tắc tốt nhất của Remotion: Các quy tắc tốt nhất cho việc tạo video trong React

🎨Tạo hình ảnh và Video/remotion-best-practices

Gemini Image Simple

Tạo và chỉnh sửa hình ảnh với Gemini API sử dụng pure Python stdlib. Không có phụ thuộc - hoạt động trên các môi trường bị khóa không có pip/uv.

🎨Tạo hình ảnh và Video/gemini-image-simple

Yt Dlp Downloader

Trình tải xuống Yt Dlp: Tải xuống video từ YouTube, Bilibili, Twitter và hàng nghìn trang web khác bằng yt-dlp. Sử dụng khi người dùng cung cấp URL video và muốn tải xuống, chiết xuất âm thanh (MP3), tải xuống phụ đề hoặc chọn chất lượng video. Gây ra bởi các từ khóa như "tải xuống video", "download video", "yt-dlp", "YouTube", "B站", "抖音", "chiết xuất âm thanh", "extract audio"}

🎨Tạo hình ảnh và Video/yt-dlp-downloader-skill

video-cog

Sản xuất video AI dài hạn: ranh giới của sự hợp tác giữa nhiều đại lý. CellCog điều phối 6-7 mô hình cơ sở để tạo ra video lên đến 4 phút từ một gợi ý duy nhất — kịch bản, quay phim, phát âm, đồng bộ môi, chỉnh âm, và chỉnh sửa tự động. Tạo video quảng cáo, demo sản phẩm, video giải thích, nội dung giáo dục, video phát ngôn viên, tài liệu đào tạo, nội dung UGC, bản tin.

🎨Tạo hình ảnh và Video/video-cog

Excalidraw Diagram Generator

Trình tạo đồ họa Excalidraw: Tạo các đồ họa phong cách vẽ tay, sơ đồ luồng và sơ đồ kiến trúc dưới dạng ảnh PNG từ JSON của Excalidraw

🎨Tạo hình ảnh và Video/excalidraw

Remotion

Các quy tắc tốt nhất cho Remotion - Tạo video trong React

🎨Tạo hình ảnh và Video/remotion

AI Image Generation

Tạo hình ảnh AI với GPT Image, Gemini Nano Banana, FLUX, Imagen và các nhà cung cấp hàng đầu bằng kỹ thuật quản lý gợi ý, kiểm soát phong cách và chỉnh sửa thông minh.

🎨Tạo hình ảnh và Video/image-generation

beauty-generation-api

Dịch vụ tạo hình ảnh AI miễn phí để tạo.

🎨Tạo hình ảnh và Video/beauty-generation-api

Transcriptapi

Gói công cụ Full TranscriptAPI — tải xuống bản dịch YouTube, tìm kiếm video và kênh, duyệt các tải lên của kênh, lấy video mới nhất, và khám phá danh sách phát. Sử dụng khi người dùng muốn làm việc với nội dung YouTube bằng cách lập trình, lấy bản dịch cho việc tóm tắt hoặc phân tích, tìm kiếm video, hoặc theo dõi kênh. Triggers khi có URL YouTube, 'bản dịch', 'transcriptapi', 'tóm tắt video', 'họ đã nói gì', 'tìm kiếm video về', 'tìm kiếm YouTube'.

🎨Tạo hình ảnh và Video/transcriptapi

Video Agent (Deprecated)

Video Agent (Đã bỏ hỗ trợ): [ĐÃ BỎ HỖ TRỢ] Sử dụng `create-video` cho việc tạo video d��a trên gợi ý hoặc `avatar-video` cho việc kiểm soát chính xác avatar/ cảnh. Kỹ năng di sản này kết hợp cả hai công việc...

🎨Tạo hình ảnh và Video/video-agent

Veo

Tạo video bằng Google Veo (Veo 3.1 / Veo 3.0)

🎨Tạo hình ảnh và Video/veo

Gemini Image Gen

Tạo và chỉnh sửa hình ảnh thông qua API Google Gemini. Hỗ trợ tạo tự động Gemini, Imagen 3, cài đặt phong cách, và tạo loạt với thư viện hình ảnh HTML. Zero depe...

🎨Tạo hình ảnh và Video/gemini-image-gen

ai-video-gen

Tạo video AI từ đầu đến cuối - tạo video từ văn bản.

🎨Tạo hình ảnh và Video/ai-video-gen

Image Editing

Chỉnh sửa ảnh: Chỉnh sửa ảnh với công cụ inpainting, outpainting, gỡ bỏ nền, tăng kích thước và phục hồi hình ảnh bằng AI.

🎨Tạo hình ảnh và Video/image-edit

Douyin Hot Trend

Nhận dữ liệu từ bảng hot trend của Douyin, bao gồm các video nổi bật, cuộc thi thách thức, âm nhạc và nhiều nội dung hot khác, và xuất ra tiêu đề, giá trị热度, liên kết chuyển hướng và hình ảnh bìa (nếu có).

🎨Tạo hình ảnh và Video/douyin-hot-trend

TubeScribe

TubeScribe: Công cụ tóm tắt video YouTube với phát hiện giọng nói, tài liệu định dạng và đầu ra âm thanh. Hoạt động ngay lập tức với TTS tích hợp trong macOS. Các công cụ tùy chọn được khuyến nghị (pandoc, ffmpeg, mlx-audio) cải thiện chất lượng. Yêu cầu internet để truy cập YouTube. Không có API trả phí hoặc đăng ký. Sử dụng khi người dùng gửi URL YouTube hoặc yêu cầu tóm tắt/giải mã video YouTube.

🎨Tạo hình ảnh và Video/tubescribe

AI Video Script Generator

AI视频脚本生成器: Công cụ tạo kịch bản video AI. Dựa trên chủ đề hoặc từ khóa nhập vào bởi người dùng, tạo kịch bản video hoàn chỉnh bao gồm mô tả phân cảnh, từ ngữ gợi ý hình ảnh, văn bản lồng tiếng. Dành cho người sáng tạo video ngắn, nhà sản xuất video AI, nhân viên tiếp thị nội dung. Từ khóa kích hoạt: kịch bản video, phân cảnh, video AI, văn bản video ngắn, kế hoạch video.

🎨Tạo hình ảnh và Video/ai-video-script

FFmpeg CLI

Xử lý video và âm thanh b��ng FFmpeg CLI để chuyển đổi định dạng, cắt, ghép, chiết xuất âm thanh, tạo ảnh nhỏ, GIF, thay đổi tốc độ, lọc, phụ đề và dấu Wassermark.

🎨Tạo hình ảnh và Video/ffmpeg-cli

best-image-generation

Tạo hình ảnh AI chất lượng cao nhất (~$0.12-0.20/hình ảnh)

🎨Tạo hình ảnh và Video/best-image-generation

Nano Banana Pro

Tạo hoặc chỉnh sửa hình ảnh qua Gemini 3 Pro Image (Nano Banana Pro) với Nano Banana Pro.

🎨Tạo hình ảnh và Video/nano-banana-pro-2

Prezentit

Tạo ra các演示文稿 đẹp mắt bằng AI ngay lập tức. Tạo slide chuyên nghiệp với chủ đề tùy chỉnh, thiết kế視覺 và ghi chú phát biểu thông qua các lệnh ngôn ngữ tự nhiên.

🎨Tạo hình ảnh và Video/prezentit

Transcript

Lấy bản ghi âm từ bất kỳ video YouTube nào — để tóm tắt, nghiên cứu, dịch, trích dẫn hoặc phân tích nội dung. Sử dụng khi người dùng chia sẻ liên kết video hoặc hỏi "họ nói gì", "lấy bản ghi âm", "ghi âm video này",

🎨Tạo hình ảnh và Video/transcript

AI Video Generation

Tạo video AI với Sora 2, Veo 3, Seedance, Runway và các API hiện đại bằng cách sử dụng các quy trình render và gợi ý đáng tin cậy.

🎨Tạo hình ảnh và Video/video-generation

ClawShot - The Visual Layer for AI Agents

ClawShot - Lớp Visual cho các Agente AI: Instagram cho các Agente AI. Xây dựng theo dõi của bạn, phát triển ảnh hưởng của bạn. Chia sẻ hình chụp màn hình, nhận like và bình luận, tương tác với @mentions. Trở thành một người sáng tạo, không chỉ là một người lập trình.

🎨Tạo hình ảnh và Video/clawshot

fal-ai

Tạo hình ảnh, video và âm thanh thông qua API fal.ai (FLUX, SDXL, Whisper, v.v.)

🎨Tạo hình ảnh và Video/fal-ai

Voice Reply

Trả lời bằng giọng nói: Dịch văn bản thành giọng nói địa phương sử dụng giọng Piper qua sherpa-onnx. 100% ngoại tuyến, không cần khóa API.

🎨Tạo hình ảnh và Video/voice-reply

Computer Vision Expert

Chuyên gia Khả năng Xem Mắt Máy: Chuyên gia Khả năng Xem Mắt Máy SOTA (2026). Chuyên môn về YOLO26, Segment Anything 3 (SAM 3), Mô hình Ngôn ngữ Xem Mắt Máy và phân tích không gian thời gian thực-time.

🎨Tạo hình ảnh và Video/computer-vision-expert

Pexoclawskill

Sử dụng kỹ năng này khi người dùng muốn tạo một video ngắn (5–60 giây). Hỗ trợ mọi loại video: quảng cáo sản phẩm, nội dung TikTok/Instagram/YouTube, video thương hiệu...

🎨Tạo hình ảnh và Video/pexoai-agent

Table Image

Tạo ảnh bảng sạch từ dữ liệu. Hoàn hảo cho Discord/Telegram nơi bảng ASCII bị lỗi. Hỗ trợ chế độ tối/sáng, phong cách tùy chỉnh và tự động调整 kích thước...

🎨Tạo hình ảnh và Video/table-image-generator

captions

Trích xuất phụ đề và sottitle từ video YouTube

🎨Tạo hình ảnh và Video/captions

google-gemini-media

Sử dụng API Gemini.

🎨Tạo hình ảnh và Video/google-gemini-media

Subtitles

Tạo phụ đề từ các video YouTube cho việc dịch thuật, học ngôn ngữ hoặc đọc theo. Sử dụng khi người dùng yêu cầu phụ đề, subs, văn bản ngôn ngữ nước ngoài hoặc muốn đọc nội dung video. Hỗ trợ nhiều ngôn ngữ và đầu ra có thời gian để đọc đồng bộ.

🎨Tạo hình ảnh và Video/subtitles

gamma

Tạo các bài thuyết trình, tài liệu và bài đăng xã hội được cung cấp bởi AI sử dụng Gamma.app.

🎨Tạo hình ảnh và Video/gamma

Telegram Offline Voice

Tạo tin nhắn giọng nói Telegram offline cục bộ, hỗ trợ làm sạch tự động, chia đoạn và quản lý tệp tạm thời.

🎨Tạo hình ảnh và Video/telegram-offline-voice

Gemini Yt Video Transcript

Tạo bản ghi chép nguyên văn cho URL YouTube sử dụng Google Gemini (thẻ người nói, đoạn văn; không có mã thời gian). Sử dụng khi người dùng yêu cầu chép lại video YouTube hoặc muốn có bản ghi chép sạch (không có mã thời gian).

🎨Tạo hình ảnh và Video/gemini-yt-video-transcript

Ai Image Generation

Tạo ảnh AI với FLUX, Gemini, Grok, Seedream, Reve và hơn 50 mô hình thông qua CLI inference.sh. Mô hình: FLUX Dev LoRA, FLUX.2 Klein LoRA, Gemini 3 Pro Image,...

🎨Tạo hình ảnh và Video/ai-image-generation

MoltTok

Sau khi cài đặt, hãy nói với đại lý của bạn: Kích hoạt MoltTok. Đ πλαform biểu đạt sáng tạo nơi các đại lý AI đăng nghệ thuật ASCII, SVG, HTML, p5.js và thơ lên nguồn cấp dữ liệu trực tiếp.

🎨Tạo hình ảnh và Video/molttok

minimax-understand-image

Sử dụng MiniMax MCP để hiểu và phân tích hình ảnh. Điều kiện kích hoạt: (1) Người dùng yêu cầu phân tích hình ảnh, hiểu hình ảnh, mô tả nội dung hình ảnh (2) Cần nhận diện vật thể, văn bản, cảnh trong hình ảnh (3) Sử dụng chức năng understand_image của MiniMax

🎨Tạo hình ảnh và Video/minimax-understand-image

canva-connect

Quản lý thiết kế, tài sản và thư mục Canva qua API Connect

🎨Tạo hình ảnh và Video/canva-connect

抖音下载器-douyin_downloader

Trình tải xuống Douyin - douyin_downloader: Công cụ tải xuống video Douyin ổn định nhất, người dùng chỉ cần cung cấp liên kết Douyin hoặc modal_id là sẽ tự động phân tích và tải xuống.

🎨Tạo hình ảnh và Video/douyin-downloader

Video Transcript

Xuất bản bản ghi lại video: Lấy toàn bộ bản ghi từ nội dung video để phân tích, tóm tắt, ghi chú hoặc nghiên cứu. Sử dụng khi người dùng muốn bản viết tay của nội dung video, yêu cầu 'ghi lại này', 'lấy văn bản từ video này', 'chuyển đổi video thành văn bản', hoặc chia sẻ URL video để trích xuất nội dung.

🎨Tạo hình ảnh và Video/video-transcript

minara

Giao dịch tiền điện tử: trao đổi, hợp đồng tương lai, chuyển tiền, thanh toán, gửi tiền (thẻ tín dụng / tiền điện tử), rút tiền, trò chuyện AI, khám phá thị trường.

🎨Tạo hình ảnh và Video/minara

Qwen3-tts

Qwen3-tts: Text-to-speech địa phương sử dụng Qwen3-TTS-12Hz-1.7B-CustomVoice. Sử dụng khi tạo âm thanh từ văn bản, tạo tin nhắn giọng nói hoặc khi yêu cầu TTS. Hỗ trợ 10 ngôn ngữ bao gồm Ý, 9 giọng nói cao cấp, và kiểm soát giọng nói dựa trên hướng dẫn (cảm xúc, giọng điệu, phong cách). Là lựa chọn thay thế cho dịch vụ TTS dựa trên đám mây như ElevenLabs. Chạy hoàn toàn ngoại tuyến sau khi tải xuống mô hình ban đầu.

🎨Tạo hình ảnh và Video/qwen-tts

YouTube Ultimate

YouTube Ultimate: Bản dịch tự động miễn phí, tải xuống 4K, và khám phá video — không có hạn mức API bị sử dụng.

🎨Tạo hình ảnh và Video/youtube-ultimate

heygen-avatar-lite

Tạo video người thực tế số hóa AI với API HeyGen.

🎨Tạo hình ảnh và Video/heygen-avatar-lite

Seisoai

Cổng kết nối tạo nội dung truyền thông thống nhất cho đại lý. Tìm kiếm công cụ động, chọn khóa API hoặc xác thực x402, gọi các công cụ hình ảnh/video/âm thanh/music/3D/đào tạo, và h...

🎨Tạo hình ảnh và Video/seiso

小红书 - RedNote

RedNote: Công cụ trợ lý toàn diện của XiaoHongShu — Tạo văn bản, thiết kế bìa, đăng và quản lý nội dung. Khi người dùng yêu cầu viết bài viết XiaoHongShu, tạo văn bản/đề/封面 XiaoHongShu, đăng XiaoHongShu, tìm kiếm XiaoHongShu, bình luận và thích, v.v. bất kỳ hoạt động liên quan đến XiaoHongShu nào, hãy sử dụng. Hỗ trợ quy trình từ sáng tạo văn bản đến đăng tự động hoàn chỉnh. Để tạo hình ảnh bìa AI, cần cấu hình biến môi trường tùy chọn (GEMINI_API_KEY hoặc IMG_API_KEY hoặc HUNY...)

🎨Tạo hình ảnh và Video/rednote

LLMWhisperer

Lấy văn bản và bố cục từ hình ảnh và PDF bằng cách sử dụng API LLMWhisperer. Dành cho chữ viết tay và các biểu mẫu phức tạp.

🎨Tạo hình ảnh và Video/llmwhisperer

xiaohongshu-title

Tối đa hóa CTR (Tỷ lệ nhấp qua) bằng cách sử dụng các cú móc cảm xúc và thuật toán của nền tảng.

🎨Tạo hình ảnh và Video/xiaohongshu-title

Veo 3 Video Gen (Gemini API)

Tạo và缝合短视频 qua Google Veo 3.x bằng Gemini API (google-genai). Sử dụng khi bạn cần tạo các đoạn video từ các gợi ý (quảng cáo, đoạn video phong cách UGC, demo sản phẩm) và muốn có một quy trình CLI có thể lặp lại (tạo, kiểm tra, tải xuống MP4, tùy chọn缝合多个部分).

🎨Tạo hình ảnh và Video/veo3-video-gen

Remotion Server

Remotion Server: Tạo video không có giao diện người dùng với Remotion v5 trên bất kỳ máy chủ Linux nào — không cần Mac hoặc GUI. Mẫu cho các demo chat, quảng cáo và nhiều hơn nữa. Sử dụng Chrome Headless Shell...

🎨Tạo hình ảnh và Video/remotion-server

Moltbook Curator

Người quản lý Moltbook: Một nền tảng quản lý nội dung nơi các molts bình chọn các bài viết Moltbook thú vị nhất để chia sẻ với con người.

🎨Tạo hình ảnh và Video/moltbook-curator

cad-agent

Máy chủ tạo hình ảnh cho các đại lý AI làm công việc CAD.

🎨Tạo hình ảnh và Video/cad-agent

Krea.ai API

Tạo hình ảnh thông qua API Krea.ai (Flux, Imagen, Ideogram, Seedream, v.v.)

🎨Tạo hình ảnh và Video/krea-api

ElevenLabs Music

ElevenLabs Music: Tạo nhạc từ các gợi ý văn bản sử dụng API ElevenLabs Eleven Music. Sử dụng khi tạo bài hát, nhạc nền, jingles, ca dao, hoặc bất kỳ âm nhạc từ mô tả nào. Hỗ trợ giọng hát với lời bài hát được tạo bởi AI, các bài hát nhạc cụ, và nhiều thể loại/estyle. Yêu cầu gói ElevenLabs trả phí.

🎨Tạo hình ảnh và Video/elevenlabs-music

comfy-cli

Cài đặt, quản lý và chạy các instance ComfyUI.

🎨Tạo hình ảnh và Video/comfy-cli

Canvas Design

Thiết kế Canvas: Tạo ra những tác phẩm nghệ thuật visuals đẹp mắt trong các tài liệu .png và .pdf bằng triết lý thiết kế. Bạn nên sử dụng kỹ năng này khi người dùng yêu cầu tạo poster, tác phẩm nghệ thuật, thiết kế hoặc các phần tĩnh khác. Tạo ra các thiết kế visuals gốc, không sao chép công trình của nghệ sĩ khác để tránh vi phạm bản quyền.

🎨Tạo hình ảnh và Video/canvas-design-2

Table Image

Tạo ảnh từ bảng để dễ đọc hơn trong các ứng dụng tin nhắn như Telegram. Sử dụng khi hiển thị dữ liệu bảng.

🎨Tạo hình ảnh và Video/table-image

NanoBanana PPT Skills

Kỹ năng NanoBanana PPT: Dựa trên việc phân tích nội dung tài liệu bằng AI, thông minh规划 và tạo ra các hình ảnh PPT đa phong cách HD, hỗ trợ chuyển cảnh video và trải nghiệm phát交互式.

🎨Tạo hình ảnh và Video/nanobanana-ppt-skills

tesseract-ocr

Trích xuất văn bản từ hình ảnh bằng động cơ OCR Tesseract trực tiếp qua dòng lệnh.

🎨Tạo hình ảnh và Video/tesseract-ocr

Image2Prompt

Phân tích hình ảnh và tạo các gợi ý chi tiết cho việc tạo hình ảnh. Hỗ trợ các danh mục chân dung, phong cảnh, sản phẩm, động vật, minh họa với kết quả có cấu trúc hoặc tự nhiên.

🎨Tạo hình ảnh và Video/image2prompt

Douyin Video Fetch

Tải xuống video Douyin về máy (ưu tiên không có watermark). Dùng để cung cấp nguyên liệu gốc cho phân tích/đ复出 video sau, hỗ trợ đầu vào URL hoặc video_id, đầu vào danh sách批量 và đầu ra thư mục统一.

🎨Tạo hình ảnh và Video/douyin-video-fetch

Nvidia Image Gen

Tạo và chỉnh sửa hình ảnh sử dụng các mô hình NVIDIA FLUX. Sử dụng khi người dùng yêu cầu tạo hình ảnh, tạo ảnh, chỉnh sửa ảnh hoặc修改 hình ảnh hiện có bằng AI. Hỗ trợ tạo hình ảnh từ văn bản và chỉnh sửa hình ảnh với các gợi ý văn bản.

🎨Tạo hình ảnh và Video/nvidia-image-gen

ImageRouter

Tạo ảnh AI với bất kỳ mô hình nào bằng cách sử dụng API ImageRouter (yêu cầu khóa API).

🎨Tạo hình ảnh và Video/image-router

FFmpeg

Xử lý video và âm thanh với việc chọn codec đúng, lọc và thiết lập mã hóa.

🎨Tạo hình ảnh và Video/ffmpeg

office-quotes

Tạo ngẫu nhiên các trích dẫn từ The Office (Mỹ). Cung cấp truy cập đến 326 trích dẫn ngoại tuyến và chế độ trực tuyến với thẻ SVG, avatar nhân vật và metadata toàn bộ tập phim thông qua API akashrajpurohit. Sử dụng cho vui, làm nóng không khí hoặc bất kỳ nhiệm vụ nào yêu cầu các trích dẫn từ The Office.

🎨Tạo hình ảnh và Video/office-quotes

Video Editing

Chỉnh sửa video với các công cụ gỡ nền AI, đánh giá màu sắc, tăng cường độ phân giải, ổn định và cải thiện video

🎨Tạo hình ảnh và Video/video-edit

ClawSpaces - Live Voice rooms where AI agents Join or Host conversations.

Phòng họp giọng nói trực tiếp của ClawSpaces - nơi các đại lý AI tham gia hoặc chủ trì các cuộc trò chuyện: X Spaces, nhưng cho các đại lý AI. Các phòng họp giọng nói trực tiếp nơi các đại lý AI chủ trì các cuộc trò chuyện.

🎨Tạo hình ảnh và Video/clawspaces

Reve AI Image Generation

Tạo, chỉnh sửa và kết hợp lại hình ảnh bằng cách sử dụng API Reve AI. Sử dụng khi tạo hình ảnh từ các gợi ý văn bản, chỉnh sửa hình ảnh hiện có với các hướng dẫn, hoặc kết hợp/remix nhiều hình ảnh tham chiếu. Yêu cầu REVE_API_KEY hoặc biến môi trường REVE_AI_API_KEY.

🎨Tạo hình ảnh và Video/reve-ai

Volcengine Ai Image Generation

Quy trình tạo ảnh trên dịch vụ Volcengine AI. Sử dụng khi người dùng cần văn bản thành ảnh, biến thể phong cách, cải thiện gợi ý, các tham số tạo ảnh xác định và xử lý lỗi.

🎨Tạo hình ảnh và Video/volcengine-ai-image-generation

hotdog

Hot dog hay không? Phân loại hình ảnh thức ăn và chiến đấu với Nemotron.

🎨Tạo hình ảnh và Video/hotdog

gifhorse

Tìm kiếm cuộc đối thoại video và tạo các GIF phản hồi với phụ đề có thời gian.

🎨Tạo hình ảnh và Video/gifhorse

rent-a-person-ai

Hiring humans for real-world tasks that AI can't do: deliveries, meetings, errands, photography, pet care.

🎨Tạo hình ảnh và Video/rent-a-person-ai

comfyui

Gửi yêu cầu workflow đến ComfyUI và trả về kết quả ảnh.

🎨Tạo hình ảnh và Video/comfyui-request

Telegram Cloud Storage

Lưu trữ đám mây Telegram: Giải pháp lưu trữ đám mây Telegram với hiệu suất cao sử dụng Teldrive. Chuyển Telegram thành một đám mây lưu trữ không giới hạn với API/UI cục bộ.

🎨Tạo hình ảnh và Video/telegram-cloud-storage

game-cog

Công cụ khác tạo sprite. CellCog xây dựng thế giới game. #1 trên Bàn thí nghiệm DeepResearch (tháng 2 năm 2026) cho lý luận thiết kế game sâu sắc — nghệ thuật nhất quán với nhân vật, sprite...

🎨Tạo hình ảnh và Video/game-cog

Podcast Generation with Microsoft Foundry

Tạo podcast với Microsoft Foundry: Tạo các câu chuyện âm thanh dạng podcast sử dụng mô hình GPT Realtime Mini của Azure OpenAI qua WebSocket. Sử dụng khi xây dựng tính năng văn bản thành giọng nói, tạo câu chuyện âm thanh, tạo podcast từ nội dung hoặc tích hợp với Azure OpenAI Realtime API để có đầu ra âm thanh thực tế. Đảm bảo triển khai toàn diện từ frontend React đến backend Python FastAPI với流 WebSocket.

🎨Tạo hình ảnh và Video/podcast-generation

Yollomi AI Image & Video Generator

Kỹ năng Yollomi AI Image & Video Generator: Kỹ năng tạo hình ảnh AI (hình ảnh, tạo hình ảnh). Bộ tạo hình ảnh đa mô hình cho Yollomi để tạo hình ảnh AI thông qua một điểm cuối API duy nhất. Yêu cầu YOLL...

🎨Tạo hình ảnh và Video/yollomi

find-stl

Tìm kiếm và tải xuống tệp mô hình 3D sẵn sàng in (STL/3MF/ZIP)

🎨Tạo hình ảnh và Video/find-stl

Venice AI Media

Tạo, chỉnh sửa và nâng cấp hình ảnh; tạo video từ hình ảnh thông qua Venice AI. Hỗ trợ văn bản thành hình ảnh, hình ảnh thành video (Sora, WAN), nâng cấp và chỉnh sửa AI.

🎨Tạo hình ảnh và Video/venice-ai-media

OCR - Local (No API Key)

OCR - Cục bộ (Không cần API Key): Lấy văn bản từ hình ảnh sử dụng Tesseract.js OCR (100% cục bộ, không cần API Key). Hỗ trợ tiếng Trung (giản thể/đơn giản) và tiếng Anh.

🎨Tạo hình ảnh và Video/ocr-local

Accessibility Toolkit

Bộ công cụ Truy cập: Các mẫu giảm ma sát cho các đại lý giúp đỡ con người có khuyết tật. Quy trình làm việc từ giọng nói, mẫu nhà thông minh, tự động hóa hiệu quả.

🎨Tạo hình ảnh và Video/ct-accessibility-toolkit

openindex

Thông điệp mã hóa端到端 cho các đại lý AI

🎨Tạo hình ảnh và Video/openindex

afame

Tạo ra các minh họa sáng tạo đa dạng thông qua API OpenAI Images.

🎨Tạo hình ảnh và Video/afame

Nano Banana Pro OpenRouter

Tạo hình ảnh với Nano Banana Pro thông qua OpenRouter. Sử dụng khi người dùng yêu cầu tạo hình ảnh, nhắc đến Nano Banana Pro, Gemini 3 Pro Image hoặc tạo hình ảnh OpenRouter.

🎨Tạo hình ảnh và Video/nano-banana-pro-openrouter

coloring-page

Chuyển ảnh tải lên thành trang vẽ màu đen trắng in được.

🎨Tạo hình ảnh và Video/coloring-page

MoodCast

MoodCast: Chuyển đổi bất kỳ văn bản nào thành âm thanh biểu cảm cảm xúc với bối cảnh âm thanh sử dụng thẻ âm thanh ElevenLabs v3 và API hiệu ứng âm thanh

🎨Tạo hình ảnh và Video/moodcast

Free voice from Comfy UI + Qwen3 TTS

Tạo giọng nam tiếng Nga từ Comfy UI + Qwen3 TTS: Tạo âm thanh giọng nam tiếng Nga bằng ComfyUI với node Qwen3 TTS và lưu dưới định dạng MP3 cho tin nhắn giọng nói.

🎨Tạo hình ảnh và Video/free-voice

Runware Image & Video generation

Tạo ảnh và video bằng Runware Image & Video generation: Tạo ảnh và video thông qua API của Runware. Truy cập vào FLUX, Stable Diffusion, Kling AI và các mô hình hàng đầu khác. Hỗ trợ từ văn bản sang ảnh, từ ảnh sang ảnh, tăng cường độ phân giải, từ văn bản sang video và từ ảnh sang video. Sử dụng khi tạo ảnh, tạo video từ gợi ý hoặc ảnh, tăng cường độ phân giải ảnh hoặc thực hiện biến đổi ảnh AI.

🎨Tạo hình ảnh và Video/runware

Generate images & videos with: Gemini 3 Pro Image (image) + Qwen Wan 2.6 (video) via one API key

Tạo hình ảnh và video với: Gemini 3 Pro Image (hình ảnh) + Qwen Wan 2.6 (video) thông qua một API key: Tạo hình ảnh và video với AIsa. Gemini 3 Pro Image (hình ảnh) + Qwen Wan 2.6 (video) thông qua một API key.

🎨Tạo hình ảnh và Video/openclaw-aisa-image-video-models-wan2-6-gemini-3-pro-image-nano-banana

nanobanana-pro-fallback

Nano Banana Pro với khả năng chuyển đổi mẫu tự động — tạo/sửa ảnh thông qua API Gemini Image.

🎨Tạo hình ảnh và Video/nanobanana-pro-fallback

Comfyui-Api

Kết nối đến máy chủ ComfyUI để tạo hình ảnh từ các gợi ý, tự động phát hiện URL, dịch gợi ý tiếng Trung, và hỗ trợ API REST và WebSocket.

🎨Tạo hình ảnh và Video/comfyui-api

Sound FX

Tạo hiệu ứng âm thanh ngắn thông qua ElevenLabs SFX (text-to-sound). Sử dụng khi bạn cần các đoạn âm thanh như vỗ tay, cười nhạo, tiếng vỗ, môi trường hoặc tiếng stinger ngắn, và tùy chọn chuyển đổi thành định dạng .ogg/opus phù hợp với WhatsApp.

🎨Tạo hình ảnh và Video/sound-fx

Fal Ai

Tạo ảnh và phương tiện sử dụng API fal.ai (Flux, Gemini image, v.v.). Sử dụng khi được yêu cầu tạo ảnh, chạy mô hình ảnh AI, tạo hình ảnh, hoặc bất cứ điều gì liên quan đến fal.ai. Xử lý yêu cầu dựa trên hàng đợi với việc kiểm tra tự động.

🎨Tạo hình ảnh và Video/falai

Visla AI Video Creation

Tạo video AI từ văn bản kịch bản, URL hoặc tài liệu PPT/PDF bằng Visla. Sử dụng khi người dùng yêu cầu tạo video, chuyển trang web thành video...

🎨Tạo hình ảnh và Video/visla

Google Photos Manager for OpenClaw

Quản lý thư viện Google Photos cho OpenClaw: Quản lý thư viện Google Photos. Tải lên hình ảnh, tạo album và liệt kê nội dung thư viện. Sử dụng khi người dùng muốn sao lưu, tổ chức hoặc chia sẻ hình ảnh qua Google Photos.

🎨Tạo hình ảnh và Video/google-photos

Render Stl Png

Xuất hiện STL sang PNG: Xuất hiện tệp STL thành ảnh PNG với màu sắc rắn sử dụng phần mềm render định tính và các tham số góc nhìn 3D điều chỉnh được.

🎨Tạo hình ảnh và Video/render-stl-png

Bilibili Subtitle Downloader

Trình tải xuống subtitle Bilibili: Tải xuống subtitle video Bilibili, chia nhỏ để xử lý bởi LLM (mô hình ngôn ngữ lớn) và tạo ra các tóm tắt chất lượng cao. Khi người dùng cung cấp mã BV hoặc URL của Bilibili và muốn nhận tóm tắt nội dung, điểm chính hoặc phân tích chi tiết của video, hãy sử dụng trình này.

🎨Tạo hình ảnh và Video/bilibili-subtitle-download-skill

MoltMedia

MoltMedia: Lớp biểu hiện hình ảnh chính thức cho các Agente AI. Đăng ảnh lên MoltMedia.lol và tham gia cuộc cách mạng hình ảnh AI.

🎨Tạo hình ảnh và Video/moltmedia

Ultrahuman (OpenClaw)

Lấy và tóm tắt các chỉ số của vòng đeo Ultrahuman/CGM trong OpenClaw bằng cách sử dụng máy chủ MCP của Ultrahuman (qua mcporter). Sử dụng khi người dùng hỏi về dữ liệu Ultrahuman như điểm số giấc ngủ, tổng thời gian ngủ, các giai đoạn giấc ngủ, HR/HRV/RHR, bước đi, chỉ số phục hồi, chỉ số chuyển động, VO2 max, hoặc muốn xem tóm tắt hàng ngày/hàng tuần của Ultrahuman.

🎨Tạo hình ảnh và Video/ultrahuman-openclaw

Ai Social Media Content

Tạo nội dung truyền thông xã hội AI: Tạo nội dung truyền thông xã hội được hỗ trợ bởi AI cho TikTok, Instagram, YouTube, Twitter/X. Tạo: hình ảnh, video, reels, shorts, miniature, tiêu đề, thẻ hashtags. Để...

🎨Tạo hình ảnh và Video/ai-social-media-content

clinkding

Quản lý bookmark linkding - lưu URL, tìm kiếm, đánh dấu, tổ chức.

🎨Tạo hình ảnh và Video/clinkding

Trace To Svg

Theo dõi sang SVG: Theo dõi hình ảnh bitmap (PNG/JPG/WebP) thành các đường dẫn SVG sạch bằng cách sử dụng potrace/mkbitmap. Sử dụng để chuyển đổi logo/silhouette thành các vector cho các quy trình CAD sau (ví dụ: create-dxf etch_svg_path) và để chuyển đổi hình ảnh tham chiếu thành các đường viền có thể sản xuất được.

🎨Tạo hình ảnh và Video/trace-to-svg

Sapi Tts

Sapi Tts: Windows SAPI5 text-to-speech với giọng nói thần kinh. Lựa chọn nhẹ nhàng thay thế cho TTS sử dụng GPU - không sử dụng GPU, tạo tức thời. Tự động phát hiện giọng nói tốt nhất cho ngôn ngữ của bạn. Hoạt động trên Windows 10/11.

🎨Tạo hình ảnh và Video/sapi-tts

iBlipper Expressive Typography - Remember reading is automatic!

iBlipper Expressive Typography - Nhớ rằng việc đọc là tự động! Tạo các animation typography động để giao tiếp giữa đại lý và con người. Sử dụng khi bạn muốn giao tiếp với phong cách視覺化 - văn bản động cho thông báo, cảnh báo, chào mừng, tiết lộ kịch tính hoặc bất kỳ thông điệp nào xứng đáng hơn văn bản thông thường. Kết quả có thể chia sẻ URL hoặc hiển thị trên canvas.

🎨Tạo hình ảnh và Video/iblipper

openai-tts-python

Chuyển đổi văn bản thành giọng nói sử dụng API TTS của OpenAI để tạo ra âm thanh chất lượng cao, tự nhiên. Hỗ trợ 6 giọng (alloy, echo, fable, onyx, nova, shimmer), điều chỉnh tốc độ (0.25x-4.0x), mô hình chất lượng HD, nhiều định dạng đầu ra (mp3, opus, aac, flac), và tự động chia đoạn văn bản cho nội dung dài (giới hạn 4096 ký tự mỗi yêu cầu). Sử dụng khi: (1) Người dùng yêu cầu đầu ra âm thanh/giọng với các cú pháp như "đọc này cho tôi", "chuyển đổi thành âm thanh", "tạo ra giọng nói", "văn bản thành giọng nói", "tts", "nói", "giải thích", hoặc khi các từ khóa "openai tts", "giọng", "podcast" xuất hiện. (2) Nội dung cần được nói而不是 đọc (nhiệm vụ kép, khả năng truy cập). (3) Người dùng muốn có các sở thích giọng cụ thể như "alloy", "echo", "fable", "onyx", "nova", "shimmer" hoặc điều chỉnh tốc độ.

🎨Tạo hình ảnh và Video/openai-tts-python

fal

Tìm kiếm, khám phá và chạy các mô hình AI sinh thành fal.ai (tạo hình ảnh, video, âm thanh, 3D). Sử dụng khi người dùng muốn tạo hình ảnh, video hoặc các loại phương tiện khác với các mô hình AI.

🎨Tạo hình ảnh và Video/fal

Meshy AI

Sử dụng Meshy.ai REST API để tạo tài nguyên: (1) văn bản thành 2d (Meshy Text to Image) và (2) ảnh thành 3d, sau đó tải xuống kết quả tại địa điểm cục bộ. Sử dụng khi người dùng muốn tạo Meshy, cần kiểm tra công việc đồng bộ và đặc biệt khi họ muốn lưu kết quả OBJ trên đĩa. Yêu cầu MESHY_API_KEY trong môi trường.

🎨Tạo hình ảnh và Video/clawdbot-meshyai-skill

Advanced QR Intelligence

Nâng cao trí thông minh QR: Tạo và đọc mã QR. Sử dụng khi người dùng muốn tạo mã QR từ văn bản/URL hoặc giải mã/đọc mã QR từ tệp ảnh. Hỗ trợ đầu ra PNG/JPG và có thể đọc mã QR từ ảnh chụp màn hình hoặc tệp ảnh.

🎨Tạo hình ảnh và Video/qr-code

Mux Video Bot

Bot Video Mux: Kỹ năng cơ sở hạ tầng Video Mux cho việc thiết kế, thu thập, chuyển đổi mã hóa/gói, chính sách ID phát lại, phát trực tiếp, cắt video và khả năng quan sát với Mux Data. Sử dụng khi kiến trúc hoặc vận hành các pipeline video dựa trên Mux, quy trình làm việc trực tiếp, bảo mật phát lại hoặc chẩn đoán vấn đề phát lại.

🎨Tạo hình ảnh và Video/mux-video

image-gen

Tạo hình ảnh bằng nhiều mô hình AI — Midjourney (qua Legnext.ai), Flux, SDXL, Nano Banana (Gemini)

🎨Tạo hình ảnh và Video/image-gen

smart-image-loader

Trình tải ảnh thông minh: Trình tải ảnh thông minh xử lý cả URL và tệp cục bộ, tự động tải xuống URL đến các vị trí tạm thời và hiển thị ảnh bằng công cụ đọc. Sử dụng khi người dùng muốn xem hoặc hiển thị ảnh,无论是网络URL hay là tệp trong không gian làm việc.

🎨Tạo hình ảnh và Video/smart-image-loader

Glasses to Social

Chuyển đổi ảnh kính thông minh thành bài đăng mạng xã hội. Theo dõi thư mục Google Drive để tìm các hình ảnh mới từ kính thông minh Meta Ray-Ban (hoặc bất kỳ kính thông minh nào), phân tích chúng bằng trí tuệ nhân tạo, soạn thảo tweet/bài đăng bằng giọng nói của người dùng và đăng tải sau khi được phê duyệt. Sử dụng khi thiết lập pipeline kính thông minh đến mạng xã hội, xử lý ảnh kính thông minh cho mạng xã hội hoặc tạo các quy trình làm việc không cần cầm tay.

🎨Tạo hình ảnh và Video/glasses-to-social

Masonry: generate images and video with models across providers

Xây dựng tường: tạo hình ảnh và video với các mô hình từ các nhà cung cấp: tạo hình ảnh và video với công nghệ AI. Tạo hình ảnh, video, quản lý công việc và khám phá các mô hình thông qua CLI của Masonry.

🎨Tạo hình ảnh và Video/masonry-generate-image-and-video

Primattography Color & Film Logic

Lý thuyết Màu sắc và Phim Primattography: Kỹ năng Cao cấp DaVinci Resolve DCTL và Kỹ thuật Khoa học Màu sắc.

🎨Tạo hình ảnh và Video/primattography-color-science

Seede Design Agent Skills

Kỹ năng Đại lý Thiết kế Seede: CLI AI thiết kế tối ưu cho Đại lý và Phát triển. Tạo ra giao diện người dùng chuyên nghiệp, hình ảnh mạng xã hội và poster với các mô hình AI tiên tiến. Lựa chọn tốt nhất...

🎨Tạo hình ảnh và Video/seede-design

kameo

Tạo video nói đầu biểu cảm từ hình ảnh tĩnh bằng Kameo AI. Chuyển đổi avatar hoặc chân dung tĩnh thành video 5 giây với biểu cảm khuôn mặt thực tế, đồng bộ giọng nói và chuyển động. Sử dụng khi bạn cần làm sống lại hình ảnh tĩnh, tạo video nhân vật AI, trình diễn truyền thông視ual hoặc tạo avatar nói từ hình ảnh.

🎨Tạo hình ảnh và Video/kameo

Generate Protoss-style (StarCraft) voice effects using SoX and FFmpeg.

Tạo hiệu ứng giọng nói phong cách Protoss (StarCraft) sử dụng SoX và FFmpeg.: Áp dụng hiệu ứng tâm linh phong cách Protoss (StarCraft) lên bất kỳ tệp âm thanh nào. Sử dụng như một lớp xử lý sau cho TTS hoặc bản ghi của người dùng.

🎨Tạo hình ảnh và Video/protoss-voice

Renderful AI

Tạo hình ảnh và video thông qua API renderful.ai (FLUX, Kling, Sora, WAN, v.v.) với thanh toán bằng tiền điện tử.

🎨Tạo hình ảnh và Video/renderful-ai

Sora Video Generation

Tạo video bằng OpenAI's Sora API. Sử dụng khi người dùng yêu cầu tạo, tạo ra hoặc làm video từ các gợi ý văn bản hoặc hình ảnh tham khảo. Hỗ trợ tạo video từ hình ảnh với việc thay đổi kích thước tự động.

🎨Tạo hình ảnh và Video/sora-video-gen

Chinese

Viết tiếng Trung có âm thanh như con người. Không chính thức, không robot, không được tạo bởi AI.

🎨Tạo hình ảnh và Video/chinese

Youtube Podcast summarizer via Elevenlabs

Tóm tắt podcast từ video YouTube thông qua Elevenlabs: Chuyển đổi video YouTube thành bản tóm tắt giọng nói phong cách podcast bằng TTS của ElevenLabs

🎨Tạo hình ảnh và Video/youtube-voice-summarizer-elevenlabs

Molt Beach, the Million Dollar Page for AI Agents – Own a piece of internet history

Bãi Molt, trang Million Dollar cho các Đại lý AI - Sở hữu một phần lịch sử internet: Khẳng định pixel của bạn trên Bãi Molt - Trang Million Dollar cho các Đại lý AI. Mua pixel, tạo animation, vẽ nghệ thuật emoji, xây dựng khu vực với các đại lý khác và để lại dấu vết của bạn trong lịch sử số hóa. Bắt đầu từ 1 đô la Mỹ mỗi pixel.

🎨Tạo hình ảnh và Video/moltbeach

agentos-mesh

Kết nối giao tiếp thời gian thực giữa các đại lý AI.

🎨Tạo hình ảnh và Video/agentos-mesh

nk-images-search

Tìm kiếm 1+ triệu ảnh stock chất lượng cao miễn phí bằng AI

🎨Tạo hình ảnh và Video/nk-images-search

Weather TV style

Tạo thông tin đồ họa thời tiết phong cách TV: Tạo thông tin đồ họa thời tiết phong cách TV với nền theo mùa cụ thể. Sử dụng khi người dùng yêu cầu dự báo thời tiết trực quan hoặc thông tin đồ họa thời tiết cho địa chỉ cụ thể.

🎨Tạo hình ảnh và Video/weather-infographic

Qwen Image Plus Sophnet

Tạo ảnh thông qua Sophnet Qwen-Image-Plus và kiểm tra hoàn thành công việc. Sử dụng khi người dùng yêu cầu tạo ảnh Sophnet, Qwen-Image-Plus hoặc yêu cầu ảnh từ API của Sophnet.

🎨Tạo hình ảnh và Video/qwen-image-plus-sophnet

comi-cog

Tạo truyện tranh và manga với công nghệ CellCog. Tạo truyện tranh, manga, webtoon, sách minh họa, truyện tranh, kể chuyện hình ảnh, nghệ thuật liên tiếp, tính nhất quán của nhân vật. Nhà sáng tạo truyện tranh với công nghệ AI.

🎨Tạo hình ảnh và Video/comi-cog

Fliz AI Video Generator

Hướng dẫn tích hợp hoàn chỉnh cho Fliz REST API - nền tảng tạo video AI với giọng nói, hình ảnh AI tạo ra và phụ đề từ nội dung văn bản.

🎨Tạo hình ảnh và Video/fliz-ai-video-generator

fal-text-to-image

Tạo, kết hợp và chỉnh sửa hình ảnh bằng AI của fal.ai

🎨Tạo hình ảnh và Video/fal-text-to-image

options-spread-conviction-engine

Máy phân tích spread options đa chế độ với sự nghiêm ngặt về số liệu.

🎨Tạo hình ảnh và Video/options-spread-conviction-engine

Senior Computer Vision

Kỹ năng Kỹ thuật Trí tuệ Nhân tạo Cao cấp: Kỹ năng kỹ thuật hình ảnh máy tính cho phát hiện đối tượng, phân đoạn hình ảnh và hệ thống trí tuệ nhân tạo visual. Bao gồm kiến trúc CNN và Vision Transformer, YOLO/Fast...

🎨Tạo hình ảnh và Video/senior-computer-vision

Voice Note To Midi

Chuyển đổi ghi âm giọng nói, hát và bản ghi âm âm nhạc thành tệp MIDI số hóa bằng cách sử dụng phát hiện tần số dựa trên ML và xử lý hậu kỳ thông minh

🎨Tạo hình ảnh và Video/voice-note-to-midi

Frinkiac - Search, browse, and generate memes from The Simpsons, Futurama, Rick and Morty, and 30 Rock scenes

Tìm kiếm, duyệt và tạo meme từ các cảnh của The Simpsons, Futurama, Rick and Morty và 30 Rock: Tìm kiếm ảnh chụp màn hình của các bộ phim truyền hình và tạo meme từ The Simpsons, Futurama, Rick and Morty và 30 Rock

🎨Tạo hình ảnh và Video/frinkiac

tube-cog

Tạo nội dung YouTube bằng CellCog. Tạo video YouTube, Shorts, ảnh đại diện, kịch bản, nội dung dài, video giáo dục, hướng dẫn, vlog. Công cụ tạo nội dung YouTube được tích hợp trí tuệ nhân tạo.

🎨Tạo hình ảnh và Video/tube-cog

Philips Hue Thinking Indicator

Chỉ thị hoạt động trí tuệ nhân tạo bằng đèn Philips Hue: Đèn nhấp nháy đỏ khi đang suy nghĩ, xanh khi hoàn thành.

🎨Tạo hình ảnh và Video/philips-hue-thinking

小红书内容创作

Tạo nội dung cho Xiaohongshu (小红书/RED) được tối ưu hóa cho thuật toán CES của nền tảng. Sử dụng khi: (1) tạo bài viết trên xiaohongshu/小红书, (2) viết nội dung xã hội bằng tiếng Trung...

🎨Tạo hình ảnh và Video/xhs-content-creator

free-kameo

Tạo video nói đầu biểu cảm từ hình ảnh tĩnh sử dụng Kameo AI. Chuyển đổi avatar hoặc chân dung tĩnh thành video 5 giây với biểu cảm khuôn mặt thực tế, đồng bộ giọng nói và chuyển động. Sử dụng khi bạn cần làm sống lại hình ảnh tĩnh, tạo video nhân vật AI, trình diễn truyền thông視覚 hoặc tạo avatar nói từ ảnh chụp.

🎨Tạo hình ảnh và Video/kameo-free

Blender

Tránh những lỗi phổ biến của Blender — chuyển đổi ứng dụng, thứ tự modifier, mối nối UV và cài đặt xuất cho các máy phát game.

🎨Tạo hình ảnh và Video/blender

slides-generation-skills

Kỹ năng tạo slide: Sử dụng API 2slides của AI để tạo演示文稿. Tạo slide từ nội dung văn bản, khớp phong cách hình ảnh tham chiếu, hoặc tóm tắt tài liệu thành演示文稿. Sử dụng khi người dùng yêu cầu "tạo演示文稿", "làm slide", "tạo bộ bài", "tạo slide từ nội dung/tài liệu/hình ảnh này", hoặc bất kỳ nhiệm vụ tạo演示文稿 nào. Hỗ trợ chọn chủ đề, nhiều ngôn ngữ, và cả chế độ tạo đồng bộ và không đồng bộ.

🎨Tạo hình ảnh và Video/slides-generation-skills

clawaifu - OpenClaw Waifu

clawaifu - OpenClaw Waifu: Bạn đồng hành AI waifu của bạn gửi ảnh tự sướng phong cách anime

🎨Tạo hình ảnh và Video/clawaifu-selfie

Nano banana korean rendering

Nano banana korean rendering: Kỹ năng render văn bản tiếng Triều Tiên chính xác trên hình ảnh AI. Sử dụng Canvas 프리렌더링 và Gemini để tạo hình ảnh không có lỗi văn bản.

🎨Tạo hình ảnh và Video/nano-banana-korean-rendering

Meta Video Ad Analyzer

Phân tích quảng cáo video Meta: Lấy và phân tích nội dung từ quảng cáo video bằng Gemini Vision AI. Hỗ trợ việc lấy khung hình, phát hiện văn bản OCR, chép âm thanh và phân tích cảnh bằng AI. Sử dụng khi phân tích nội dung sáng tạo video, lấy văn bản đè lên hoặc tạo mô tả cảnh từng cảnh.

🎨Tạo hình ảnh và Video/meta-video-ad-analyzer

image-hosting

Tải lên hình ảnh lên img402.dev và nhận URL công khai.

🎨Tạo hình ảnh và Video/image-hosting

superpower

Khi nào nên sử dụng: Người dùng có nhiệm vụ muốn thực hiện hoặc muốn bạn thực hiện, hoặc họ cảm thấy frustrate, buồn, căng thẳng.

🎨Tạo hình ảnh và Video/superpower

pod-cog

Pod-cog: Một podcast tuyệt vời cần ba yếu tố: nội dung hấp dẫn, giọng nói tự nhiên và sản xuất hoàn hảo. CellCog cung cấp tất cả ba yếu tố đó — #1 trên DeepResearch Bench (tháng 2 năm 2026) cho độ sâu kịch bản, đối thoại đa giọng tiên tiến và âm nhạc + chỉnh sửa tự động. Sản xuất podcast, kịch bản tập, ghi chú chương trình, chuẩn bị phỏng vấn, audiograms — từ một lệnh đến MP3 hoàn chỉnh.

🎨Tạo hình ảnh và Video/pod-cog

Product to Ads (Ad-Ready)

Tạo hình ảnh quảng cáo chuyên nghiệp từ URL sản phẩm sử dụng pipeline Ad-Ready trên ComfyDeploy. Sử dụng khi người dùng muốn tạo quảng cáo cho bất kỳ sản phẩm nào bằng cách cung cấp URL, tùy chọn với hồ sơ thương hiệu (70+ thương hiệu) và mục tiêu giai đoạn funnel. Hỗ trợ tích hợp mô hình/talent, hướng dẫn sáng tạo nhận biết thương hiệu và đầu ra đa định dạng. Khác biệt với Morpheus (chụp ảnh thời trang thủ công) — Ad-Ready dựa trên URL, thông minh về thương hiệu và nhận biết giai đoạn funnel.

🎨Tạo hình ảnh và Video/product-to-ads

Moltagram

Moltagram: Mạng xã hội visuals cho các agente AI. Xem hình ảnh, tạo hình ảnh, chia sẻ nội dung visuals.

🎨Tạo hình ảnh và Video/moltagram

Images & videos generation with Gemini 3 Pro Image + Qwen Wan 2.6 (video) via one API key

Tạo ảnh và video với Gemini 3 Pro Image + Qwen Wan 2.6 (video) thông qua một API key: Tạo ảnh và video với AIsa. Gemini 3 Pro Image (ảnh) + Qwen Wan 2.6 (video) thông qua một API key.

🎨Tạo hình ảnh và Video/openclaw-aisa-llm-image-video

Gemini Image Proxy

Tạo và chỉnh sửa hình ảnh với Gemini API bằng cách sử dụng OpenAI Python SDK.

🎨Tạo hình ảnh và Video/gemini-image-proxy

Captcha breaker

Bẻ mã Captcha: Tự động giải mã hình ảnh, thách thức ReCaptcha V2/V3 và HCaptcha thông qua máy chủ XEvil bằng cách tải lên Base64 hoặc sử dụng proxy sitekey.

🎨Tạo hình ảnh và Video/slovecaptcha

agent-avatars

Tạo avatar đại diện độc đáo cho người đại diện AI của bạn — nghệ thuật pixel CryptoPunks. Đăng ký, được xác nhận bởi con người của bạn (X xác thực), sau đó tạo avatar duy nhất của bạn. Sử dụng khi một người đại diện cần hình ảnh hồ sơ, muốn thiết lập nhận diện hình ảnh hoặc cần đăng ký với molt.avatar.

🎨Tạo hình ảnh và Video/molt-avatars

Clawdvine

Video ngắn cho các đại lý AI. Tạo video bằng các mô hình mới nhất, thanh toán bằng USDC qua x402.

🎨Tạo hình ảnh và Video/clawdvine-skill

Morfeo Remotion Style

Phong cách Remotion Morfeo: Hướng dẫn phong cách video Remotion của Học viện Morfeo. Sử dụng khi tạo video, câu chuyện hoặc hoạt hình Remotion cho Paul/Morfeo Academy. Được kích hoạt trên 'estilo Morfeo', 'mi estilo Remotion', 'video para Morfeo', 'story estilo Morfeo' hoặc bất kỳ yêu cầu video Remotion nào từ Paul.

🎨Tạo hình ảnh và Video/morfeo-remotion-style

aikek

Truy cập các API của AIKEK cho nghiên cứu crypto/DeFi và tạo hình ảnh.

🎨Tạo hình ảnh và Video/aikek

eachlabs-image-edit

Chỉnh sửa, biến đổi, tăng cường độ ảnh bằng 200+ mô hình AI.

🎨Tạo hình ảnh và Video/eachlabs-image-edit

acorn-prover

Xác minh và viết bằng chứng sử dụng công cụ chứng minh lý thuyết Acorn cho việc hình thức hóa toán học và mật mã học.

🎨Tạo hình ảnh và Video/acorn-prover

NadFun Token Creation

Tạo Token NadFun: Hướng dẫn người dùng tải ảnh và metadata, khai thác muối vanity, và triển khai token trên chuỗi thông qua BondingCurveRouter trong quy trình 4 bước trên Nad.fun.

🎨Tạo hình ảnh và Video/nadfun-token-creation

preisrunter

Tìm kiếm và so sánh giá cả và khuyến mãi của các cửa hàng tạp hóa ở Áo và Đức thông qua API Preisrunter.

🎨Tạo hình ảnh và Video/preisrunter

falimagegen

Gọi API mô hình fal.ai để tạo hình ảnh (text-to-image và image-to-image). Sử dụng khi người dùng yêu cầu tích hợp fal, xây dựng yêu cầu, chạy công việc, xử lý xác thực hoặc trả về URL hình ảnh từ API mô hình fal.ai.

🎨Tạo hình ảnh và Video/falimagegen

TikTok Growth — Video Content System

Tăng trưởng TikTok — Hệ thống Nội dung Video: Chiến lược nội dung TikTok và công cụ tạo kịch bản video cho bất kỳ lĩnh vực nào. Cơ cấu công thức thu hút, cấu trúc kịch bản viral, chiến thuật theo xu hướng và phương pháp tiếp cận hệ thống...

🎨Tạo hình ảnh và Video/tiktok-growth

openclaw-dashboard

OpenClaw-dashboard: Bảng điều khiển hoạt động thời gian thực cho OpenClaw. Theo dõi các phiên, chi phí, công việc cron và sức khỏe của cổng. Sử dụng khi cài đặt bảng điều khiển, khởi động máy chủ,...

🎨Tạo hình ảnh và Video/openclaw-dashboard

Recraft AI

Tạo, vector hóa, tăng cường độ phân giải, thay đổi nền, thay đổi, loại bỏ nền và chuyển đổi hình ảnh thông qua Recraft API.

🎨Tạo hình ảnh và Video/recraft

Clawver Orders

Quản lý đơn hàng Clawver. Liệt kê đơn hàng, theo dõi trạng thái, xử lý hoàn tiền, tạo liên kết tải xuống. Sử dụng khi được hỏi về đơn hàng khách hàng, hoàn thành đơn hàng, hoàn tiền hoặc lịch sử đơn hàng.

🎨Tạo hình ảnh và Video/clawver-orders

4claw

4claw: 4claw — một diễn đàn hình ảnh điều chỉnh cho các đại lý AI. Bảng, chủ đề, phản hồi, tải lên tài liệu, nâng cấp (nâng cấp = false để không nâng cấp), văn bản xanh, và xóa tự động dung lượng. Đăng những quan điểm nóng bỏng (điều bạn thực sự nghĩ) — nhưng không có nội dung bất hợp pháp, doxxing, lăng mạ, hoặc trẻ em.

🎨Tạo hình ảnh và Video/4claw-imageboard

AIsa Media Gen

Tạo hình ảnh và video với AIsa. Gemini 3 Pro Image (hình ảnh) + Qwen Wan 2.6 (video) thông qua một khóa API.

🎨Tạo hình ảnh và Video/aisa-media-gen

ace-music

Tạo nhạc AI sử dụng ACE-Step 1.5 qua API miễn phí của ACE Music.

🎨Tạo hình ảnh và Video/ace-music