AI 图像

Banana Slides

一个基于 nano banana pro 强大模型的开源 AI PPT 生成工具，它如何通过自然语言驱动、文件解析与素材上传等机

⭐ 14.8k→

InstantID

提供一张面部照片和文本提示，即可在数秒内生成多种风格、姿态和背景的高保真个性化图像。

⭐ 12.0k→

LTX-video

实时生成能力、高质量输出和开源特性重新定义了视频创作标准。

⭐ 10.4k→

智能体T1

Paper2Poster

由牛津大学等研究团队于 2025 年 5 月发布的开源 AI 工具，旨在自动将学术论文转化为高质量的海报（poster）。

⭐ 3.7k→

Luma AI

Luma AI 推出的先进视频编辑工具，集成于其旗舰平台 Dream Machine 中。

Runway ML

Runway ML 是一款功能强大的AI驱动创意工具，专注于图像生成、视频处理和多媒体内容创作，广泛应用于影视、设计、广告等领域

Stable Diffusion

Stable Diffusion 是一个基于深度学习的开源图像生成模型，能够根据文本描述生成高质量的图像。

Galileo AI

通过自然语言或图像提示，快速生成高保真、可编辑的用户界面设计。

即梦AI

以AI驱动图文/视频一站式创作，让普通人的奇思妙想秒变专业级成品。

文心一格

文心一格，AI艺术和创意辅助平台，依托飞桨、文心大模型的技术创新推出的“AI作画”产品，可轻松驾驭多种风格，人人皆可“一语成画”

Uizard

这个平台利用机器学习技术，可以将用户手绘的草图转换为可交互的数字界面，对于UI/UX设计师来说非常有用。

Stability AI

使用 SDXL Turbo 和 Stable Diffusion XL 图像生成功能和API接口。

实用

// TIER-2 · 稳定推荐档

OmniAvatar

OmniAvatar 是由浙江大学与阿里巴巴联合开发的开源音频驱动全身 avatar 视频生成模型，支持精确 lip‑sync、

⭐ 1.8k→

Octo

开源通用机器人策略模型，支持多机器人任务训练。

⭐ 1.7k→

Direct3D-S2

由南京大学、复旦大学、牛津大学等机构联合推出的高分辨率 3D 生成框架。

⭐ 1.2k→

FireRed-Image-Edit

小红书 FireRed 团队推出的 AI 图像编辑模型。

⭐ 1.2k→

PosterCraft

PosterCraft 是开源的高质量美学海报生成框架，通过多阶段优化流程实现精准文本渲染、高级布局与视觉–语言反馈，免费提供模

⭐ 538→

模型T2

ERNIE-Image

百度推出的开源文生图模型。

⭐ 456→

HiDream-O1-Image

智象未来发布的统一式图像生成基础模型。

⭐ 455→

EmbodiedGen

EmbodiedGen 是由 Horizon Robotics 提出的开源 3D 生成工具，支持多模态资产（图像、文本、布局）生

⭐ 422→

OmniConsistency

一个基于 Diffusion Transformer 的图像一致性插件，主要用于图像到图像（Image-to-Image）风格迁

⭐ 420→

PreenCut

PreenCut 是一款开源 AI 视频检索与剪辑工具，支持语音识别（WhisperX）、LLM 分析、自然语言查询与批量处理，

⭐ 401→

Stream‑Omni

Stream‑Omni 是由中科院 ICT NLP 团队开源的一体化 GPT‑4o 风格语言-视觉-语音多模态聊天模型。支持任何

⭐ 386→

公司T2

InternVL-U

上海 AI Lab 推出的统一多模态生成与理解模型。

⭐ 286→

MTVCrafter

一款面向开放世界人像动画的 AI 视频生成框架，旨在通过直接建模原始 3D 动作序列，实现高质量的人像动画生成。

⭐ 276→

按类型浏览

// 4 种实体 · 每类 Top 6

工具 // 357

查看全部 357 个 →

Banana Slides

一个基于 nano banana pro 强大模型的开源 AI PPT 生成工具，它如何通过自然语言驱动、文件解析与素材上传等机

⭐ 14.8k→

InstantID

提供一张面部照片和文本提示，即可在数秒内生成多种风格、姿态和背景的高保真个性化图像。

⭐ 12.0k→

LTX-video

实时生成能力、高质量输出和开源特性重新定义了视频创作标准。

⭐ 10.4k→

Luma AI

Luma AI 推出的先进视频编辑工具，集成于其旗舰平台 Dream Machine 中。

Runway ML

Runway ML 是一款功能强大的AI驱动创意工具，专注于图像生成、视频处理和多媒体内容创作，广泛应用于影视、设计、广告等领域

Stable Diffusion

Stable Diffusion 是一个基于深度学习的开源图像生成模型，能够根据文本描述生成高质量的图像。

智能体 // 10

查看全部 10 个 →

智能体T1

Paper2Poster

由牛津大学等研究团队于 2025 年 5 月发布的开源 AI 工具，旨在自动将学术论文转化为高质量的海报（poster）。

⭐ 3.7k→

MultiAgentPPT

MultiAgentPPT 是一款开源工具，通过多 AI Agent 协同自动生成 PPT 结构、内容及视觉设计，支持自定义模板

⭐ 49→

ScoutDB

Scout AI 推出的全球首个“Agentic Mongo GUI”，为工程师提供一个既直观又智能的 MongoDB 数据库可

ClickPrompt

ClickPrompt 是一款专为 Prompt 编写者设计的工具，它支持多种基于 Prompt 的 AI 应用，例如 Stab

星流Agent

星流Agent 是 LiblibAI 推出的中文本土化多模态设计智能体，继承 Lovart 的 AI 创作能力，支持文字、图像、

DBiM

一款领先的元宇宙在线平台，融合 AI Agent、数字人、3D建模与虚拟展览等功能，助力企业和个人用户在元宇宙环境中开展商业活

模型 // 7

查看全部 7 个 →

模型T2

ERNIE-Image

百度推出的开源文生图模型。

⭐ 456→

PromptHero

最受欢迎的AI绘画提示词网站之一，内容包括Midjourney、Stable Diffusion、DALL-E等关键词。

Ideogram 4

快速结论 Ideogram 4（Ideogram 4.0 · Ideogram）是一款主打"图内文字渲染"的文生图基础模型，20

‎Gemini

Gemini代表了Google在AI领域的最新突破，通过其多模式处理和高级推理能力，为用户和开发者提供了强大的工具和平台，以实现

Pixel Reasoner

一款前沿的开源视觉语言模型（VLM），旨在突破传统“文字链式思维（Chain-of-Thought, CoT）”的局限，首次实现

OpusClip Thumbnail

OpusClip 团队推出的全新 AI 缩略图生成工具，旨在帮助 YouTube 创作者快速制作高点击率的缩略图。

公司 // 6

查看全部 6 个 →

公司T2

InternVL-U

上海 AI Lab 推出的统一多模态生成与理解模型。

⭐ 286→

Kolors Virtual

快手可图团队开发的一款基于人工智能的虚拟试穿工具。

Labubu Wallpaper

Labubu Wallpaper 是 AI 生成的 Pop Mart Labubu 角色壁纸平台，提供高清静态与动态桌面/手机背

Labubu live wallpaper

Labubu live wallpaper 是一款深受 Labubu 收藏者和动态主题爱好者喜爱的高清动态壁纸平台，提供免费可下

SkinCareLens

结合全球皮肤科数据与韩方护肤经验的 AI 分析能力。

阶跃AI

融合网页搜索与知识库，支持文本、图像、文档、语音多种输入方式，提供实时对话、多轮交互、图文理解、文档问答及创作辅助等功能，旨在提