AI 图像
369 个实体 · 自动按 Tier 分层 · NavXD 知识图谱已收录
旗舰
// TIER-1 · 本主题最具影响力的 12 个Banana Slides
一个基于 nano banana pro 强大模型的开源 AI PPT 生成工具,它如何通过自然语言驱动、文件解析与素材上传等机
InstantID
提供一张面部照片和文本提示,即可在数秒内生成多种风格、姿态和背景的高保真个性化图像。
LTX-video
实时生成能力、高质量输出和开源特性重新定义了视频创作标准。
Paper2Poster
由牛津大学等研究团队于 2025 年 5 月发布的开源 AI 工具,旨在自动将学术论文转化为高质量的海报(poster)。
Luma AI
Luma AI 推出的先进视频编辑工具,集成于其旗舰平台 Dream Machine 中。
Runway ML
Runway ML 是一款功能强大的AI驱动创意工具,专注于图像生成、视频处理和多媒体内容创作,广泛应用于影视、设计、广告等领域
Stable Diffusion
Stable Diffusion 是一个基于深度学习的开源图像生成模型,能够根据文本描述生成高质量的图像。
Galileo AI
通过自然语言或图像提示,快速生成高保真、可编辑的用户界面设计。
即梦AI
以AI驱动图文/视频一站式创作,让普通人的奇思妙想秒变专业级成品。
文心一格
文心一格,AI艺术和创意辅助平台,依托飞桨、文心大模型的技术创新推出的“AI作画”产品,可轻松驾驭多种风格,人人皆可“一语成画”
Uizard
这个平台利用机器学习技术,可以将用户手绘的草图转换为可交互的数字界面,对于UI/UX设计师来说非常有用。
Stability AI
使用 SDXL Turbo 和 Stable Diffusion XL 图像生成功能和API接口。
实用
// TIER-2 · 稳定推荐档OmniAvatar
OmniAvatar 是由浙江大学与阿里巴巴联合开发的开源音频驱动全身 avatar 视频生成模型,支持精确 lip‑sync、
Octo
开源通用机器人策略模型,支持多机器人任务训练。
Direct3D-S2
由南京大学、复旦大学、牛津大学等机构联合推出的高分辨率 3D 生成框架。
FireRed-Image-Edit
小红书 FireRed 团队推出的 AI 图像编辑模型。
PosterCraft
PosterCraft 是开源的高质量美学海报生成框架,通过多阶段优化流程实现精准文本渲染、高级布局与视觉–语言反馈,免费提供模
ERNIE-Image
百度推出的开源文生图模型。
HiDream-O1-Image
智象未来发布的统一式图像生成基础模型。
EmbodiedGen
EmbodiedGen 是由 Horizon Robotics 提出的开源 3D 生成工具,支持多模态资产(图像、文本、布局)生
OmniConsistency
一个基于 Diffusion Transformer 的图像一致性插件,主要用于图像到图像(Image-to-Image)风格迁
PreenCut
PreenCut 是一款开源 AI 视频检索与剪辑工具,支持语音识别(WhisperX)、LLM 分析、自然语言查询与批量处理,
Stream‑Omni
Stream‑Omni 是由中科院 ICT NLP 团队开源的一体化 GPT‑4o 风格语言-视觉-语音多模态聊天模型。支持任何
InternVL-U
上海 AI Lab 推出的统一多模态生成与理解模型。
MTVCrafter
一款面向开放世界人像动画的 AI 视频生成框架,旨在通过直接建模原始 3D 动作序列,实现高质量的人像动画生成。
按类型浏览
// 4 种实体 · 每类 Top 6工具 // 347
查看全部 347 个 →Banana Slides
一个基于 nano banana pro 强大模型的开源 AI PPT 生成工具,它如何通过自然语言驱动、文件解析与素材上传等机
InstantID
提供一张面部照片和文本提示,即可在数秒内生成多种风格、姿态和背景的高保真个性化图像。
LTX-video
实时生成能力、高质量输出和开源特性重新定义了视频创作标准。
Luma AI
Luma AI 推出的先进视频编辑工具,集成于其旗舰平台 Dream Machine 中。
Runway ML
Runway ML 是一款功能强大的AI驱动创意工具,专注于图像生成、视频处理和多媒体内容创作,广泛应用于影视、设计、广告等领域
Stable Diffusion
Stable Diffusion 是一个基于深度学习的开源图像生成模型,能够根据文本描述生成高质量的图像。
智能体 // 10
查看全部 10 个 →Paper2Poster
由牛津大学等研究团队于 2025 年 5 月发布的开源 AI 工具,旨在自动将学术论文转化为高质量的海报(poster)。
MultiAgentPPT
MultiAgentPPT 是一款开源工具,通过多 AI Agent 协同自动生成 PPT 结构、内容及视觉设计,支持自定义模板
ScoutDB
Scout AI 推出的全球首个“Agentic Mongo GUI”,为工程师提供一个既直观又智能的 MongoDB 数据库可
ClickPrompt
ClickPrompt 是一款专为 Prompt 编写者设计的工具,它支持多种基于 Prompt 的 AI 应用,例如 Stab
星流Agent
星流Agent 是 LiblibAI 推出的中文本土化多模态设计智能体,继承 Lovart 的 AI 创作能力,支持文字、图像、
DBiM
一款领先的 元宇宙在线平台,融合 AI Agent、数字人、3D建模与虚拟展览等功能,助力企业和个人用户在元宇宙环境中开展商业活
公司 // 6
查看全部 6 个 →InternVL-U
上海 AI Lab 推出的统一多模态生成与理解模型。
Kolors Virtual
快手可图团队开发的一款基于人工智能的虚拟试穿工具。
Labubu Wallpaper
Labubu Wallpaper 是 AI 生成的 Pop Mart Labubu 角色壁纸平台,提供高清静态与动态桌面/手机背
Labubu live wallpaper
Labubu live wallpaper 是一款深受 Labubu 收藏者和动态主题爱好者喜爱的高清动态壁纸平台,提供免费可下
SkinCareLens
结合全球皮肤科数据与韩方护肤经验的 AI 分析能力。
阶跃AI
融合网页搜索与知识库,支持文本、图像、文档、语音多种输入方式,提供实时对话、多轮交互、图文理解、文档问答及创作辅助等功能,旨在提
模型 // 6
查看全部 6 个 →ERNIE-Image
百度推出的开源文生图模型。
PromptHero
最受欢迎的AI绘画提示词网站之一,内容包括Midjourney、Stable Diffusion、DALL-E等关键词。
Gemini
Gemini代表了Google在AI领域的最新突破,通过其多模式处理和高级推理能力,为用户和开发者提供了强大的工具和平台,以实现
Pixel Reasoner
一款前沿的开源视觉语言模型(VLM),旨在突破传统“文字链式思维(Chain-of-Thought, CoT)”的局限,首次实现
OpusClip Thumbnail
OpusClip 团队推出的全新 AI 缩略图生成工具,旨在帮助 YouTube 创作者快速制作高点击率的缩略图。
CAR
由字节跳动与复旦大学联合提出的一种自适应推理框架,旨在提升大型语言模型(LLM)和多模态大型语言模型(MLLM)在处理各类任务时
