dhxiaoheiyun

应无所住,而生其心。
CoGenAV

CoGenAV

一种多模态语音表征模型,旨在通过对比-生成同步策略,学习音频与视觉之间的深层次关联。
05330
Largo.ai

Largo.ai

一款专为电影、电视剧和广告行业打造的人工智能辅助创作平台,旨在通过数据驱动的洞察力优化内容开发流程。
04210
DeepSeek-R1-0528

DeepSeek-R1-0528

DeepSeek 于 2025 年 5 月 29 日发布的开源大语言模型(LLM)更新版本,基于其先前的 R1 模型。
05010
AI-Media2Doc

AI-Media2Doc

一款开源的 AI 图文创作助手,能够将音频和视频内容一键转换为多种风格的文档,如小红书笔记、微信公众号文章、知识笔记、思维导图等。
03830
AIpai

AIpai

一款 AI 视频创作智能体,致力于解决各类复杂多样的视频制作需求。
06350
MagicPath

MagicPath

一个基于 AI 的无限画布设计工具,支持用户通过自然语言与 AI 对话,快速生成和编辑设计组件,无需手动操作。
04880
Opera Neon

Opera Neon

Opera 公司于 2025 年推出的一款全新概念浏览器,被称为“AI 代理浏览器”(Agentic Browser)。
06370
DishGen

DishGen

一款由 AI 驱动的菜谱生成工具,用户只需输入手头的食材、饮食需求或菜谱创意,DishGen 即可在几秒钟内生成详细的菜谱,包括菜名、描述、所需食材及烹饪步骤。
04260
SelectYet

SelectYet

一款 AI 驱动的文献分析平台,利用“记忆摘要”技术对上传的PDF文献进行结构化分析。
05569
Ming-lite-omni

Ming-lite-omni

蚂蚁集团于 2025 年 5 月开源发布的统一多模态大模型,旨在实现文本、图像、音频和视频等多种模态的理解与生成能力。
05170
稿定AI社区

稿定AI社区

一个融合了AI技术与设计创意的在线平台,提供包括AI绘图、AI文案、AI素材、AI商品图等多种功能,帮助用户快速生成高质量的视觉内容。
05450
Jodi

Jodi

中国科学院计算技术研究所与中国科学院大学联合推出的视觉理解与生成统一模型。
06120