DecipherIt一个受 Google NotebookLM 启发的开源 AI 研究助手,旨在帮助研究人员、学生和专业人士高效地探索、分析和整合来自网络的多种信息源。03700开源工具与社区最近收录AI# AI思维导图# AI生成摘要# AI研究助手
Gemini Fullstack LangGraph QuickstartGoogle 开源的全栈 AI 智能体示例项目,结合了 Gemini 2.5 大模型与 LangGraph 框架,旨在构建具备深度搜索与智能研究能力的对话式 AI 系统。04690最近收录AI框架与库# 全栈 AI 智能体示例项目
PandaWiki一款由 AI 大模型驱动的开源知识库搭建系统,旨在帮助用户快速构建智能化的产品文档、技术文档、FAQ 和博客系统。04490开源工具与社区最近收录AI# AI 辅助创作# AI 辅助搜索# AI 辅助问答
OpenAudioFish Audio 推出的新一代文本转语音(TTS)模型,旨在生成高度自然、富有情感的语音输出。02770大模型娱乐媒体# AI播客能容创作# AI有声书内容创作# AI游戏角色语音
OmniAudio阿里巴巴通义实验室开发的空间音频生成模型,能够直接从 360° 视频生成空间音频,为虚拟现实和沉浸式娱乐带来了全新的可能性。03110大模型娱乐媒体# AI增强现实# AI虚拟现实# AI音频内容创作
AiMakeSong一款基于人工智能的在线音乐生成平台,旨在帮助用户通过简单的文本输入或歌词创作,快速生成高质量的原创歌曲。03150娱乐媒体最近收录AI# AI在线音乐生成平台# AI歌词生成工具# 文本转歌曲
DeepSider一款集成于浏览器侧边栏的免费 AI 助手插件,支持在 Google Chrome 和 Microsoft Edge 浏览器中使用。它整合了多款顶级大模型,包括 GPT-4o、Claude 3.7、Gemini 2.0、Grok 3 以及 DeepSeek R1/V3 等。01,2920最近收录AI编程工具# AI代码生成# AI内容创作# AI助手插件
TrackVLA银河通用于 2025 年 6 月发布的全球首个产品级端到端具身导航大模型(FSD)。该模型具备纯视觉环境感知、语言指令驱动、自主推理和零样本泛化能力,能实现从视觉感知到动作输出的全链路闭环。04830医疗与健康大模型# 大模型# 导航大模型
从容大模型从容大模型 是由云从科技(孵化自中科院自动化所)研发的国产通用多模态大语言模型(LLM),支持文本、图像、语音等多模态输入,具备强大的理解、生成与推理能力。02950大模型最近收录AI# 多模态大模型# 大模型
PPT.cn一款面向中文用户的 智能PPT文档生成与美化平台,融合了 AI 技术与专业设计能力,帮助用户从文案输入到整套幻灯片生成实现全流程自动化。02910教育与学习最近收录AI# AI PPT文档生成# AI PPT美化
HackFastHackFast 是一款面向伦理黑客和渗透测试团队的 AI 驱动安全工具,旨在通过自动化和智能分析,提升渗透测试的效率和准确性。02840教育与学习最近收录AI# AI安全工具# AI漏洞识别# 渗透测试工具
SuperMaker AI Video Generator一款基于人工智能的视频生成工具,允许用户通过输入文本、图片、脚本或提示词,快速生成风格多样、画质高清的视频内容。03700最近收录AI计算机视觉# AI数字人出境解说# AI视频剪辑# AI视频生成工具
Video Background Remover一款基于人工智能的视频背景移除工具,能够智能识别视频中的人物或主体,并自动去除背景,无需绿幕或专业设备。04400内容创作教育与学习# AI背景替换# AI视频背景移除工具
DGMDGM 是一种具备自我进化能力的 AI Agent 系统。它通过迭代修改自身代码,提升自身性能,广泛应用于自动编程、代码优化、自动修复等领域。DGM 的核心理念是通过开放式探索和自我改进,实现 AI 系统的持续进化。04820教育与学习最近收录AI# AI Agent# AI代码优化# AI编程
SignGemmaGoogle DeepMind 于 2025 年 5 月推出的一款先进的 AI 手语翻译模型,旨在打破听障人士在沟通中的障碍。04060医疗与健康大模型# 多模态AI模型# 手语翻译模型
Fairies AIFairies 是一款革命性的通用 AI 代理工具,能够显著提升个人和团队的工作效率。它通过先进的自然语言处理技术和强大的多任务执行能力,帮助用户完成各种复杂工作。04220办公提效教育与学习# AI Agent# AI对话交互# 多任务处理
OmniSync一个基于扩散变换器(Diffusion Transformers)的无掩码视频编辑框架,专注于唇部动作与音频的精准同步。07020最近收录AI框架与库# AI内容生成# AI影视配音# AI游戏开发
Mobvoi MCP Server出门问问(Mobvoi)于 2025 年 5 月 29 日正式发布的一款多模态 AI 服务平台。05640开源工具与社区最近收录AI# AI声音克隆# AI数字人# AI视频翻译
EVI 3一款基于共情大语言模型(eLLM)技术的语音语言模型,能够同时处理文本和语音输入,生成自然、富有表现力的语音响应。04710医疗与健康大模型# AI 语音交互体验# 共情大语言模型(eLLM)# 语音语言模型
灵码 IDE灵码 IDE 是阿里云发布的首个 AI 原生开发环境工具,深度适配了最新的千问3大模型,全面集成通义灵码插件能力,具备编程智能体、行间建议预测、行间会话等功能。06220企业用户初学者# AI代码补全# AI编码助手# AI编程
WebAgent阿里巴巴于 2025 年开源的自主搜索 AI 智能体,旨在通过模拟人类在网络上的行为,实现自动化的信息检索与多步骤推理。06150教育与学习教育者与研究人员# AI Agent# AI信息检索# AI商业分析
Airtop一款智能浏览器自动化平台,专为 AI 代理(AI Agents)设计,旨在通过自然语言指令实现对网页的自动化控制。05030API与SDK最近收录AI# AI Agents# AIl浏览器# AI客服
LemonAI一款创新型全栈通用 AI Agent,集成了自然语言处理、代码生成、网页浏览、API 调用、系统命令执行及应用操作等多种功能。04910最近收录AI模型管理与部署# AI Agent# AI代码开发# AI市场调研
SearchAgent-X由南开大学与伊利诺伊大学厄巴纳-香槟分校(UIUC)联合研发的高效推理框架,旨在提升基于大型语言模型(LLM)的搜索智能体在处理复杂任务时的效率和响应速度。05610教育与学习最近收录AI# AI客服# AI推理框架# 搜索引擎优化
MagicTryOn一款视频虚拟试衣(Video Virtual Try-On, VVT)系统,能够将目标服装自然地融合到人物视频中,保持服装的细节和动态一致性。05940最近收录AI计算机视觉# AI虚拟试衣# 视频虚拟试衣系统
Paper2Poster由牛津大学等研究团队于 2025 年 5 月发布的开源 AI 工具,旨在自动将学术论文转化为高质量的海报(poster)。06640开源工具与社区教育与学习# AI论文解析# A论文海报# 多智能体系统