OpenAudioFish Audio 推出的新一代文本转语音(TTS)模型,旨在生成高度自然、富有情感的语音输出。02270大模型娱乐媒体# AI播客能容创作# AI有声书内容创作# AI游戏角色语音
OmniAudio阿里巴巴通义实验室开发的空间音频生成模型,能够直接从 360° 视频生成空间音频,为虚拟现实和沉浸式娱乐带来了全新的可能性。02560大模型娱乐媒体# AI增强现实# AI虚拟现实# AI音频内容创作
AiMakeSong一款基于人工智能的在线音乐生成平台,旨在帮助用户通过简单的文本输入或歌词创作,快速生成高质量的原创歌曲。02630娱乐媒体最近收录AI# AI在线音乐生成平台# AI歌词生成工具# 文本转歌曲
PlayDiffusionPlay AI 公司推出的开源音频编辑模型,基于先进的扩散模型(diffusion model)构建,专注于提供高效的音频精细编辑与修复功能。03150大模型开源工具与社区# AI配音# AI音频编辑模型# 播客制作
DeepSider一款集成于浏览器侧边栏的免费 AI 助手插件,支持在 Google Chrome 和 Microsoft Edge 浏览器中使用。它整合了多款顶级大模型,包括 GPT-4o、Claude 3.7、Gemini 2.0、Grok 3 以及 DeepSeek R1/V3 等。08770最近收录AI编程工具# AI代码生成# AI内容创作# AI助手插件
TrackVLA银河通用于 2025 年 6 月发布的全球首个产品级端到端具身导航大模型(FSD)。该模型具备纯视觉环境感知、语言指令驱动、自主推理和零样本泛化能力,能实现从视觉感知到动作输出的全链路闭环。04090医疗与健康大模型# 大模型# 导航大模型
从容大模型从容大模型 是由云从科技(孵化自中科院自动化所)研发的国产通用多模态大语言模型(LLM),支持文本、图像、语音等多模态输入,具备强大的理解、生成与推理能力。02290大模型最近收录AI# 多模态大模型# 大模型
PPT.cn一款面向中文用户的 智能PPT文档生成与美化平台,融合了 AI 技术与专业设计能力,帮助用户从文案输入到整套幻灯片生成实现全流程自动化。02430教育与学习最近收录AI# AI PPT文档生成# AI PPT美化
HackFastHackFast 是一款面向伦理黑客和渗透测试团队的 AI 驱动安全工具,旨在通过自动化和智能分析,提升渗透测试的效率和准确性。02330教育与学习最近收录AI# AI安全工具# AI漏洞识别# 渗透测试工具
SuperMaker AI Video Generator一款基于人工智能的视频生成工具,允许用户通过输入文本、图片、脚本或提示词,快速生成风格多样、画质高清的视频内容。03100最近收录AI计算机视觉# AI数字人出境解说# AI视频剪辑# AI视频生成工具
Pi(Presentation Intelligence)一款结合人工智能技术的演示内容分析和优化平台,专注于提升演讲者的表达表现、幻灯片内容质量以及听众互动效果。04910最近收录AI计算机视觉# AI 视频演示生成工具# AI内容分析# AI分析演讲
Video Background Remover一款基于人工智能的视频背景移除工具,能够智能识别视频中的人物或主体,并自动去除背景,无需绿幕或专业设备。03690内容创作教育与学习# AI背景替换# AI视频背景移除工具
DGMDGM 是一种具备自我进化能力的 AI Agent 系统。它通过迭代修改自身代码,提升自身性能,广泛应用于自动编程、代码优化、自动修复等领域。DGM 的核心理念是通过开放式探索和自我改进,实现 AI 系统的持续进化。03720教育与学习最近收录AI# AI Agent# AI代码优化# AI编程
SignGemmaGoogle DeepMind 于 2025 年 5 月推出的一款先进的 AI 手语翻译模型,旨在打破听障人士在沟通中的障碍。03370医疗与健康大模型# 多模态AI模型# 手语翻译模型
Fairies AIFairies 是一款革命性的通用 AI 代理工具,能够显著提升个人和团队的工作效率。它通过先进的自然语言处理技术和强大的多任务执行能力,帮助用户完成各种复杂工作。03660办公提效教育与学习# AI Agent# AI对话交互# 多任务处理
OmniSync一个基于扩散变换器(Diffusion Transformers)的无掩码视频编辑框架,专注于唇部动作与音频的精准同步。06010最近收录AI框架与库# AI内容生成# AI影视配音# AI游戏开发
Mobvoi MCP Server出门问问(Mobvoi)于 2025 年 5 月 29 日正式发布的一款多模态 AI 服务平台。04740开源工具与社区最近收录AI# AI声音克隆# AI数字人# AI视频翻译
EVI 3一款基于共情大语言模型(eLLM)技术的语音语言模型,能够同时处理文本和语音输入,生成自然、富有表现力的语音响应。04200医疗与健康大模型# AI 语音交互体验# 共情大语言模型(eLLM)# 语音语言模型
灵码 IDE灵码 IDE 是阿里云发布的首个 AI 原生开发环境工具,深度适配了最新的千问3大模型,全面集成通义灵码插件能力,具备编程智能体、行间建议预测、行间会话等功能。04910企业用户初学者# AI代码补全# AI编码助手# AI编程
WebAgent阿里巴巴于 2025 年开源的自主搜索 AI 智能体,旨在通过模拟人类在网络上的行为,实现自动化的信息检索与多步骤推理。05310教育与学习教育者与研究人员# AI Agent# AI信息检索# AI商业分析
Airtop一款智能浏览器自动化平台,专为 AI 代理(AI Agents)设计,旨在通过自然语言指令实现对网页的自动化控制。04360API与SDK最近收录AI# AI Agents# AIl浏览器# AI客服
LemonAI一款创新型全栈通用 AI Agent,集成了自然语言处理、代码生成、网页浏览、API 调用、系统命令执行及应用操作等多种功能。04120最近收录AI模型管理与部署# AI Agent# AI代码开发# AI市场调研
SearchAgent-X由南开大学与伊利诺伊大学厄巴纳-香槟分校(UIUC)联合研发的高效推理框架,旨在提升基于大型语言模型(LLM)的搜索智能体在处理复杂任务时的效率和响应速度。04860教育与学习最近收录AI# AI客服# AI推理框架# 搜索引擎优化
MagicTryOn一款视频虚拟试衣(Video Virtual Try-On, VVT)系统,能够将目标服装自然地融合到人物视频中,保持服装的细节和动态一致性。05160最近收录AI计算机视觉# AI虚拟试衣# 视频虚拟试衣系统
Paper2Poster由牛津大学等研究团队于 2025 年 5 月发布的开源 AI 工具,旨在自动将学术论文转化为高质量的海报(poster)。05770开源工具与社区教育与学习# AI论文解析# A论文海报# 多智能体系统
OmniConsistency一个基于 Diffusion Transformer 的图像一致性插件,主要用于图像到图像(Image-to-Image)风格迁移任务。05540教育与学习最近收录AI# AI吉卜力风格# AI艺术生成工具# 图像转图像