Kyutai TTSKyutai TTS 是 Kyutai 团队首个实时流式文本转语音模型,支持英语和法语,具备声线克隆、超低延迟(约220ms)、长音频稳定输出与字级时间戳,可部署本地化、适配 LLM,对 AI 工具使用者极具吸引力。03650大模型开源工具与社区# AI声线克隆# 实时流式文本转语音模型# 文本转语音
AlphaGenomeAlphaGenome 是 Google DeepMind 推出的革命性 AI 基因组模型,可处理高达一百万碱基对的 DNA 序列,在单碱基分辨率下预测上千种分子功能特征,并通过对比分析突变效应助力疾病与生物学研究,将“基因暗物质”转化为可解释信息。03650API与SDK大模型# AI基因组模型
Confucius3-MathConfucius3-Math 是由网易有道开源的 14B 参数数学专用大模型,通过强化学习优化,支持在消费级 GPU 上高性能推理,在高考、K‑12 等多项数学基准中排名领先,是教育 AI 工具开发者的首选模型。03650大模型开源工具与社区# 数学模型
SurveyForgeSurveyForge 是由 Alpha‑Innovator 推出的自动化学术综述生成框架,通过 outline heuristics 与 memory‑driven agent 实现高质量论文结构、引用准确、内容连贯,助力科研与 AI 工具用户高效写作。03640开源工具与社区教育者与研究人员# AI学术研究# AI文献综述# AI生成框架
Aurora微软研究院于 2025 年发布的地球系统基础模型(Foundation Model),旨在通过人工智能技术实现更快速、精准且高效的天气和环境预测。03640大模型数据分析与预测# AI天气预测
万象驭影万象驭影 是北京矩阵像素科技推出的多模态 AI 视频创作平台,整合多智能体与跨模态技术,支持批量剪辑、精细剪辑与一站式投放,面向企业营销与内容创作者优化视频产能与成本。03630最近收录AI计算机视觉# AI视频制作# AI视频剪辑# 多模态智能视频创作平台
FlowDirectorFlowDirector是一款无需训练的文本驱动视频编辑新框架,通过 ODE 流式演化实现高精度、时序一致的视频修改,具备局部可控与语义对齐优势,适合创作者和开发者快速文本编辑视频。03630开源工具与社区最近收录AI# AI短视频制作# AI视频编辑框架
嘎嘎降AI嘎嘎降AI(AIGCleaner)是一款专注于学术写作场景的 AI 降重工具,提供语义重构、AI 痕迹清除、学术术语保护等功能,帮助师生快速降低 AI 内容检测率与查重率,适合论文、报告、技术文档等多场景应用。03620最近收录AI自然语言处理(NLP)# ai论文降重# ai论文降重工具# ai论文降重技巧
OpusClip ThumbnailOpusClip 团队推出的全新 AI 缩略图生成工具,旨在帮助 YouTube 创作者快速制作高点击率的缩略图。03620教育与学习最近收录AI# AI内容创作工具# AI缩略图生成工具
3DTown普林斯顿大学、哥伦比亚大学和 Cyberever AI 联合推出的开源 AI 框架,旨在从单张俯视图图像生成逼真且连贯的三维城镇场景。03610教育与学习最近收录AI# AI游戏开发# AI虚拟现实# 三维内容生成
NativeMindNativeMind 是一款完全本地运行、开源隐私保护的浏览器 AI 插件,通过集成 Ollama 在浏览器端使用强大开源大模型,支持多模型切换、网页摘要、跨标签聊天、隐私搜索与文本润色,适合注重数据安全的 AI 工具使用者。03590大模型最近收录AI# AI写作辅助# AI文本润色# AI浏览器插件
Qwen VLo一文掌握 Qwen VLo——阿里巴巴发布的多模态生成与理解模型,从核心能力、使用路径到实战案例和常见问题,详解其如何帮助 AI 工具使用者提升图像生成与编辑效率。03590大模型最近收录AI# 多模态大语言模型# 文生图
Kimi‑ResearcherKimi‑Researcher 是 Moonshot AI 推出的一款开源研究助手,基于 Kimi‑VL、Kimi‑Dev 与 Kimi‑Audio 模型,提供多模态文献阅读、代码生成与科研自动化能力,助力 AI 工具使用者提升研发效率与学术创新力。03590开源工具与社区最近收录AI# AI代码修复# AI代码生成# AI研究助手
Huxe AIHuxe AI——一款全新的“个人音频伴侣应用”,由前Google NotebookLM团队打造,支持每日个性化音频简报与实时问答互动。03590教育与学习最近收录AI# AI英语听力练习# AI语音互动# 个人音频伴侣应用
XJoy AIXJoy AI是一款人工智能驱动的虚拟女友应用,旨在为用户提供个性化的情感陪伴和互动体验。通过先进的AI技术,用户可以与虚拟女友进行自然流畅的对话,分享日常生活、情感和兴趣爱好。03590最近收录AI计算机视觉# AI女友# AI情感伴侣# AI角色扮演生成器
Shoplauncher AIShoplauncher AI 是一款免费的 AI Shopify 商店自动生成工具,3 分钟内构建高转化电商店铺,含精选商品、优化页面和 AI 生成商标,无需编码或设计经验即可启动销售。03570免费AI工具最近收录AI# AI LOGO生成# AI Shopify 商店优化# AI Shopify 商店搭建
ThinkSoundThinkSound 是一款基于 Chain-of-Thought 推理的多模态音频生成与编辑框架,支持任意模态输入(视频、文本、音频),可交互地为视频生成高质 Foley 声音、定向对象声音细化和自然语言音频编辑,适合 AI 工具使用者打造智能多模态内容流程。03530最近收录AI语音识别与生成# AI音频生成框架# 多模态音频生成
SongGenerationSongGeneration 是腾讯AILab开发的开源歌曲生成模型,基于 LeVo 架构与音乐编码器,可从歌词、风格描述与参考音频中并行生成和谐的“人声+伴奏”歌曲,支持中文与英文,适合 AI 工具使用者快速落地音乐创作。03530大模型开源工具与社区# AI音乐生成# 多语言支持
ComputerX深入解析 ComputerX:一款面向 AI 工具使用者的桌面智能 Agent,能够理解意图并自动完成电脑操作,从自动化任务到网页浏览,提升工作效率。03520最近收录AI自主智能系统# AI助手桌面Agent
Gen CLI面向 AI 工具用户的深入指南,详解如何使用 GitHub 上的 “Gen CLI”(又名 Gemini CLI 或 Pradumnasaraf/gencli)高效管理代码、创建 AI 代理及图像处理,帮助你将 AI 融入日常开发流程。03510最近收录AI# AI代码理解# AI代码生成# AI图像分析
OiaWrite基于 AI 的写作助手 OiaWrite,为内容创作者提供语法优化、风格建议、智能改写等功能,是提高写作效率与质量的理想 AI写作工具。03510最近收录AI自然语言处理(NLP)# AI写作工具# AI改写# AI润色
MiniMax‑M1MiniMax‑M1 是全球首个开放参数混合注意力大模型,拥有 4.56 e11 参数、1 百万 token 上下文长度和高效强化学习训练机制,擅长数学、编程、长上下文理解和复杂推理任务。03500免费AI工具大模型# 大模型
DishGen一款由 AI 驱动的菜谱生成工具,用户只需输入手头的食材、饮食需求或菜谱创意,DishGen 即可在几秒钟内生成详细的菜谱,包括菜名、描述、所需食材及烹饪步骤。03500最近收录AI# AI菜谱生成工具# A饮食管理# 菜谱数据库
AppStructAppStruct 是一款 AI 驱动的全平台无代码开发平台,支持用户通过视觉化 + 自然语言生成跨 Web、移动、桌面与 Telegram 小程序,助力 AI 工具使用者快速打造 MVP 及商业级应用。03470最近收录AI编程工具# AI无代码平台# AI组件生成
Rosebud全面解析 Rosebud:一款面向 AI 工具使用者的互动日记与个人成长平台,涵盖其核心功能、使用方法、科学依据、实战案例与常见问答,帮你深入了解如何通过 Rosebud 实现情绪管理、习惯培养与自我提升。03470最近收录AI自然语言处理(NLP)# AI 互动日记# AI心理成长平台# AI聊天机器人
LONGLIVELONGLIVE 是由 NVlabs 推出的创新型 AI 技术项目,旨在通过先进的深度学习与生成算法,为长视频生成、内容复原与高质量视频处理提供强大支持。03440最近收录AI计算机视觉# 视频生成技术
MakeSongMakeSong 是一款AI歌曲生成器,支持将文本或歌词快速转化为专业级、可商用的 AI 歌曲,适合 AI 工具使用者进行视频背景音乐、社交媒体内容创作与音乐原型制作。03440最近收录AI语音识别与生成# AI歌曲生成工具# AI歌曲生成平台# 文本转歌曲
NxtscapeNxtscape(原 Nxtscape,现称BrowserOS)是一款基于 Chromium 构建的开源 AI 浏览器,支持本地 AI Agent 自动化浏览器操作、语义搜索、ChatGPT 书签辅助,并兼容所有 Chrome 扩展,适合AI工具使用者在隐私安全环境中提升效率。03440开源工具与社区最近收录AI# AI Agent# 开源智能浏览平台
Step‑Audio‑AQAAStep‑Audio‑AQAA 是 StepFun 出品的一款端到端大规模音频–语言模型,支持音频问答任务,从原始音频直接生成自然语音回答,具备情感、语速、方言控制,高保真响应,非常适合 AI 工具使用者构建交互式音频智能系统。03420大模型最近收录AI# AI音色控制# 双重编码器# 端到端处理
Vibemotion深入解读 Vibemotion:第一个以单一句提示生成专业级动态图形视频的 AI 工具,适合 AI 创作者、内容营销与教育者,涵盖功能特性、使用流程、最佳实践与常见问答,助你快速掌握该平台的魔力。03420最近收录AI计算机视觉# AI视频生成工具
SendShortSendShort 是一款面向 AI 工具使用者的短视频自动化生成平台,通过一键剪辑、配字幕、配音、音轨、B-roll 和多语言翻译,助力内容创作者高效制作并发布视频短片。03400最近收录AI计算机视觉# AI短视频内容创作# AI配音生成# 多语言翻译
混元‑A13B混元‑A13B 是腾讯混元团队开源的首个 13B 激活参数 MoE 混合推理模型,提供高效推理、超长上下文(256K tokens)、Agent 工具调用能力和推理模式切换。本文全面解析其架构、性能、部署优化、应用场景和 FAQ,帮助 AI 用户快速理解与落地。03400大模型最近收录AI# 256K 超长上下文窗口# Agent 任务生态
RoboBrain2.0RoboBrain 2.0 是北京智源研究院推出的开源多模态机器人“大脑”,融合视觉、语言与交互推理,支持 7B/32B 模型,对各种实体任务进行空间、时间规划与闭环反馈,适合 AI 工具使用者快速集成机器人认知能力。03390大模型开源工具与社区# 机器人视觉-语言大模型
GLM‑4.1V‑ThinkingGLM‑4.1V‑Thinking 是清华大学与知谱 AI 联合开发的首个开放源多模态推理模型,融合 RLCS(课程采样强化学习)和 CoT(链式思维)训练,实现 10B 级参数在 STEM、长文理解、视频分析等28个任务上对标 72B 模型甚至 GPT‑4o,适合 AI 工具使用者构建高性能视觉推理系统。03390大模型最近收录AI# 源码视觉语言模型# 视觉编码器# 语言解码器