Higgs Audio V2Higgs Audio V2 是 Boson AI 发布的开源音频大语言模型,基于 1000 万小时语音数据训练,支持多说话人对话、情感语音、多语言语音生成,适合 AI 工具使用者构建语音 Agent 和音频应用。04040大模型开源工具与社区# AI情感语音合成# AI语音克隆# 音频生成与理解基础模型
Kwai Keye‑VLKwai Keye‑VL 是快手推出的 8 B 参数多模态大语言模型,聚焦动态短视频理解与视觉推理,支持图文与视频输入。本文深入分析其架构、性能、使用指南与 FAQ,助 AI 用户快速掌握。04040大模型最近收录AI# AI视频内容摘要# AI视频问答# 多模态大型模型
Morphik一款开源的多模态检索增强生成(RAG)工具,专为处理复杂、视觉内容丰富的非结构化数据而设计。04040API与SDK最近收录AI# AI知识图谱构建# 多模态搜索# 多模态检索增强生成(RAG)工具
MultiAgentPPTMultiAgentPPT 是一款开源工具,通过多 AI Agent 协同自动生成 PPT 结构、内容及视觉设计,支持自定义模板与 Azure OpenAI 集成,适合内容创作者、业务人员快速制作专业演示文稿。04030最近收录AI计算机视觉# AI PPT生成工具# 多Agent协同PPT 生成工具
TwocastTwocast 是一款 AI 驱动的双人播客生成平台,支持从文章、网址或文档快速生成 3–9 分钟的 AI 对话播客,拥有多语言、多音色支持及下载功能,是内容创作者、教育者与营销人员的高效音频工具。04030教育与学习最近收录AI# AI Podcast Generator# AI内容创作# AI双人播客
Chrome MCP ServerChrome MCP Server 是基于 Chrome 扩展与 MCP‑Bridge 的本地 MCP(Model Context Protocol)服务器,允许 AI 工具(如 Claude、ChatGPT 插件、Cursor)直接控制日常 Chrome 浏览器,支持浏览器自动化、内容分析与语义搜索,为 AI 工具使用者提供隐私安全、跨标签页联动以及实用工具集成能力。04020最近收录AI自主智能系统# Chrome 扩展# MCP服务器
AI Image Fusion ToolImageFusionAI 推出的在线图像融合与增强工具,将多张图片智能合成为一张高质量的创意图像。04020最近收录AI计算机视觉# AI图像增强# AI图像融合# AI艺术生成工具
批改邦全面解析批改邦:国产 AI 作业批改和教研智能协作平台,帮教师高效批改作文与默写,提供教案和教研指导,结合 AI+人工协同提高教学效率。04010AI教育教育与学习# AI作文批改# 教师AI批改助手# 教研协作平台
Semantic Scholar由 Allen Institute for AI 开发的免费、开放访问的学术搜索引擎,旨在通过人工智能技术加速科学发现。04010教育者与研究人员最近收录AI# AI学术搜索引擎# AI智能摘要
CodebuffCodeBuff 是一款终端优先的 AI 编码助手,结合 Claude、Gemini、GPT-4o Mini 等多种模型,可读取全项目上下文、执行多文件编辑、运行命令并长期积累项目知识,为开发者提升效率,适用于大型代码库和团队协作。04000最近收录AI编程工具# AI编程助手# 上下文理解
MirrorMeMirrorMe 是阿里巴巴团队推出的实时高保真音频驱动半身动画扩散模型,结合 LTX 视频基础架构与音频适配器,实现 lip-sync、表情与手势同步生成,适合 AI 工具使用者打造交互式数字人影像。03990最近收录AI计算机视觉# AI内容创作工具# AI虚拟直播# 多语言虚拟助理
WonderPlay斯坦福大学与犹他大学联合推出的创新型框架,旨在从单张图片和用户定义的动作生成动态的三维(3D)场景。03990最近收录AI计算机视觉# AI 3D场景生成# AI动态广告内容# AI影视特效制作
Vid2World将预训练的视频扩散模型(Video Diffusion Models)转化为可交互的世界模型(Interactive World Models)。03990最近收录AI计算机视觉# AI游戏模拟# AI视频生成# 世界模型
千音漫语探索“千音漫语”智能声音创作平台:从配音、翻译、声音克隆到语音识别,揭开其架构与应用秘密,助力 AI 用户构建高效多语种音视频创作流程。03960最近收录AI语音识别与生成# AI声音克隆# AI声音创作平台# AI有声书制作
AutocoderAutocoder 是一款通过对话生成完整前端、后端和数据库结构的 AI 编码平台,支持用户以自然语言定义需求,“vibe coding” 一键生成并部署 Web 应用,适合 AI 工具使用者和开发者快速落地项目。03960最近收录AI编程工具# AI代码生成工具# 全栈 VibeCode
MoonBitMoonBit 是一款专为 AI 原生构建的通用编程语言与开发平台,支持 WebAssembly、JS、Native 多后端,具备内置 AI 助手、云 IDE 与高性能工具链,帮助开发者快速构建高质量系统。03950开源工具与社区最近收录AI# AI原生语言设计# AI辅助开发
Miniflow可视化编辑器将多种 AI 工具和模型连接成完整的自动化流程,无需编写任何代码即可实现复杂的 AI 应用和任务自动化。03950开发工具最近收录AI# AI工作流编辑器# AI工具集成# AI开发者工具
Decopy AIDecopy AI 是一款免费一体化写作工具,涵盖 AI 内容检测、人性化润色、文档/视频摘要、数学题求解等功能,适合 AI 工具使用者提升内容质量与创作效率。03940教育与学习最近收录AI# AI人性化润色# AI内容检测# AI学术写作
Gemini Fullstack LangGraph QuickstartGoogle 开源的全栈 AI 智能体示例项目,结合了 Gemini 2.5 大模型与 LangGraph 框架,旨在构建具备深度搜索与智能研究能力的对话式 AI 系统。03940最近收录AI框架与库# 全栈 AI 智能体示例项目
AgentforceAgentforce 的核心在于其深度集成于 Salesforce 平台,利用 Data Cloud 统一客户数据,并通过 Atlas 推理引擎模拟人类思维和规划能力。03940最近收录AI自主智能系统# Agent Builder# AI Agent# AI CRM
飞搜侠飞搜侠是一个在线飞书文档搜索工具,提供快速关键词搜索、图片文字反向检索和过滤功能,旨在让 AI 工具使用者高效访问飞书公开文档资源。03930最近收录AI# 搜飞书文档# 飞书如何搜索别人的文档# 飞书怎么搜索别人的文档
OAgents深入解读 OAgents:一款来自领先学术团队的开源基础 Agent 框架,结合模块化组件设计与标准评测体系,助力 AI 工具使用者快速构建高效、多模态、大规模可扩展 Agent 系统。03930开源工具与社区最近收录AI# 多 Agent 协作# 构建评价 protocol