TensorRT LLMTensorRT LLM 是 NVIDIA 提供的开源推理优化库,旨在提升大型语言模型(LLM)在 NVIDIA GPU 上执行推理的性能与效率。该库为开发者提供高级 Python API、模块化运行时、可定制推理内核与多种优化策略,用于单机或集群级推理部署。010开源工具与社区最近收录AI# NVIDIA GPU# NVIDIA 推理优化# TensorRT LLM
Prompt ManagerPrompt Manager(PromptX)是一个开源提示词管理与版本控制工具,支持提示词的创建、分类、全局搜索及版本历史对比。PromptX 提供个人提示词库、公共模板库及社区评分机制,用于增强提示词的组织与复用能力。0140开源工具与社区最近收录AI# Docker 部署# 全局搜索# 公共模板库
AgentCPM-ExploreAgentCPM-Explore 是清华大学、人民大学、面壁智能与 OpenBMB 开源社区联合发布的 4B 参数端侧智能体模型,在多项长程智能体基准测试中取得领先表现,支持超 100 轮持续环境交互,并提供配套的开源训练与评测基础设施。0330大模型开源工具与社区# 强化学习框架# 智能体模型# 端侧部署
TranslateGemmaTranslateGemma 是 Google 推出的开放式多语言机器翻译模型系列,基于 Gemma 3 架构构建,支持 55 种语言的文本与图像内文字翻译,提供多种参数规模以适应不同部署场景。0340大模型开源工具与社区# Gemma 3# 图像内文字翻译# 多语言翻译
FLUX.2 [klein]FLUX.2 [klein] 是 Black Forest Labs 发布的紧凑型实时图像生成与编辑 AI 模型家族,支持子秒级图像生成、统一的生成与编辑流程、文本到图像、多参考图像编辑等功能,适用于研究、开发和交互式视觉智能应用。0360大模型开源工具与社区# 低延迟推理# 多参考图像支持# 实时图像生成
司农司农(Sinong)是南京农业大学开源的农业领域垂直大语言模型,用于理解与生成农业相关知识,支持农业问答、检索增强与上下文推理等功能,面向 AI 工具使用者提供农业智能分析能力。0720农业科技大模型# 上下文推理# 农业决策支持# 农业大模型
VoiceSculptorVoiceSculptor 是一个由 ASLP-lab 开源发布的指令驱动语音合成(Instruct TTS)系统,基于 LLaSA 与 CosyVoice2 支持自然语言描述控制音色、语速、音调、情感等属性,并可用于声音设计与语音合成任务。0410开源工具与社区最近收录AI# AI语音克隆
UI-TARS DesktopUI-TARS Desktop 是由字节跳动开源的桌面端 GUI Agent 工具,基于 UI-TARS 视觉语言模型(VLM),可通过自然语言控制计算机界面,实现图形界面识别与操作。0360大模型开源工具与社区# 桌面 GUI Agent# 视觉语言模型(VLM)
Tencent-HY-MT1.5腾讯混元(Hunyuan)推出的开源 高质量机器翻译模型系列,支持 33 种语言互译和多种方言/民族语言,包括轻量级端侧部署能力与高性能翻译表现。0470大模型开源工具与社区# AI翻译模型# 多语言上下文理解
Qwen-Image-Layered由 Qwen 团队开发的 图像分层 AI 模型,可以将单张图像自动分解成多个可独立可编辑的 RGBA 图层,实现类似专业图像编辑软件的分层操作。0490大模型开源工具与社区# 图像分层模型
Molmo 2Allen Institute for AI (Ai2) 发布的开源 视频与多图像理解多模态模型,具备先进的空间–时间定位、视频跟踪与密集描述能力,适用于视频问答、对象计数、追踪与密集标注等复杂任务。0600开源工具与社区最近收录AI
MiMo-V2-Flash小米开源的高效混合专家(MoE)大语言模型,具备 3090亿参数、150亿激活参数、150 tokens/s 超高速推理、256K 超长上下文支持,在推理、代码生成与智能体任务上表现出色。0620大模型开源工具与社区
Claude-MemClaude-Mem 是一个专为 Claude Code 设计的开源持久记忆插件,通过自动捕获 AI 会话中的上下文、工具调用和观察,并将经 AI 压缩与结构化后的关键信息注入未来会话,实现跨会话记忆持续、语义搜索与自然语言历史检索等功能,大幅提升长期项目协作体验。0720开源工具与社区最近收录AI
Open ScreenOpenScreen 是一款免费、开源的屏幕录制与演示制作工具,作为 Screen Studio 的简洁替代方案,支持全屏及指定窗口录制、手动缩放效果、画面裁剪、注释添加及背景定制等功能,帮助创作者快速制作高质量教程、产品演示与教学视频。0620开源工具与社区最近收录AI# AI屏幕录制工具
PosterCopilotPosterCopilot 是由南京大学、LibLib.ai 与中国科学院自动化所联合推出的 AI 海报设计框架,通过布局推理、审美强化学习与分层可控编辑,为专业海报布局和设计流程提供自动化与迭代式编辑能力,适合设计师、营销人员与创意团队使用。0730开源工具与社区最近收录AI# AI海报设计# AI视觉艺术
GLM-TTSGLM-TTS 是一款由 Zhipu AI 开源的工业级 文本转语音(TTS) 系统,支持零样本音色克隆、情感表达控制与流式生成。它采用双阶段架构与多奖励强化学习,可实现高质量自然语音合成,适用于语音助手、有声读物、客服、教育等多种场景。01440内容创作开源工具与社区# AI有声读物# AI语音克隆# 文本转语音(TTS)
爱派 (AiPy)爱派 (AiPy) 是一款国内开源、支持本地部署的智能 Agent 工具,基于 “Python Use” 理念,让 AI 不仅能“思考”,还能够“动手”——自动生成并执行 Python 代码、操作本地文件与应用。本文面向 AI 工具使用者,深入解析爱派 (AiPy) 的功能、技术原理、使用流程、典型场景与常见问答,助你快速上手,开启“让 AI 做实事”的新纪元。01,8030内容创作开源工具与社区# Ai Python# Python
Vidi2Vidi2 是由 ByteDance 发布的 12 B 多模态视频理解与创作模型,支持长视频解析、精确时空定位 (Spatio-Temporal Grounding)、自动剪辑与脚本生成,是内容创作、短视频制作、影视剪辑与视频理解研究的新利器。0610大模型开源工具与社区# AI长视频处理
StepAudio R1StepAudio R1 是首个真正能对音频进行“Chain-of-Thought(CoT)推理 / 深度分析”的开源音频语言模型,支持对说话、音乐、环境音进行理解、推理与分析,适合开发者、研究者、内容创作者用于音频理解、分析、检索与多模态工具构建。0830开源工具与社区最近收录AI
Depth Anything 3Depth Anything 3 (DA3) 是 ByteDance-Seed 团队开源的下一代通用 3D 视觉重建模型,可从任意数量与任意视角的图像/视频输入中恢复空间一致的 3D 几何结构,包括深度图、相机位姿、三维点云与新视图合成,非常适合视觉创作者、3D 艺术师、研究者与开发者进行几何估计、3D 重建与视觉内容创作。01180内容创作大模型# AI 3D艺术
DeepSeek-Math-V2DeepSeek-Math-V2 是一个开源数学推理模型,通过“生成 + 自验证 (generate-and-verify)”机制,实现了 IMO 金牌水平的定理证明与数学竞赛能力,非常适合研究者、学生、开发者与数学爱好者用于复杂数学问题求解、证明辅助与教育 /学习。0810大模型开源工具与社区# AI数学模型
Z-ImageZ-Image 是阿里通义 (Tongyi MAI) 发布的高效 6 B 图像生成与编辑基础模型,支持高逼真度渲染、中英双语文本、低资源运行与快速推理,为创作者、设计师和开发者提供了兼顾质量与效率的开放图像生成方案。01010大模型开源工具与社区# AI图像生成模型# AI图像编辑模型# 文生图
Higgs Audio V2Higgs Audio V2 是 Boson AI 发布的开源音频大语言模型,基于 1000 万小时语音数据训练,支持多说话人对话、情感语音、多语言语音生成,适合 AI 工具使用者构建语音 Agent 和音频应用。03620大模型开源工具与社区# AI情感语音合成# AI语音克隆# 音频生成与理解基础模型
SuperDesignSuperDesign 是首款开源设计 Agent,内嵌 IDE 内,通过自然语言生成 UI Mockup、组件与线框布局,适合 AI 工具使用者快速构建设计原型。04550开源工具与社区最近收录AI# AI Agent# 自然语言生成 UI
MonkeyCodeMonkeyCode 是长亭科技开源的企业级智能编程助手,支持私有化部署、离线使用、自然语言编程与代码安全扫描,适合 AI 工具使用者在研发团队中提升效率与品质。03780企业用户开源工具与社区# AI代码补全# AI编程助手# 自然语言编程
KAT‑V1KAT‑V1 是 KwaiPilot 团队开源的 40B 大语言模型,具备“自动思考”机制,可动态切换链式思维与直接回答模式,显著降低推理浪费,适合 AI 工具使用者提升效率与响应速度。04690大模型开源工具与社区# AI编程工具# AI问答系统
OxyGentOxyGent 是京东开源的模块化多 Agent 协作框架,支持快速构建、部署与演化 AI 多智能体系统,适合 AI 工具使用者用于开发生产级 Agent 应用。03930开源工具与社区最近收录AI# 模块化多 Agent 协作框架
Qwen3‑CoderQwen3‑Coder 是阿里巴巴开源的最强 AI 编码模型,采用 480B MoE 架构,支持 256K–1M 长上下文、Agentic 自动编程,性能媲美 Claude Sonnet 和 GPT‑4,为 AI 工具使用者提供顶级本地部署代码助手。03190开源工具与社区最近收录AI# Agentic 编程能力# AI代码生成
JoyAgent‑JDGenieJoyAgent‑JDGenie 是京东开源的端到端多智能体系统,支持多子 Agent 协同处理查询任务,具有轻量化架构、可插拔组件和高准确率,适合 AI 工具使用者构建智能 Agent 应用。04400开源工具与社区最近收录AI# 通用多智能体框架
Seed‑XSeed‑X 是 ByteDance Seed 团队开源的 7B 多语言翻译 LLM,支持 28 种语言双向翻译,性能媲美 Gemini‑2.5、GPT‑4、DeepSeek‑R1,适合希望构建本地翻译系统的 AI 工具使用者。05000大模型开源工具与社区# 多语言翻译模型
OpenBBOpenBB 是一个开源、可扩展的金融数据与投资研究平台,提供 CLI、Python SDK、Web API 和 Workspace,可接入多源数据并支持 AI 助手,适合 AI 工具使用者与金融分析师使用。04660API与SDK开源工具与社区# AI金融分析助手# AI金融研究工具
雾象Fogsight雾象Fogsight 是由 WaytoAGI 社区开源的 LLM 驱动动画引擎,通过“语言用户界面”(LUI)将抽象概念转换为生动动画,适合 AI 工具使用者用于教学、演示与创意生成。04650开源工具与社区最近收录AI# 动画引擎Agent
Goedel‑Prover‑V2Goedel‑Prover‑V2 是一款开源自动化定理证明模型系列,通过专家迭代、自我修正与模型平均三项创新,实现 8B 和 32B 版本在自动形式化证明任务中的全新 SOTA,适合 AI 工具使用者用于数学推理和 Agent 集成。02290大模型开源工具与社区# 定理证明模型
VoxtralVoxtral 是由 Mistral 推出的首款开源语音理解模型系列,支持高精度转录、语音问答、多语言识别与函数调用,提供 24B 和 3B 两种参数规模,适合 AI 工具使用者本地部署或云端集成。03260大模型开源工具与社区# AI摘要生成# AI语音转录# AI语音问答
EXAONE 4.0EXAONE 4.0 是 LG AI Research 发布的混合智能大模型,集通用理解与多步推理于一体,提供 32B 高性能与 1.2B 本地部署版本,支持工具调用与多语言,是 AI 工具使用者进行开发集成的核心资源。02800大模型开源工具与社区# 多语言支持# 混合模型
RoboOS 2.0RoboOS 2.0 是北京智源研究院推出的开源多智能体机器人操作系统,支持跨形体协作、集成 RoboBrain 认知大脑、技能库和共享内存,为 AI 工具使用者提供部署机器人智能系统的完整解决方案。03850API与SDK开源工具与社区
RoboBrain2.0RoboBrain 2.0 是北京智源研究院推出的开源多模态机器人“大脑”,融合视觉、语言与交互推理,支持 7B/32B 模型,对各种实体任务进行空间、时间规划与闭环反馈,适合 AI 工具使用者快速集成机器人认知能力。02830大模型开源工具与社区# 机器人视觉-语言大模型
PromptForgePromptForge 是一个开源 AI 提示工程工作台,支持多模型对比测试、系统化评估和版本控制,帮助 AI 工具使用者更高效地设计、调试和优化 prompts。03060开源工具与社区最近收录AI# 开源提示工程工作台
Kimi K2Kimi K2 是 Moonshot AI 发布的开源 trillion‐parameter 混合专家大语言模型,支持代码生成、长上下文处理、多 Agent 工具调用,被评为 SOTA 开源模型,适合 AI 工具使用者部署与集成。03790大模型开源工具与社区# AI Agent# AI代码生成# AI数学推理
TradingAgents‑CNTradingAgents‑CN 是一个基于多智能体大语言模型的中文金融交易决策框架,支持中文界面、A 股港股数据、本地模型集成和 Docker 部署,适合 AI 工具使用者构建和测试智能交易系统。05420开源工具与社区最近收录AI# 多智能体金融交易框架
Skywork‑R1V 3.0Skywork‑R1V 3.0 是一款开源的多模态视觉‑语言推理模型,采用视觉 CoT、强化学习优化,在 MMMU、MathVista 等多项测试中实现开源最佳性能,适合 AI 工具使用者部署与实验。03930大模型开源工具与社区# AI Agent# 多模态模型# 视觉模型
MetaStone‑S1深入剖析开源反思型生成模型 MetaStone‑S1:其架构、Test‑Time Scaling、性能基准、实际部署与未来发展,面向 AI 工具使用者的全面指南。03570大模型开源工具与社区# AI代码生成# AI推理研究# 反思型生成模型
FurionFurion 是一个开源 .NET 应用开发框架,以“先知”命名,致力于简化 .NET 项目创建、API 构建、服务注入与结构设计,支持 .NET5–10+、双许可(Apache‑2.0/MIT)、低侵入、超轻依赖,帮助 AI 工具使用者快速搭建高性能后端服务。02880开源工具与社区最近收录AI# .NET框架