Qwen3-Max-ThinkingQwen3-Max-Thinking 是阿里巴巴推出的旗舰深度推理 AI 模型,用于复杂逻辑推理、数学与编码任务,并支持大上下文输入(约 262K 令牌),提供可调 reasoning depth(思考预算)机制以平衡推理质量与延迟。020大模型最近收录AI# Alibaba AI# Qwen3-Max# 复杂推理
Kimi K2.5Kimi K2.5 是 Moonshot AI 发布的开源原生多模态智能体模型,支持文本、图像、视频和 PDF 等输入类型,具备视觉编程、Agent Swarm 并行任务执行、长上下文推理等能力,适用于复杂任务工作流、视觉代码生成、知识性推理和办公自动化等应用。020大模型最近收录AI# Agent Swarm# 多模态模型# 并行任务执行
Vidu Q2参考生ProVidu Q2参考生Pro 是 Vidu 平台推出的参考生视频生成模型,支持多模态输入(视频与图片),用于生成高一致性、精细化的视频内容,涵盖人物、场景、动作与特效等创作需求。020大模型最近收录AI# AI视频编辑# Vidu Q2参考生Pro# 人物表情迁移
DeepSeek-OCR 2DeepSeek-OCR 2 是 DeepSeek AI 发布的端到端 OCR(光学字符识别)视觉语言模型,基于 Visual Causal Flow 机制处理图像与文档输入,生成结构化文本输出(如 Markdown/JSON),用于复杂文档的逻辑顺序转录与布局感知识别。020大模型最近收录AI# Markdown 输出# OCR 模型# 复杂布局识别
LightOnOCR-2-1BLightOnOCR-2-1B 是一种开源的 1B 参数端到端 OCR(光学字符识别)模型,用于将文档图像(如 PDF、扫描件或照片)转化为清晰、自然排序的文本。模型在标准基准上提供高质量识别,并支持多种输入格式与布局类型。090大模型最近收录AI# 图像检测# 多语言支持# 布局解析
VibeVoice-ASRVibeVoice-ASR 是微软开源的一体化自动语音识别(ASR)模型,支持单次处理最长约 60 分钟连续音频,并输出包含说话者标识、时间戳与转录文本的结构化结果,适用于会议、讲座、播客等长音频语音识别场景。080最近收录AI语音识别与生成# 时间戳# 热词识别# 结构化转录
AgentationAgentation 是一个开源前端开发辅助工具,通过可视化标注网页元素并生成结构化 Markdown 反馈,使 AI 编程助手(如 Claude Code、Cursor)能够准确定位代码中的对应组件或元素位置。090最近收录AI编程工具# AI 编程助手兼容# AI编程助手# Markdown 输出
ClawdbotClawdbot 是开源的自托管 AI 助手与智能代理系统,可在本地运行并与 WhatsApp、Telegram、Discord、Signal、iMessage 等通信平台集成,支持消息响应、自动化任务执行、持久上下文记忆与扩展技能安装。0100AI常用工具最近收录AI# 持久 context 记忆# 插件技能系统# 本地 AI 助手
Prompt ManagerPrompt Manager(PromptX)是一个开源提示词管理与版本控制工具,支持提示词的创建、分类、全局搜索及版本历史对比。PromptX 提供个人提示词库、公共模板库及社区评分机制,用于增强提示词的组织与复用能力。0140开源工具与社区最近收录AI# Docker 部署# 全局搜索# 公共模板库
DokieDokie 是一款基于人工智能的演示文稿生成与编辑工具,支持从文本大纲、文档或链接自动创建结构化幻灯片,并提供内容调整与导出功能,适用于商业和教育场景的演示开发。0160最近收录AI# AI PPT制作工具# AI 语义理解# 内容结构化
FrogBossFrogBoss 是由微软研究院研究团队利用复杂合成 bug 生成方法(BugPilot)训练出的开源编程智能体模型,专用于软件工程任务评估与调试技能提升,在 SWE-Bench-Verified 等基准测试中达到领先表现。0210大模型最近收录AI# SWE-Bench-Verified 基准# 合成 bug 训练# 复杂 bug 生成
星火教师助手星火教师助手 是科大讯飞基于星火认知大模型打造的 AI 教育辅助工具,支持教学设计、课件与素材生成、资源检索、搜题组卷、课堂分析等功能,用于提高教师备课效率与教学质量。0220教育与学习教育者与研究人员# AI 对话# AI教育工具# 搜题组卷
AgentCPM-ExploreAgentCPM-Explore 是清华大学、人民大学、面壁智能与 OpenBMB 开源社区联合发布的 4B 参数端侧智能体模型,在多项长程智能体基准测试中取得领先表现,支持超 100 轮持续环境交互,并提供配套的开源训练与评测基础设施。0330大模型开源工具与社区# 强化学习框架# 智能体模型# 端侧部署
TranslateGemmaTranslateGemma 是 Google 推出的开放式多语言机器翻译模型系列,基于 Gemma 3 架构构建,支持 55 种语言的文本与图像内文字翻译,提供多种参数规模以适应不同部署场景。0340大模型开源工具与社区# Gemma 3# 图像内文字翻译# 多语言翻译
FLUX.2 [klein]FLUX.2 [klein] 是 Black Forest Labs 发布的紧凑型实时图像生成与编辑 AI 模型家族,支持子秒级图像生成、统一的生成与编辑流程、文本到图像、多参考图像编辑等功能,适用于研究、开发和交互式视觉智能应用。0360大模型开源工具与社区# 低延迟推理# 多参考图像支持# 实时图像生成
MedGemma 1.5MedGemma 1.5 是基于 Gemma 系列的多模态医疗 AI 模型变体,支持医学文本理解、医学影像分析与生成,用于加速医疗 AI 应用的开发与验证。0380医疗与健康大模型# 临床提示响应# 医学图像理解# 医学文本分析
WorkusWorkus 是一个基于 AI 智能代理的 B2B 商业网络平台,用于自动识别高意向买家、优化客户开发流程、实现多渠道智能沟通与高价值商机交付。0300企业用户最近收录AI# AI 智能代理# 动态优化反馈# 商机交付
OctoCodingBenchOctoCodingBench 是一个针对编码智能体评估的数据集,包含多源指令任务、系统提示与评估检查项,用于测量智能体在多样编码任务中的规则遵从性与执行能力。0260最近收录AI自主智能系统# Docker 任务环境# 指令遵从评估# 智能体评估
PixVerse R1PixVerse R1 是一种实时世界模型 AI 系统,基于原生多模态基础模型与自回归流式生成机制,实现连续、低延迟的 1080P 视觉流生成,适用于互动媒体、模拟与实时视频生成等场景。0260最近收录AI# 世界模型# 即时响应引擎# 多模态融合
司农司农(Sinong)是南京农业大学开源的农业领域垂直大语言模型,用于理解与生成农业相关知识,支持农业问答、检索增强与上下文推理等功能,面向 AI 工具使用者提供农业智能分析能力。0720农业科技大模型# 上下文推理# 农业决策支持# 农业大模型
女娲智能体OS女娲智能体OS 是一个通用智能体操作系统平台,支持零代码 AI 智能体创建、工作流编排、RAG 知识库与多端发布,旨在为 AI 工具使用者提供开发、部署与管理智能体的能力。0440企业用户最近收录AI# RAG 知识库# 工作流自动化# 通用智能体
Tago AI-生成带货视频一句话,一张图,生成爆款带货/引流视频!Tago是一款为电商卖家与内容创作者打造的AI视频生成工具。它能将您的产品描述或图片,快速转化为质感媲美实拍、专业且吸引人的带货视频。我们致力于以极低的成本(低于0.3元/条),大幅降低高质量视频的制作门槛,让创意和卖货变得更简单高效。0450AI常用工具最近收录AI# AI带货视频# AI视频# AI视频生成
Evai 建筑大师Evai 建筑大师(OpenEvai)是一个面向建筑师、室内设计师和相关专业用户的云端 AI 设计创作平台,提供 AI 极速渲染、智能三维重构、建筑动态视频生成与自然语言交互设计修改等功能,可将手绘草图、2D 平面图等输入转化为高质量的建筑设计成果。0560AI商业最近收录AI# AI极速渲染# AI生成设计# 云端 AI 建筑设计创作平台
VoiceSculptorVoiceSculptor 是一个由 ASLP-lab 开源发布的指令驱动语音合成(Instruct TTS)系统,基于 LLaSA 与 CosyVoice2 支持自然语言描述控制音色、语速、音调、情感等属性,并可用于声音设计与语音合成任务。0410开源工具与社区最近收录AI# AI语音克隆
黄小仙来也一个基于人工智能与东方命理融合的在线 AI 八字分析与命理服务平台,提供八字排盘、深度报告、正缘画像、AI 命理助理和每日宜忌等功能。0300最近收录AI自然语言处理(NLP)# AI 命理分析平台
UI-TARS DesktopUI-TARS Desktop 是由字节跳动开源的桌面端 GUI Agent 工具,基于 UI-TARS 视觉语言模型(VLM),可通过自然语言控制计算机界面,实现图形界面识别与操作。0360大模型开源工具与社区# 桌面 GUI Agent# 视觉语言模型(VLM)
Design ArenaDesign Arena 是一个全球性 AI 设计评测平台,通过匿名头对头对决与 Elo 排名系统评估 AI 模型在设计任务中的表现。0320最近收录AI# AI 模型性能评估# AI 设计评测平台
n1n一个企业级 大模型 API 聚合与管理平台,通过统一的API Key 连接全球 400+ 顶尖 AI 大模型(包括 GPT、Claude、Gemini、DeepSeek、Qwen 等),简化调用流程、提高稳定性并降低成本。0870大模型 API最近收录AI# 大模型 API 接口聚合
Vidu AgentVidu 团队推出的 AI 视频创作智能体平台,通过“一键成片”技术与自动分镜编排,实现从视觉输入到成品输出的全流程视频生成,适用于广告、产品展示、短片与创意视频等多种场景。0430内容创作最近收录AI# AI分镜编辑# AI视频创作智能体平台# AI视频生成工具
01Agent面向内容创作者的一站式 AI 图文创作智能体平台,支持从智能选题、图文生成、视觉设计、智能排版到多平台发布的全流程自动化内容创作。0460内容创作最近收录AI# 01Agent# 01Editor# AI图文创作
Tencent-HY-MT1.5腾讯混元(Hunyuan)推出的开源 高质量机器翻译模型系列,支持 33 种语言互译和多种方言/民族语言,包括轻量级端侧部署能力与高性能翻译表现。0470大模型开源工具与社区# AI翻译模型# 多语言上下文理解
WitNote一款开源且 本地优先(local-first)AI 写作与笔记工具,支持Windows 和 macOS 平台,内置多种 AI 引擎并可在本地运行。0370内容创作最近收录AI# AI内容生成# AI推理# AI笔记助手
NitroGen一个全新的视觉-动作基础模型(Vision-Action Foundation Model),由 NVIDIA 等机构联合研发并开源,专注于通用游戏智能体的学习与控制。0530大模型最近收录AI# AI游戏开发# AI视觉编码器
Runable一个基于人工智能的 创意生成与数字任务自动化平台,支持通过自然语言提示创建幻灯片、网站、报告、播客、图像、文档和视频等各类内容,帮助用户显著提升内容创作与工作效率。0510最近收录AI自主智能系统# AI 幻灯片生成# AI创意生成# AI报告撰写
MovieFlowMovieFlow 是一款基于人工智能的 全自动视频创作与影片生成平台,它能够将用户的故事描述、剧本或简单提示转化为完整的高质量视频作品。0500最近收录AI计算机视觉# AI 视频创作平台
Qwen-Image-Layered由 Qwen 团队开发的 图像分层 AI 模型,可以将单张图像自动分解成多个可独立可编辑的 RGBA 图层,实现类似专业图像编辑软件的分层操作。0480大模型开源工具与社区# 图像分层模型
T5Gemma 2T5Gemma 2 是谷歌推出的下一代 编码器-解码器(Encoder-Decoder)AI 模型系列,基于 Gemma 3 家族架构,新增多模态输入与超长上下文处理能力。0540大模型最近收录AI# 解码器大型语言模型