AI工具导航
AI工具导航站长导航教师导航服装业导航自媒体导航娱乐业导航
  • AI工具应用集
  • AI博客文章
  • 账号购买
    • 账号合租
  • AI投稿
  • AI排行榜
  • 提示词商城
      • 未登录
        登录后即可体验更多功能
    • AI工具应用集
    • AI博客文章
    • 账号购买
      • 账号合租
    • AI投稿
    • AI排行榜
    • 提示词商城
    未登录
    登录后即可体验更多功能

    开源工具与社区

    共 135 篇网址
    查找前沿的开源工具与社区资源,涵盖机器学习框架、模型部署平台、数据处理库、协作平台等核心技术。AI工具导航平台汇聚国内外优质的开源 AI 应用与开发者社区,助力开发者、研究人员和企业高效构建智能系统。无论是模型训练、算法研究,还是技术交流与项目协作,这里都能找到适合的开源工具与社区解决方案。
    AI商业AI常用工具AI教育AI服装设计AI热门产品AI生活助理SEO优化与推广SEO工具专业自媒体交互设计休闲娱乐兴趣爱好内容创作内容管理与维护写作助手创业者与企业创意设计前端开发办公提效动漫视频医疗健康后端开发国内新闻图文图片处理图片素材在线办公在线工具在线影视平台在线课程在线购物地区论坛地图导航域名/主机/CDN外语学习大模型娱乐游戏学习学习与教育学术交流学术资源学科领域工具建站/开源系统影视娱乐思维导图提示词教学资源教育技术数据数据分析数据库文学娱乐旅游攻略景点介绍智能对话服务器管理游戏娱乐界面设计社交娱乐社区论坛科技科技资讯绘画平台编程工具编程教程网络监测美食餐饮营销推广虚拟形象行业社区视频制作语言翻译财经财经新闻资源分享音乐播放平台音频合成社交媒体账号合租趣站知识科普大模型 APIAI工具下载应用场景功能类型开发工具平台与服务用户角色技术栈使用难易度支持与资源最近收录AI精选AI集成开发环境(IDE)免费AI工具
    云服务平台开源工具与社区商业产品与订阅服务
    排序
    发布更新浏览点赞
    GitDiagram

    GitDiagram

    一款由 Ahmed Khaleel 开发的开源工具,可以瞬间把任何 GitHub 仓库转化为交互式结构图,让你快速可视化整个项目架构与模块组织。
    01900
    API与SDK开源工具与社区# AI项目可视化# LLM 驱动结构解析# 组件组合架构
    Depth Anything 3

    Depth Anything 3

    Depth Anything 3 (DA3) 是 ByteDance-Seed 团队开源的下一代通用 3D 视觉重建模型,可从任意数量与任意视角的图像/视频输入中恢复空间一致的 3D 几何结构,包括深度图、相机位姿、三维点云与新视图合成,非常适合视觉创作者、3D 艺术师、研究者与开发者进行几何估计、3D 重建与视觉内容创作。
    01760
    内容创作大模型# AI 3D艺术
    Kairos 3.0

    Kairos 3.0

    大晓机器人推出的 开源世界模型,专为具身智能、机器人环境理解与动态预测设计。
    01630
    大模型开源工具与社区# 世界模型# 图像转视频# 文本转视频
    PosterCopilot

    PosterCopilot

    PosterCopilot 是由南京大学、LibLib.ai 与中国科学院自动化所联合推出的 AI 海报设计框架,通过布局推理、审美强化学习与分层可控编辑,为专业海报布局和设计流程提供自动化与迭代式编辑能力,适合设计师、营销人员与创意团队使用。
    01570
    开源工具与社区最近收录AI# AI海报设计# AI视觉艺术
    司农

    司农

    司农(Sinong)是南京农业大学开源的农业领域垂直大语言模型,用于理解与生成农业相关知识,支持农业问答、检索增强与上下文推理等功能,面向 AI 工具使用者提供农业智能分析能力。
    01560
    农业科技大模型# 上下文推理# 农业决策支持# 农业大模型
    Step-DeepResearch

    Step-DeepResearch

    一款由 StepFun 团队开源的 端到端深度研究智能体 AI 模型。
    01540
    大模型开源工具与社区# agent# 反思调整# 多轮信息检索
    TRELLIS.2

    TRELLIS.2

    微软发布的开源 图像到 3D 生成 AI 模型。
    01530
    大模型开源工具与社区# 3D生成模型
    LongCat-Video-Avatar

    LongCat-Video-Avatar

    美团 LongCat 团队开源的音频驱动长视频角色动画生成模型。
    01520
    大模型开源工具与社区# AI长视频生成# 视频扩展# 音频-文本-图像生成视频
    Z-Image

    Z-Image

    Z-Image 是阿里通义 (Tongyi MAI) 发布的高效 6 B 图像生成与编辑基础模型,支持高逼真度渲染、中英双语文本、低资源运行与快速推理,为创作者、设计师和开发者提供了兼顾质量与效率的开放图像生成方案。
    01490
    大模型开源工具与社区# AI图像生成模型# AI图像编辑模型# 文生图
    Qwen-Image-Layered

    Qwen-Image-Layered

    由 Qwen 团队开发的 图像分层 AI 模型,可以将单张图像自动分解成多个可独立可编辑的 RGBA 图层,实现类似专业图像编辑软件的分层操作。
    01390
    大模型开源工具与社区# 图像分层模型
    Tencent-HY-MT1.5

    Tencent-HY-MT1.5

    腾讯混元(Hunyuan)推出的开源 高质量机器翻译模型系列,支持 33 种语言互译和多种方言/民族语言,包括轻量级端侧部署能力与高性能翻译表现。
    01380
    大模型开源工具与社区# AI翻译模型# 多语言上下文理解
    Claude-Mem

    Claude-Mem

    Claude-Mem 是一个专为 Claude Code 设计的开源持久记忆插件,通过自动捕获 AI 会话中的上下文、工具调用和观察,并将经 AI 压缩与结构化后的关键信息注入未来会话,实现跨会话记忆持续、语义搜索与自然语言历史检索等功能,大幅提升长期项目协作体验。
    01370
    开源工具与社区最近收录AI
    VoiceSculptor

    VoiceSculptor

    VoiceSculptor 是一个由 ASLP-lab 开源发布的指令驱动语音合成(Instruct TTS)系统,基于 LLaSA 与 CosyVoice2 支持自然语言描述控制音色、语速、音调、情感等属性,并可用于声音设计与语音合成任务。
    01350
    开源工具与社区最近收录AI# AI语音克隆
    Open Screen

    Open Screen

    OpenScreen 是一款免费、开源的屏幕录制与演示制作工具,作为 Screen Studio 的简洁替代方案,支持全屏及指定窗口录制、手动缩放效果、画面裁剪、注释添加及背景定制等功能,帮助创作者快速制作高质量教程、产品演示与教学视频。
    01350
    开源工具与社区最近收录AI# AI屏幕录制工具
    StepAudio R1

    StepAudio R1

    StepAudio R1 是首个真正能对音频进行“Chain-of-Thought(CoT)推理 / 深度分析”的开源音频语言模型,支持对说话、音乐、环境音进行理解、推理与分析,适合开发者、研究者、内容创作者用于音频理解、分析、检索与多模态工具构建。
    01320
    开源工具与社区最近收录AI
    DeepSeek-Math-V2

    DeepSeek-Math-V2

    DeepSeek-Math-V2 是一个开源数学推理模型,通过“生成 + 自验证 (generate-and-verify)”机制,实现了 IMO 金牌水平的定理证明与数学竞赛能力,非常适合研究者、学生、开发者与数学爱好者用于复杂数学问题求解、证明辅助与教育 /学习。
    01310
    大模型开源工具与社区# AI数学模型
    GLM-4.7

    GLM-4.7

    Z.ai 推出的最新一代大型开源语言模型,专为复杂推理、编码任务和智能代理型场景设计。
    01300
    大模型开源工具与社区# AI编码助手
    FLUX.2 [klein]

    FLUX.2 [klein]

    FLUX.2 [klein] 是 Black Forest Labs 发布的紧凑型实时图像生成与编辑 AI 模型家族,支持子秒级图像生成、统一的生成与编辑流程、文本到图像、多参考图像编辑等功能,适用于研究、开发和交互式视觉智能应用。
    01230
    大模型开源工具与社区# 低延迟推理# 多参考图像支持# 实时图像生成
    MiMo-V2-Flash

    MiMo-V2-Flash

    小米开源的高效混合专家(MoE)大语言模型,具备 3090亿参数、150亿激活参数、150 tokens/s 超高速推理、256K 超长上下文支持,在推理、代码生成与智能体任务上表现出色。
    01230
    大模型开源工具与社区
    Molmo 2

    Molmo 2

    Allen Institute for AI (Ai2) 发布的开源 视频与多图像理解多模态模型,具备先进的空间–时间定位、视频跟踪与密集描述能力,适用于视频问答、对象计数、追踪与密集标注等复杂任务。
    01220
    开源工具与社区最近收录AI
    AgentCPM-Explore

    AgentCPM-Explore

    AgentCPM-Explore 是清华大学、人民大学、面壁智能与 OpenBMB 开源社区联合发布的 4B 参数端侧智能体模型,在多项长程智能体基准测试中取得领先表现,支持超 100 轮持续环境交互,并提供配套的开源训练与评测基础设施。
    01200
    大模型开源工具与社区# 强化学习框架# 智能体模型# 端侧部署
    Vidi2

    Vidi2

    Vidi2 是由 ByteDance 发布的 12 B 多模态视频理解与创作模型,支持长视频解析、精确时空定位 (Spatio-Temporal Grounding)、自动剪辑与脚本生成,是内容创作、短视频制作、影视剪辑与视频理解研究的新利器。
    01100
    大模型开源工具与社区# AI长视频处理
    TranslateGemma

    TranslateGemma

    TranslateGemma 是 Google 推出的开放式多语言机器翻译模型系列,基于 Gemma 3 架构构建,支持 55 种语言的文本与图像内文字翻译,提供多种参数规模以适应不同部署场景。
    01090
    大模型开源工具与社区# Gemma 3# 图像内文字翻译# 多语言翻译
    UI-TARS Desktop

    UI-TARS Desktop

    UI-TARS Desktop 是由字节跳动开源的桌面端 GUI Agent 工具,基于 UI-TARS 视觉语言模型(VLM),可通过自然语言控制计算机界面,实现图形界面识别与操作。
    01060
    大模型开源工具与社区# 桌面 GUI Agent# 视觉语言模型(VLM)
    MOVA

    MOVA

    MOVA(MOSS Video and Audio)是上海创智学院 OpenMOSS 团队与模思智能(MOSI)联合发布的开源端到端音视频生成基础模型。该模型采用异构双塔架构与双向交叉注意力机制,在单次推理中同步生成视频与音频输出,具备多语言唇形同步与环境音效生成等能力,支持最高 720p 和最长 8 秒的视听片段生成。
    0910
    大模型开源工具与社区# MOVA# 端到端多模态模型# 音视频同步生成
    TensorRT LLM

    TensorRT LLM

    TensorRT LLM 是 NVIDIA 提供的开源推理优化库,旨在提升大型语言模型(LLM)在 NVIDIA GPU 上执行推理的性能与效率。该库为开发者提供高级 Python API、模块化运行时、可定制推理内核与多种优化策略,用于单机或集群级推理部署。
    0870
    开源工具与社区最近收录AI# NVIDIA GPU# NVIDIA 推理优化# TensorRT LLM
    Prompt Manager

    Prompt Manager

    Prompt Manager(PromptX)是一个开源提示词管理与版本控制工具,支持提示词的创建、分类、全局搜索及版本历史对比。PromptX 提供个人提示词库、公共模板库及社区评分机制,用于增强提示词的组织与复用能力。
    0810
    开源工具与社区最近收录AI# Docker 部署# 全局搜索# 公共模板库
    Intern-S1-Pro

    Intern-S1-Pro

    Intern-S1-Pro 是上海 AI 实验室开源的万亿参数级科学多模态大模型,具备混合专家(MoE)架构与通专融合架构(SAGE),在 AI4Science 科学推理与多模态理解任务上展现领先能力,支持跨学科科学研究与科研流程自动化。
    0790
    大模型开源工具与社区# AI4Science 推理# MoE 混合专家# 科学多模态大模型
    GLM-5

    GLM-5

    GLM-5 是 Zhipu AI(Z.ai)发布的第五代大型语言模型,采用 Mixture-of-Experts 架构与 DeepSeek 稀疏注意力机制,支持高达 200K Token 的长上下文容量,具备先进的推理、编码、智能体任务及复杂逻辑处理能力,定位于开放源代码旗舰基础模型。
    0780
    大模型开源工具与社区# Moe架构# 大型语言模型# 智能体任务
    LingBot-VA

    LingBot-VA

    LingBot-VA 是蚂蚁灵波科技(Robbyant / Ant Group)发布的开源具身世界模型。该模型首次提出自回归视频-动作世界建模方法,实现视频动态未来预测与机器人动作序列推理的统一,在真实机器人与仿真环境中提升长时序与复杂操作任务的表现。
    0730
    大模型开源工具与社区# 机器人操作控制# 自回归推理# 视觉动作世界模型
    Voxtral Transcribe 2

    Voxtral Transcribe 2

    Voxtral Transcribe 2 是 Mistral AI 最新发布的第二代语音转写模型系列,包含用于批量转录的 Voxtral Mini Transcribe V2 和用于实时转写的 Voxtral Realtime。该系列支持 13 种语言、精准说话人分离、上下文偏向、词级时间戳和极低延迟的实时转录能力,并提供开源权重与企业部署选项。
    0700
    大模型开源工具与社区# 多语言支持# 实时转录# 语音转写
    Happy

    Happy

    Happy(Happy Coder)是开源的 AI 编程远程控制工具,用于从移动设备或网页控制本地运行的 Claude Code 或 Codex,支持实时同步、端到端加密、多会话与语音控制等功能。
    0650
    开源工具与社区最近收录AI# AI编程控制# 实时会话同步# 远程终端控制
    GLM-OCR

    GLM-OCR

    GLM-OCR 是智谱 AI(Zhipu AI)发布的开源轻量级多模态 OCR 模型,参数约 0.9B,基于 GLM-V 架构及 CogViT 视觉编码器,优化复杂文档解析、表格识别、公式识别与结构化输出。支持多种推理引擎部署与结构化结果输出。
    0640
    大模型开源工具与社区# OCR 模型# 多模态 OCR# 结构化输出
    ACE-Step 1.5

    ACE-Step 1.5

    ACE-Step 1.5 是一个开源 AI 音乐生成基础模型,采用混合架构支持快速生成整首音乐、歌词对齐、多语言支持及灵活编辑功能,输出结构化内容资产聚焦音乐生成能力、用例及用户指南。
    0600
    大模型开源工具与社区# ACE-Step 1.5# AI 音乐生成# 音乐生成基础模型
    Step 3.5 Flash

    Step 3.5 Flash

    Step 3.5 Flash 是 StepFun 发布的开源大语言模型,采用稀疏 Mixture-of-Experts (MoE) 架构以提升推理与逻辑任务效率,支持长上下文与高速度生成能力,适合用于编码、代理任务及复杂多步骤推理。模型提供本地部署与 API 接入选项,支持长达 256K 上下文处理能力。
    0570
    大模型开源工具与社区# Agent 基座模型# 上下长文# 大语言模型
    没有了
    AI大学堂
    AI工具导航
    XD导航,是一个导航分类平台,为广大用户推荐各行业优秀的网址,APP,软件等,更加迎合用户,精细化,职业化,专业化,让不同小众化用户能有更好的用户体验,同时XD导航也是一个浏览器主页,提供了不同主流搜索引擎入口,和官网首页链接入口导航,整理分类了各网址、APP/资源、书籍等,提升效能,一键必达,还有AI技术运用,资讯分享等,欢迎您使用。

    友链申请隐私政策广告合作关于我们免责声明

    扫码加QQ群AI工具导航
    扫码加QQ群
    Copyright © 2026 AI工具导航 滇ICP备2023005905号-3 
    反馈
    让我们一起共建文明社区!您的反馈至关重要!
    网址
    网址文章软件书籍
    热门AI工具搜索
    TraeAI大学堂星辰Agent问小白绘蛙讯飞文书有言AI