AI 工具雷达// NavXD.v2LIVE

CURRENTVIEWING

CHAI 大模型 / 对话

VIEWS406

▸ AI 大模型 / 对话 · SITES

dots.llm1 SITES

小红书（RedNote）的 Humane Intelligence Lab（hi lab）开源发布的一款大型稀疏专家（MoE）语言模型。

可用性

入口可访问

已记录官网或下载入口

信息核实

已验证

3 条来源，含 NavXD 收录

类型

网页工具

Web · en

访问官网收藏 0

收录 2025年6月9日更新 2025年6月9日浏览 406

// 01 dots.llm1 是什么

dots.llm1是由中国社交平台小红书（RedNote）的 Humane Intelligence Lab（hi lab）开源发布的一款大型稀疏专家（MoE）语言模型。它总参数 142B，但每次推理仅激活 14B，有着媲美主流大模型的性能，且训练数据纯净、不依赖合成数据。

2. 怎么使用？

从 Hugging Face 下载：包括基础版（base）和指令调优版（inst），均支持 32K 长上下文。
Docker 部署：提供官方容器镜像，可通过 vLLM、sglang 等框架快速启用具 OpenAI 兼容 API 的推理服务。
本地 Python 调用：使用 transformers 加载模型并在 CPU/GPU 上执行文本生成或聊天任务。

3. 主要功能

🔹 高效 MoE 架构：每令牌仅激活 14B 专家参数，推理高效节能。
🔹 长上下文支持：最大可处理 32,768 token，适合长文档与上下文应用。
🔹 多语言能力：涵盖中英双语，兼容 base 与 inst 指令版，适应对话与生成任务。
🔹 中间断点公开：每训练 1T tokens 发布断点，助力研究者深入学习路径。

4. 技术原理

MoE 架构与稀疏激活：采用 128 个专家中的 top-6 专家动态激活，加上共享专家以优化效率。
InfLLM v2 稀疏路由机制：实现高效专家选择与大规模参数并行处理。
高质量预训练数据：11.2T 真实文本 token，无合成数据，保证语义质量。
分布式高效计算：结合 interleaved 1F1B 通信策略与 grouped GEMM 优化，支持多 GPU 加速训练。

5. 应用场景

通用问答与对话助手：适合构建本地部署的智能对话系统。
长文档生成与总结：凭借 32K 上下文能力，可进行报告撰写、剧情生成等。
代码生成与理解：指令版适应代码生成任务，能协助开发与自动化编程。
本地部署节省成本：MoE 稀疏激活特性支持在有限资源场景下高效运行。
研究与教学资源：中间 checkpoint 可作为研究工具，深入分析学习过程。

6. 项目地址

GitHub 仓库：rednote-hilab/dots.llm1（MIT 协议），包括源码、Docker 和部分示例。
Hugging Face 模型库：提供 dots.llm1.base 和 dots.llm1.inst 两个版本，以及可试用 demo。
ArXiv 技术报告：详细阐述模型架构与训练策略。
媒体报道：SCMP 文章确认其性能与架构创新。
YouTube 分析视频：多个评测视频展示实际性能表现。

// 04 常见问题

dots.llm1 是什么？

小红书（RedNote）的 Humane Intelligence Lab（hi lab）开源发布的一款大型稀疏专家（MoE）语言模型。

dots.llm1 适合哪些场景？

可优先参考它所属的 AI 大模型 / 对话分类，以及 AI代码生成、AI问答助手、长上下文支持等标签。

dots.llm1 是否提供可用入口？

本页已记录官网或下载入口，可通过顶部主按钮访问。

dots.llm1 支持哪些平台？

当前记录为网页工具，通常可通过浏览器访问。

// 05 资料来源

NavXD 收...https://navxd.com/navigation/sites/5514.html 官网或下载入口https://github.com/rednote-hilab/dots.llm1 分类与标签体系AI 大模型 / 对话、AI代码生成、AI问答助手、长上下文支持

Claude Opus 4.6

Kimi‑Researcher

◇ ◇ ◇

"关系待挖掘"
暂无搭档工具数据

▸ 我来推荐

dots.llm1 工具资料卡

NavXD2025年6月9日

Claude Opus 4.6

Claude Opus 4.6 是 Anthropic 于 2026 年 2 月发布的下一代 Claude 系列 AI 模型变体，旨在增强编程任务、智能体执行、多步骤推理...

AI 大模型 / 对话AI 工具

Qwen3‑Coder 是阿里巴巴开源的最强 AI 编码模型，采用 480B MoE 架构，支持 256K–1M 长上下文、Agentic 自动编程，性能媲美 Claud...

AI 编程AI 工具

Kimi K2 是 Moonshot AI 发布的开源 trillion‐parameter 混合专家大语言模型，支持代码生成、长上下文处理、多 Agent 工具调用，被...

AI 大模型 / 对话AI 工具

深入剖析开源反思型生成模型 MetaStone‑S1：其架构、Test‑Time Scaling、性能基准、实际部署与未来发展，面向 AI 工具使用者的全面指南。

AI 大模型 / 对话AI 工具

AI大学堂

我的收藏夹 →