MiniCPM 4.0 如何收费？

MiniCPM 4.0 的定价模式为：unknown。

MiniCPM 4.0 是否支持 MCP？

是的，MiniCPM 4.0 支持 MCP (Model Context Protocol)。

在 NavXD 上如何查找类似工具？

可以通过本页的分类、标签和相关推荐继续浏览同类 AI 工具，也可以返回 AI 工具导航首页按场景筛选更多替代方案。

AI 工具雷达// NavXD.v2LIVE

CURRENTVIEWING

CHAI 大模型 / 对话

▸ AI 大模型 / 对话 · SITES

MiniCPM 4.0 SITES

MiniCPM 4.0 是一款以“轻量却强劲、速度远超竞品”为特点的端侧 LLM，适合在设备端部署 AI agent、聊天系统、报告生成等任务。

可用性

入口可访问

已记录官网或下载入口

信息核实

已验证

3 条来源，含 NavXD 收录

类型

网页工具

Web · en

访问官网收藏 0

收录 2025年6月9日更新 2025年6月9日浏览 401

// 01 MiniCPM 4.0 是什么

MiniCPM 4.0是由 MemSET（OpenBMB 团队）发布的极高效端侧大型语言模型（Edge-side LLM），具备两种版本：

8B "Lightning Sparse"（稀疏架构）
0.5B “小钢炮”版本

它以惊人的速度和极高效率能在移动或嵌入式设备实现 LLM 聊天与推理。

2. 怎么使用？

部署于端设备：支持 llama.cpp、vLLM、SGLang、LlamaFactory 等框架，可在本地 CPU/移动设备上高效推理。
量化与加速：提供 BitCPM 量化版本，支持 ternary/int4/GGUF，为不同资源环境提供优化方案。
开源部署：源码和模型均在 GitHub 和 Hugging Face 上开放，开发者可自由下载使用。

3. 主要功能

1.双模 attention：自动在稀疏与密集注意力之间切换，保障长短文本推理效果。

2.终端级超高速度：比 Qwen3-8B 提速达 5x（常规）至 220x（极端），并极节省缓存。

3.端侧友好：支持多种低资源部署框架，适配 Intel、Qualcomm、MTK、华为昇腾芯片。

4.多用途版本：包括 MiniCPM4-Survey（长文本综述）、MiniCPM4‑MCP（工具调用增强。

4. 技术原理

模块化系统优化：结合架构、训练、推理和缓存策略实现系统级提升。
InfLLM v2 稀疏注意力：只对 128 K 长文本中的 <5% token 计算密集操作。
BitCPM 量化：三值权重大幅压缩，提高推理效率。
FP8 + 多 token 预测训练：稳定高效训练策略，降低 FLOPs。
端侧 Comfy 框架：如 CPM.cu、vLLM、SGLang 等全链整合，支持框架无缝部署。

5. 应用场景

终端聊天机器人：可脱离云端、在设备上实现实时对话与创作。
文档/报告自动生成：适合处理报告、综述等中长文本任务。
AI Agent 端能力：MiniCPM4‑MCP 支持直接调用工具，降延迟提高安全。
多语言与视觉场景：虽 4.0 为文本模型，但 MiniCPM‑V /‑o 系列支持多模态部署。

6. 项目地址

GitHub：OpenBMB/MiniCPM（v4 分支）。
模型发布：Hugging Face openbmb/MiniCPM4‑8B 和 MiniCPM4‑0.5B。
Demo：Gradio 网页 demo 支持端侧在线推理。

// 04 常见问题

MiniCPM 4.0 是什么？

MiniCPM 4.0 是一款以“轻量却强劲、速度远超竞品”为特点的端侧 LLM，适合在设备端部署 AI agent、聊天系统、报告生成等任务。

MiniCPM 4.0 适合哪些场景？

可优先参考它所属的 AI 大模型 / 对话分类，以及 price-open-source 等标签。

MiniCPM 4.0 是否提供可用入口？

本页已记录官网或下载入口，可通过顶部主按钮访问。

MiniCPM 4.0 支持哪些平台？

当前记录为网页工具，通常可通过浏览器访问。

// 05 资料来源

NavXD 收...https://navxd.com/navigation/sites/5507.html 官网或下载入口https://github.com/OpenBMB/MiniCPM 分类与标签体系AI 大模型 / 对话、price-open-source

Qwen3-Coder-Next

AI 大模型

92%

◇ ◇ ◇

"关系待挖掘"
暂无搭档工具数据

▸ 我来推荐

MiniCPM 4.0 工具资料卡

NavXD2025年6月9日

GLM-5

GLM-5 是 Zhipu AI（Z.ai）发布的第五代大型语言模型，采用 Mixture-of-Experts 架构与 DeepSeek 稀疏注意力机制，支持高达 20...

AI 大模型 / 对话AI 工具

LingBot-VA

LingBot-VA 是蚂蚁灵波科技（Robbyant / Ant Group）发布的开源具身世界模型。该模型首次提出自回归视频-动作世界建模方法，实现视频动态未来预测与...

AI 大模型 / 对话AI 工具

Voxtral Transcribe 2

Voxtral Transcribe 2 是 Mistral AI 最新发布的第二代语音转写模型系列，包含用于批量转录的 Voxtral Mini Transcribe...

AI 大模型 / 对话AI 工具

Intern-S1-Pro

Intern-S1-Pro 是上海 AI 实验室开源的万亿参数级科学多模态大模型，具备混合专家（MoE）架构与通专融合架构（SAGE），在 AI4Science 科学推理...

AI 大模型 / 对话AI 工具

MiniCPM 4.0 SITES

// 01 MiniCPM 4.0 是什么

MiniCPM 4.0是由 MemSET（OpenBMB 团队）发布的 极高效端侧大型语言模型（Edge-side LLM），具备两种版本：

2. 怎么使用？

3. 主要功能

4. 技术原理

5. 应用场景

6. 项目地址

// 04 常见 问题

// 05 资料 来源

MiniCPM 4.0是由 MemSET（OpenBMB 团队）发布的极高效端侧大型语言模型（Edge-side LLM），具备两种版本：

// 04 常见问题

// 05 资料来源