当前浏览中
频道AI 大模型
浏览量201
▸ AI 大模型 · 公司 / 组织

MiniMax‑M1 公司 / 组织

MiniMax‑M1 是全球首个开放参数混合注意力大模型,拥有 4.56 e11 参数、1 百万 token 上下文长度和高效强化学习训练机制,擅长数学、编程、长上下文理解和复杂推理任务。

可用性
入口可访问
已记录官网或下载入口
信息核实
已验证
4 条来源,含 NavXD 收录
类型
网页工具
Web · en
GitHub收藏 0
收录 2025年6月17日更新 2025年6月17日浏览 201

// 01 MiniMax‑M1 是什么

MiniMax‑M1 界面截图
MiniMax‑M1 · 界面预览

什么是 MiniMax‑M1?

MiniMax‑M1 是由 MiniMax‑AI 团队开发的开源大规模混合注意力推理模型,拥有 4560 亿参数,单 token 激活约 459 亿参数,支持高达 100 万 token 的上下文长度,是当前少有能处理超长上下文的 LLM 模型之一。

它结合混合注意力机制(hybrid attention)与 Mixture-of-Experts 架构,具备高效学习推理能力,并通过 Lightning Attention 实现推理 FLOPs 显著降低


MiniMax‑M1 的关键特征

混合注意力架构(Hybrid Attention + MoE)

采用 Lightning Attention + Softmax Attention 混合策略,在长上下文和推理任务中保持性能稳定,并通过 Mixture‑of‑Experts 模式降低模型推理 FLOPs

少激活参数机制

虽然总参数量达 4560 亿,但每次推理仅激活约 45.9 亿参数,大幅节省显存和计算成本

超长上下文支持

原生支持 100 万 token 上下文,较 DeepSeek‑R1 提供 25% 更低的推理 FLOPs,同时在 longbench 等长上下文基准中表现突出

强化学习训练(CISPO)

引入 CISPO(Clipped Importance Sampling),改善 RL 收敛速度,在 512 张 H800 GPU 上三周训练完毕,费用约 53 万美元

两档思考预算

提供 40K 和 80K 思考预算版本,80K 在复杂数学、编程、推理任务中表现更优


MiniMax‑M1 的核心优势

卓越推理与编码能力

在综合推理、数学(AIME、MATH-500)、编程(LiveCodeBench、FullStackBench)、常识推理(MMLU-Pro、GPQA Diamond)等基准中保持领先

长上下文处理能力

在 OpenAI‑MRCR(128K、1M)和 LongBench‑v2 测试中,MiniMax‑M1 名列前三,表现优于绝大多数公开可用模型

工具使用能力

TAU-bench (航空、零售)测试表明,MiniMax‑M1 在 agentic tool use 方面表现优异,胜于其他开源模型

经济高效

依托 Lightning Attention 与 MoE 架构,推理 FLOPs 显著下降,适合 vLLM 或 Transformers 框架部署


部署策略与演示使用

HuggingFace 与 vLLM 部署

MiniMax‑M1-40K/80K 可以直接从 HuggingFace 下载,并使用 vLLM 进行高性能部署或通过 Transformers pipeline 调试

功能调用支持

模型具备函数调用(Function Calling)能力,可与外部工具、搜索或数据库交互构建 agent 流程,支持 Chatbot 与 API 使用

Chatbot Demo 与 API 服务

210Base 提供在线 chatbot 演示 MiniMax‑M1 处理长上下文与 agent 推理能力,同时提供 MCP Server 接入图像、语音工具


与其他模型对比解析

功能 / 模型MiniMax‑M1DeepSeek‑R1Qwen3‑235BGemini / GPT‑4o
参数量(总/激活)456B / 45.9B671B / ~37B235B商业闭源
最大上下文长度1M token128K128K256K+
推理 FLOPs仅25% DeepSeek FLOPsbaseline较高未公开
强化学习机制(CISPO)✅ 强化收敛❌ 无❌ 无⚠ 不详
Agent 工具调用✅ 支持函数调用⚠ 较弱⚠ 部分支持✅ 全栈支持
开源许可✅ Apache‑2.0⚠ 多为封闭⚠ 多为闭源❌ 闭源

MiniMax‑M1 是当前唯一支持百万级上下文、低 FLOPs、兼顾推理与 agent 调用的开源混合推理模型。


// 02 核心 功能

  • 核心定位MiniMax‑M1 是全球首个开放参数混合注意力大模型,拥有 4.56 e11 参数、1 百万 token 上下文长度和高效强化学习训练机制,擅长数学、编程、长上下文理解和复杂推理任务。
  • 分类索引当前归档在 AI 大模型 / 对话,方便和同频工具横向比较。
  • 能力标签关联标签包括 price-open-source、price-free、大模型。
  • 使用入口已记录可访问入口,可通过本页主按钮跳转。

// 03 使用 场景

// 04 实战 Prompt

  • SEO 意图分析你是 SEO 内容策略师。请根据我的目标关键词,分析搜索意图、竞品内容结构、用户真正想解决的问题,以及我这篇文章应该覆盖哪些模块才更完整。
  • SEO 文章初稿请根据以下关键词意图和文章大纲,生成一篇适合中文 SEO 场景的文章初稿。要求围绕用户问题展开,结构清晰,不要为了塞关键词而牺牲可读性。
  • SEO 复盘与补强以下是我发布后的 SEO 文章数据和页面内容。请帮我判断当前问题更可能在标题、内容深度、结构覆盖还是关键词方向,并给出下一轮优化方案。

// 05 常见 问题

MiniMax‑M1 是什么?
MiniMax‑M1 是全球首个开放参数混合注意力大模型,拥有 4.56 e11 参数、1 百万 token 上下文长度和高效强化学习训练机制,擅长数学、编程、长上下文理解和复杂推理任务。
MiniMax‑M1 适合哪些场景?
可优先参考它所属的 AI 大模型 / 对话 分类,以及 price-open-source、price-free、大模型 等标签。
MiniMax‑M1 是否提供可用入口?
本页已记录官网或下载入口,可通过顶部主按钮访问。
MiniMax‑M1 支持哪些平台?
当前记录为网页工具,通常可通过浏览器访问。

// 06 资料 来源

同频段 更多信号

查看 AI 大模型 全部