Goedel‑Prover‑V2 如何收费？

Goedel‑Prover‑V2 的定价模式为：unknown。

AI 工具雷达// NavXD.v4实时

当前浏览中

频道AI 大模型

浏览量200

▸ AI 大模型 · AI 智能体

Goedel‑Prover‑V2 AI 智能体

Goedel‑Prover‑V2 是一款开源自动化定理证明模型系列，通过专家迭代、自我修正与模型平均三项创新，实现 8B 和 32B 版本在自动形式化证明任务中的全新 SOTA，适合 AI 工具使用者用于数学推理和 Agent 集成。

可用性

入口可访问

已记录官网或下载入口

信息核实

已验证

3 条来源，含 NavXD 收录

类型

网页工具

Web · en

访问官网收藏 0

收录 2025年7月22日更新 2025年7月22日浏览 200

// 01 Goedel‑Prover‑V2 是什么

Goedel‑Prover‑V2 界面截图 — Goedel‑Prover‑V2 · 界面预览

一、什么是Goedel‑Prover‑V2？

Goedel‑Prover‑V2 是由普林斯顿大学联合清华、北大、斯坦福、NVIDIA、Meta FAIR、亚马逊等顶尖机构推出的开源自动定理证明模型，基于Qwen3‑8B 与 32B 模型进行专家迭代与强化学习训练。

它专注于自动生成和验证 Lean 4 形式化证明，是自动化数学定理推理领域的旗舰模型，支持 8B 与 32B 两个参数规模版本。

二、突出性能表现与突破

2.1 MiniF2F基准

8B 模型 在 MiniF2F Pass@32 上达 83.3%，性能比肩 DeepSeek‑Prover‑671B（671B 模型）。
32B 模型 在无自我修正的基础模式下 Pass@32 达 88.0%，而启用自我修正则达 90.4% 。

2.2 PutnamBench 排行

32B自我修正模式在 Pass@64 下解决了 64 道难题，一举登顶 PutnamBench，超过 DeepSeek‑Prover‑671B 的 47 道作答记录。

2.3 MathOlympiadBench

首发包含 360 道 IMO 级别问题的 MathOlympiadBench，在该数据集上 32B 模型同样展现领先能力。

2.4 推理规模曲线

32B 模型在各种 sampling budget 下均稳定领先多项其他顶级模型。

三、模型创新与训练方法

3.1 专家迭代 + 强化学习

以 Qwen3‑8B / 32B 为基础，采用专家示例引导、证明生成、验证采纳，再结合 Clan feedback 进行强化学习优化。

3.2 分层式数据合成

使用 Scaffolded Data Synthesis 自动生成难度递进的中间证明任务，建立平滑难度曲线，提升训练效率。

3.3 验证器引导的自我修正

模型输出初始证明后，会基于 Lean 编译反馈进行两轮自我修正，将反馈机制融入训练与推理阶段，改善正确率。

3.4 模型平均机制

训练到一定阶段时，将多个 checkpoint 与基座模型执行加权平均，用以恢复模型多样性，提升鲁棒性与 Pass@K 能力。

四、技术架构与流程详解

4.1 输入与输出

输入一条 Lean 4 形式化命题，模型生成候选证明片段，通过 Lean 编译器验证是否成立，不成立则根据错误进行修正。

4.2 推理流程

标准模式：直接生成单次推理证明输出；
自我修正模式：生成 + Lean 验证反馈 + 两轮迭代修正，共消耗约 40K token，上下文窗口默认 32K。

4.3 训练脚本

开源 repo 包含问题形式化、初步生成、验证反馈与 RL 策略脚本，支持 researchers reproduction 和定制训练流程。

五、如何使用 Goedel‑Prover‑V2？

5.1 模型获取

模型与 benchmark 可从 Hugging Face 下载：

Goedel‑Prover‑V2‑32B；
Goedel‑Prover‑V2‑8B
均采用 Apache‑2.0 开源协议。

数据集 MathOlympiadBench 也同步开源，支持研究使用。

5.2 快速推理示例

python

from transformers import AutoTokenizer, AutoModelForCausalLM import torch model_id = "Goedel-LM/Goedel-Prover-V2-32B" tokenizer = AutoTokenizer.from_pretrained(model_id) model = AutoModelForCausalLM.from_pretrained(model_id, trust_remote_code=True, torch_dtype=torch.bfloat16, device_map="auto") prompt = "theorem my_theorem : ... proof :=" inputs = tokenizer(prompt, return_tensors="pt").to(model.device) outputs = model.generate(**inputs, max_new_tokens=4096) print(tokenizer.decode(outputs[0]))

用户可根据需要自行部署于 GPU 或支持 local inference platforms（如 llama.cpp），结合自定义验证器调用 Lean。

六、适用场景与目标用户

6.1 研究者与教育者

适合数学 AI、形式化定理证明方向的科研人员和教师，用于教学实验、benchmark 比对、方法创新等。

6.2 Agent 构建者

可作为推理工具接入 Agent 系统，通过函数调用处理形式化证明任务。

6.3 数学竞赛组织者

可自动生成或验证 mathematical formal proofs，辅助出题、评测或赛后校对。

6.4 AI 开发者

适合想集成形式验证能力的 AI 工具开发者，用于 proofs 校验与自动推理服务。

// 02 核心功能

核心定位Goedel‑Prover‑V2 是一款开源自动化定理证明模型系列，通过专家迭代、自我修正与模型平均三项创新，实现 8B 和 32B 版本在自动形式化证明任务中的全新 SOTA，适合 AI 工具使用者用于数学推理和 Agent 集成。
分类索引当前归档在 AI 大模型 / 对话，方便和同频工具横向比较。
能力标签关联标签包括 price-open-source。
使用入口已记录可访问入口，可通过本页主按钮跳转。

// 03 使用场景

快速判断是否适合当前任务结合 AI 大模型 / 对话定位和 price-open-source 标签，先判断它是否匹配你的工作流。
横向比较同类工具从相同分类和标签继续探索替代工具，减少只看单个产品带来的选择偏差。
沉淀工具选型资料把官网入口、平台、版本和 NavXD 标签合并成一页，适合做选型记录或团队分享。

// 04 常见问题

Goedel‑Prover‑V2 是什么？

Goedel‑Prover‑V2 适合哪些场景？

可优先参考它所属的 AI 大模型 / 对话分类，以及 price-open-source 等标签。

Goedel‑Prover‑V2 是否提供可用入口？

本页已记录官网或下载入口，可通过顶部主按钮访问。

Goedel‑Prover‑V2 支持哪些平台？

当前记录为网页工具，通常可通过浏览器访问。

// 05 资料来源

NavXD 收...https://navxd.com/navigation/sites/6049.html 官网或下载入口https://blog.goedel-prover.com/分类与标签体系AI 大模型 / 对话、price-open-source

GLM-5

GLM-5 是 Zhipu AI（Z.ai）发布的第五代大型语言模型，采用 Mixture-of-Experts 架构与 DeepSeek 稀疏注意力机制，支持高达 20...

AI 大模型 / 对话AI 工具

LingBot-VA

LingBot-VA 是蚂蚁灵波科技（Robbyant / Ant Group）发布的开源具身世界模型。该模型首次提出自回归视频-动作世界建模方法，实现视频动态未来预测与...

AI 大模型 / 对话AI 工具

Voxtral Transcribe 2

Voxtral Transcribe 2 是 Mistral AI 最新发布的第二代语音转写模型系列，包含用于批量转录的 Voxtral Mini Transcribe...

AI 大模型 / 对话AI 工具

Intern-S1-Pro

Intern-S1-Pro 是上海 AI 实验室开源的万亿参数级科学多模态大模型，具备混合专家（MoE）架构与通专融合架构（SAGE），在 AI4Science 科学推理...

AI 大模型 / 对话AI 工具

Goedel‑Prover‑V2 AI 智能体

// 01 Goedel‑Prover‑V2 是什么

一、什么是Goedel‑Prover‑V2？

二、突出性能表现与突破

2.1 MiniF2F基准

2.2 PutnamBench 排行

2.3 MathOlympiadBench

2.4 推理规模曲线

三、模型创新与训练方法

3.1 专家迭代 + 强化学习

3.2 分层式数据合成

3.3 验证器引导的自我修正

3.4 模型平均机制

四、技术架构与流程详解

4.1 输入与输出

4.2 推理流程

4.3 训练脚本

五、如何使用 Goedel‑Prover‑V2？

5.1 模型获取

5.2 快速推理示例

六、适用场景与目标用户

6.1 研究者与教育者

6.2 Agent 构建者

6.3 数学竞赛组织者

6.4 AI 开发者

// 02 核心 功能

// 03 使用 场景

// 04 常见 问题

// 05 资料 来源

// 02 核心功能

// 03 使用场景

// 04 常见问题

// 05 资料来源