// 01 MedGemma 是什么
MedGemma 是 Google 于 2025 年 5 月在 Google I/O 大会上推出的开源多模态医疗 AI 模型套件,旨在提升医疗文本与图像的理解能力,助力开发者构建更智能的医疗应用。该模型基于 Gemma 3 架构,提供两种版本:
MedGemma 4B:拥有 40 亿参数的多模态模型,结合 SigLIP 图像编码器和语言模型,能够处理医疗图像与文本的联合任务。
MedGemma 27B:拥有 270 亿参数的纯文本模型,专注于医疗文本的深入理解和临床推理。
核心功能
医疗图像分类与解读:MedGemma 4B 经过胸部 X 光、皮肤病、眼科和病理图像的预训练,适用于图像分类、报告生成和视觉问答等任务。
临床文本理解与推理:MedGemma 27B 专为处理临床笔记、病历摘要、患者分诊和决策支持等任务设计,具备强大的医学知识理解能力。
可定制与部署灵活:支持本地运行和在 Google Cloud Vertex AI 上部署,提供 Colab 示例和 Hugging Face 模型,便于开发者进行微调和集成。
获取方式
官方网站:MedGemma 开发者页面
Hugging Face 模型库:MedGemma 模型集合
GitHub 代码仓库:google-health/medgemma
MedGemma 的推出,为医疗 AI 领域提供了强大的工具,特别适合需要处理复杂医疗图像与文本的应用场景,如智能诊断、临床决策支持和医疗教育等。开发者可根据具体需求,选择合适的模型版本,并进行相应的微调和部署。
// 04 常见 问题
MedGemma 是什么?
Google 于 2025 年 5 月在 Google I/O 大会上推出的开源多模态医疗 AI 模型套件。
MedGemma 适合哪些场景?
可优先参考它所属的 AI 大模型 / 对话 分类,以及 tech-cv、industry-medical 等标签。
MedGemma 是否提供可用入口?
本页已记录官网或下载入口,可通过顶部主按钮访问。
MedGemma 支持哪些平台?
当前记录为网页工具,通常可通过浏览器访问。
