大模型
Gemini Embedding 2
Google 推出的原生多模态嵌入模型。
Gemini Embedding 2 是什么?
Gemini Embedding 2 是 Google DeepMind 推出的原生多模态嵌入模型,可将文本、图像、视频、音频与文档映射到统一语义向量空间。官方文档显示,该模型支持最高 3072 维向量输出,并支持 OCR、音轨提取与任务指令优化,适用于复杂检索与分析任务。Gemini Embedding 2 已通过 Gemini API、Vertex AI 与 Gemini Enterprise Agent Platform 开放,支持多模态 RAG、语义搜索与推荐系统场景。
核心功能
- 支持多模态嵌入
- 支持文本图像视频音频输入
- 支持 OCR 与音轨提取
- 支持 3072 维向量输出
- 支持 Gemini API
使用场景
- 语义搜索
- 多模态 RAG
- 推荐系统
- 向量检索
- 知识库系统
适合谁用
适合 AI 开发者、搜索团队与 RAG 系统开发者
优缺点
优点
缺点
类似工具
常见问题
Gemini Embedding 2 是什么?
Google 推出的原生多模态嵌入模型。
Gemini Embedding 2 如何收费?
Gemini Embedding 2 的定价模式为:unknown。
