// 01 Qwen3 Embedding 是什么
Qwen3 Embedding 是阿里云通义千问团队于 2025 年 6 月推出的全新文本嵌入与重排序模型系列,专为文本表征、信息检索和排序任务设计。该系列模型基于 Qwen3 基础模型进行训练,继承了其在多语言文本理解方面的优势,支持超过 100 种自然语言和编程语言。Qwen3 Embedding 提供了 0.6B、4B 和 8B 三种参数规模的模型,以满足不同场景下的性能与效率需求。
🚀 如何使用 Qwen3 Embedding?
获取模型:
访问 GitHub 仓库 Qwen3-Embedding 下载模型代码和文档。
在 Hugging Face 模型库中搜索 Qwen3-Embedding 获取预训练模型。
安装依赖:
确保已安装必要的 Python 库,如
transformers、torch等。
加载模型:
使用 Hugging Face 的
transformers库加载模型,例如:
生成嵌入向量:
对输入文本进行编码,生成嵌入向量,用于后续的相似度计算、检索等任务。
集成到应用中:
将生成的嵌入向量集成到搜索引擎、问答系统、推荐系统等应用中,实现高效的文本处理。
🔧 主要功能
多语言支持:支持超过 100 种自然语言和编程语言,适用于全球化应用场景。
多尺寸模型:提供 0.6B、4B 和 8B 三种参数规模的模型,满足从移动端到服务器端的不同需求。
高性能表现:在 MTEB 多语言排行榜中,8B 模型得分 70.58,位列第一,超越多款商业 API 服务。
灵活的架构设计:采用双塔结构和单塔结构,分别用于嵌入模型和重排序模型,支持自定义指令模板和表征维度。
开源与易用性:在 GitHub、Hugging Face 和 ModelScope 平台开源,方便开发者获取和使用。
🧠 技术原理
Qwen3 Embedding 系列模型采用了多阶段训练范式,具体包括:
对比学习预训练:使用大规模弱监督数据进行对比学习,提升模型的语义表征能力。
监督微调:利用高质量标注数据进行监督训练,增强模型在特定任务上的表现。
模型融合:通过合并多个候选模型,提升整体性能和泛化能力。
此外,模型采用双编码器(dual-encoder)架构设计,并通过 LoRA(Low-Rank Adaptation)进行微调,以保留和增强基础模型的文本理解能力。
🌐 应用场景
语义搜索:将文本转换为向量,实现基于语义的高效搜索。
问答系统:提升问答系统中问题与答案的匹配度,提供更准确的回答。
推荐系统:根据用户兴趣和行为,推荐相关内容或产品。
信息检索:在大规模文档中快速检索相关信息,提高检索效率。
多语言应用:支持多语言和跨语言的文本处理,适用于全球化产品。
🔗 项目地址
Hugging Face 模型库:https://huggingface.co/collections/Qwen/qwen3-embedding
ModelScope 模型库:https://modelscope.cn/collections/Qwen3-Embedding

