Qwen3 Reranker
T-03模型 长尾 OPEN-SOURCE

Qwen3 Reranker

阿里云通义千问团队于 2025 年 6 月发布的开源文本重排序(Reranking)模型,作为 Qwen3 Embedding 系列的一部分。

01

Qwen3 Reranker 是什么

Qwen3 Reranker是阿里云通义千问团队于 2025 年 6 月发布的开源文本重排序(Reranking)模型,作为 Qwen3 Embedding 系列的一部分。该模型基于 Qwen3 基础大语言模型(LLM)进行训练,专为提升文本检索任务中的相关性排序而设计。通过对查询与候选文档对进行评分,Qwen3 Reranker 能够显著优化搜索结果的排序质量。


🚀 如何使用 Qwen3 Reranker?

  1. 获取模型

    • 访问 Hugging Face 模型库中的 Qwen3 Reranker 系列 下载所需模型。

    • 模型提供 0.6B、4B 和 8B 三种参数规模,满足不同性能需求。

  2. 安装依赖

    • 确保已安装必要的 Python 库,如 transformerstorch 等。

  3. 加载模型

    • 使用 Hugging Face 的 transformers 库加载模型,例如:

      from transformers import AutoTokenizer, AutoModelForSequenceClassification tokenizer = AutoTokenizer.from_pretrained("Qwen/Qwen3-Reranker-0.6B") model = AutoModelForSequenceClassification.from_pretrained("Qwen/Qwen3-Reranker-0.6B")

       

  4. 进行重排序

    • 将查询与候选文档对输入模型,获取相关性得分,并根据得分对候选文档进行排序。


🔧 主要功能

  • 文本对相关性评分输入查询与候选文档对,输出相关性得分,用于优化搜索结果排序。

  • 多语言支持支持超过 100 种自然语言和编程语言,适用于全球化应用场景。

  • 多尺寸模型提供 0.6B、4B 和 8B 三种参数规模的模型,满足从移动端到服务器端的不同需求。

  • 高性能表现在多语言检索任务中,8B 模型得分达到 69.02,中文检索任务中得分为 77.45,英文检索任务中得分为 69.76,显著优于其他基线模型。


🧠 技术原理

Qwen3 Reranker 采用单塔结构(Single-Tower)架构,接收文本对(例如用户查询与候选文档)作为输入,计算并输出两个文本的相关性得分。该模型在训练过程中,直接使用高质量的标注数据进行监督训练,提高了训练效率。此外,模型支持用户自定义指令模板,以提升特定任务、语言或场景下的性能表现。


🌐 应用场景

  • 语义搜索提升搜索引擎中查询与文档的匹配度,优化搜索结果排序。

  • 问答系统在问答系统中,对候选答案进行重排序,提供更准确的回答。

  • 推荐系统根据用户兴趣和行为,对推荐内容进行优化排序。

  • 信息检索在大规模文档中,提升相关文档的排序质量,提高检索效率。

  • 多语言应用支持多语言和跨语言的文本处理,适用于全球化产品。


🔗 项目地址


❓ 常见问题

Q1:Qwen3 Reranker 是否支持中文?
A1:是的,Qwen3 Reranker 支持中文,并在中文检索任务中表现出色,得分达到 77.45。

Q2:如何选择适合的模型规模?
A2:根据应用场景的资源和性能需求选择模型规模。0.6B 模型适合资源受限的场景,4B 和 8B 模型适合对性能要求较高的场景。

Q3:是否可以在本地部署模型?
A3:是的,Qwen3 Reranker 模型已在多个平台开源,支持本地部署。

Q4:模型是否支持自定义指令模板?
A4:是的,Qwen3 Reranker 支持用户自定义指令模板,以提升特定任务、语言或场景下的性能表现。

Q5:模型的训练数据是否公开?
A5:模型的训练数据未完全公开,但技术报告中提供了训练方法和评估结果的详细说明。

AI大学堂