首页 小说推荐 实时讯息 百科知识 范文大全 经典语录
您的位置: 首页 > 实时讯息 >

Qwen3深夜开源新系列:文本表征模型,3种尺寸可选,超越商业API拿下SOTA

0次浏览     发布时间:2025-06-06 11:16:00    

Qwen3深夜上新,Embedding系列全新登场!

它专为文本表征、检索与排序任务设计,旨在将文本(如句子、段落)转换为高质量的向量表示,以便在语义搜索、问答系统、推荐引擎等应用中更有效地处理和理解自然语言。

可用于文档检索、RAG、分类、情感分析、检索等任务。

它在Qwen3基础模型上训练而来,充分发挥Qwen3的多语言优势。

一共有0.6B/4B/8B三种尺寸,8B版本在MTEB多语言Leaderboard榜单中排名第一,性能超越一众商业API服务。

有人就表示,0.6B版本不就是为了手机RAG准备的吗?期待苹果WWDC了。

今年阿里巴巴确认与苹果合作,承接Apple Intelligenc在中国的服务。

目前,该系列模型已在Hugging Face、ModelScope和GitHub平台开源,用户也可以直接使用阿里云百炼平台提供的最新的文本向量模型服务。

3种尺寸任意挑选

Qwen3-Embedding系列的主要亮点包括:

拿下新SOTA,排序模型在各类文本检索场景中表现出色,显著提升搜索结果相关性。

提供0.6B-8B三种模型配置,开发者可灵活组合表征与排序模块,实现功能扩展。

此外,模型支持以下定制化特性:

表征维度自定义:允许用户根据实际需求调整表征维度,有效降低应用成本;

指令适配优化:支持用户自定义指令模板,以提升特定任务、语言或场景下的性能表现。

Qwen3-Embedding系列支持119种语言,涵盖主流自然语言及多种编程语言。

具体来看模型情况,Qwen3-Embedding系列一共包含3款模型:

此外还发布了排序模型Reranker系列,评测结果如下图所示:

它们在各类文本检索场景中表现出色,可以显著提升搜索结果的相关性。

在模型架构上,Embedding模型和Reranker模型分别采用了双塔结构和单塔结构的设计。

通过LoRA微调,最大限度保留并继承了基础模型的文本理解能力。

具体实现如下:

Embedding模型接收单段文本作为输入,取模型最后一层「EOS」标记对应的隐藏状态向量,作为输入文本的语义表示;

Reranker模型则接收文本对(例如用户查询与候选文档)作为输入,利用单塔结构计算并输出两个文本的相关性得分。

在实际应用中,Embedding模型和Reranker模型常常结合使用,可以兼顾效率和精度。

比如在RAG系统里,Embedding模型和Reranker模型共同构建了检索部分的骨干框架。Embedding模型用于初步检索,Reranker模型用于优化候选结果。

在模型训练上,Qwen3-Embedding系列模型的训练继承了GTE-Qwen系列(此前推出的文本向量模型)的多阶段训练范式,针对具体应用场景进行了深度优化。

Embedding模型的训练过程主要有3阶段:

Reranker模型的训练中,基于实验验证结果,直接采用高质量标注数据进行监督训练,可以提升训练效率。

Qwen3团队强调,在Embedding模型的第一阶段弱监督训练中,他们构建了多任务适配的Prompt体系。

也就是针对不同任务类型和语言特性,使用Qwen3动态生成了一系列弱监督文本对,突破了传统方法依赖社区论坛或开源数据筛选获取弱监督文本对的局限性,实现了大规模弱监督数据的高效生成。

One More Thing

值得一提的是,苹果WWDC25定档下周二(6月10日)

中国的Apple Intelligence正是由阿里来提供大模型能力。

巧合的是,在WWDC25同天19:30,阿里将开展Qwen3-Embedding技术直播。

感兴趣的同学可以在官号蹲一下了。

ModelScope:

https://modelscope.cn/collections/Qwen3-Embedding-3edc3762d50f48

https://modelscope.cn/collections/Qwen3-Reranker-6316e71b146c4f

Hugging Face:

https://huggingface.co/collections/Qwen/qwen3-embedding-6841b2055b99c44d9a4c371f

https://huggingface.co/collections/Qwen/qwen3-reranker-6841b22d0192d7ade9cdefea

GitHub:

https://github.com/QwenLM/Qwen3-Embedding

技术报告:

https://github.com/QwenLM/Qwen3-Embedding/blob/main/qwen3_embedding_technical_report.pdf

本文来自微信公众号“量子位”,作者:明敏,36氪经授权发布。

相关文章