当前位置:首页 > 今日话题

阿里云通义千问开源Qwen2系列模子 :性能昭著提升 蕴涵5个尺寸 模子在多项评测中展现优异

()6月7日 音讯:阿里巴巴偷偷宣布了 Qwen2系列模子,阿里这是云通义千源Q蕴涵 Qwen1.5升级后的重要刷新 。

Qwen2系列蕴涵了5个分歧领域的问开预训练和指令微调模子 ,离别是系性 Qwen2-0.5B 、Qwen2-1.5B 、列模最容易移民的国家Qwen2-7B、昭著沙特出国劳务最新招聘Qwen2-57B-A14B 和 Qwen2-72B  。提升这些模子在解决长文本时支援分歧的个尺左右文长度,最大可达128K tokens 。阿里

阿里云通义千问开源Qwen2系列模子:性能昭著提升 蕴涵5个尺寸 模子在多项评测中展现优异

Qwen2系列在多语言方面做了优化,云通义千源Q蕴涵增长了27种语言的问开高质量数据 ,并针对罕见的系性语言转换问题停止了优化。模子在多项评测中展现优异 ,列模厨师出国劳务招聘信息席卷做作语言明白 、昭著学问、提升代码 、日本打工数学和多语言明白等威力 ,昭著逾越之前的 Qwen1.5和其余开源模子。

在代码和数学威力方面 ,Qwen2系列延续提升 ,尤其是在多种编程语言上的展现和数学解题威力方面有昭著提升。模子还能解决长文本恣意  ,其中 Qwen2-72B-Instruct 能圆满解决128k 左右文长度内的信息抽取恣意 。

在平安性方面 ,Qwen2-72B-Instruct 模子与 GPT-4展现至关 ,昭著优于 Mistral-8x22B 模子 。整个模子均已开源在 Hugging Face 和 ModelScope 上,可在种种运用途景中运用。未来,Qwen 团队还将连续训练更大的模子 ,钻研模子及数据的 Scaling Law ,并将 Qwen2扩张成多模态模子。

点击体验:https://top.aibase.com/tool/qwen2

日本工作

分享到: