当前位置:首页 > 今日头条

通义千问14B模子开源!阿里云大模子开源生态初具雏形 - 阿里一个多月下载量破100万

  9月25日,通义态初阿里云开源通义千问140亿参数模子Qwen-14B及其对话模子Qwen-14B-Chat,千问收费可商用  。Qwen-14B在多个威信评测中逾越一致领域模子  ,模模开一面宗旨以至亲近Llama2-70B 。开源阿里云此前开源了70亿参数模子Qwen-7B等 ,阿里一个多月下载量破100万,云大源生成为开源社区的具雏口碑之作 。

  Qwen-14B是通义态初一款支援多种语言的高性能开源模子,相比同类模子运用了更多的千问高质量数据,总体训练数据突出3万亿Token,模模开使得模子具有更壮大的开源推理、认知、阿里计划和影象威力  。云大源生Qwen-14B最大支援8k的具雏左右文窗口长度 。

通义千问14B模子开源!阿里云大模子开源生态初具雏形 - 阿里一个多月下载量破100万

Qwen-14B性能逾越同尺寸模子" title="Qwen-14B性能逾越同尺寸模子" align="1" src="//img.cnmo.com/2168_600x1000/2167571.jpg"/>
Qwen-14B在十二个威信测评中全方向逾越同领域SOTA大模子

  Qwen-14B-Chat是通义态初在基座模子上通过周密SFT失去的对话模子 。借助基座模子壮大性能,Qwen-14B-Chat天生实质的准确度大幅提升,也更相符人类偏好 ,实质创作上的想象力和雄厚度也有昭著扩张 。

  Qwen拥有卓越的工具挪用威力,能闪开辟者更快地建立鉴于Qwen的Agent(智能体)。开辟者可用简朴指令教会Qwen运用庞杂工具,譬如运用Code Interpreter工具执行Python代码以停止庞杂的数学算计、数据综合、图表绘制等;还能开辟拥有多文档问答 、长文写作等威力的“高级数字助理”。

  百亿之内参数级别大语言模子是暂时开辟者进走运用开辟和迭代的主流选择, Qwen-14B进一步提升了小尺寸模子的性能下限,从众多同尺寸模子中冲出重围 ,在MMLU 、C-Eval、GSM8K  、MATH、GaoKao-Bench等12个威信测评中赢得最优问题,逾越整个测评中的SOTA(State-Of-The-Art)大模子 ,也周全逾越Llama-2-13B ,比起Llama 2的34B、70B模子也其实不增色。与此同时 ,Qwen-7B也崭新升级,中心宗旨最高提升22.5%。


Qwen-14B性能逾越同尺寸模子

  用户可从魔搭社区直接下载模子 ,也可通过阿里云灵积平台走访和挪用Qwen-14B和Qwen-14B-Chat 。阿里云为用户提供席卷模子训练 、推理 、部署 、精调等在内的全方向效劳 。

  8月,阿里云开源通义千问70亿参数基座模子Qwen-7B,先后冲上HuggingFace 、Github的trending榜单 。短短一个多月,累计下载量突破100万 。开源社区涌现了50多个鉴于Qwen的模子 ,社区多个著名的工具和框架都集成了Qwen 。


  通义千问是落地最深 、运用最广的中原大模子 ,海内已有多个月活过亿的运用接入通义千问 ,少量中小企业、科研机谈判小我私家开辟者都在鉴于通义千问开辟专属大模子或运用产物,如阿里系的淘宝、钉钉 、未来精灵,以及外部的科研机构、守业企业。

  浙江大学团结高级培养出书社鉴于Qwen-7B开辟了智海-三乐培养蜿蜒大模子,已在天下12所高校运用 ,可提供智能问答、试题天生、学习导航、教学评价等威力,模子已在阿里云灵积平台对外提供效劳,一行代码就可挪用;浙江有鹿机械人科技有限公司在路面清洁机械人中集成了Qwen-7B,使机械人能以做作语言与用户停止适时交互 ,明白用户提出的需要 ,将用户的高层指令停止综合和拆解,做高层的逻辑综合和恣意计划,终了清洁恣意。

  阿里云CTO周靖人意味,阿里云将延续拥抱开源绽放 ,推进中原大模子生态修复 。阿里云深信开源绽放的气力,抢先开源自研大模子 ,指望让大模子手艺更快触达中小企业和小我私家开辟者 。

  阿里云还牵头修复了中原最大的AI模子开源社区魔搭ModelScope,团结全行业的气力 ,一同推进大模子手艺普惠和运用落地 。已往两个月内,魔搭社区的模子下载量从4500万飙升到8500万 ,增幅亲近100%。 

分享到: