当前位置:首页 > 内容聚合

元象大模子开源30款量化版本 可更低利润部署 利润总吞吐提升了1.5倍

3月28日 音讯:元象大模子开源了30款量化版本,元象支援 vLLM 和 llama.cpp 等主流框架的大模量化推理,无条件收费商用。开源款量出国劳务咨询公司经营范围

对量化先后的化版模子威力、推理性能停止评价,本可部署新加坡出国劳务招聘信息找东莞以 XVERSE-13B-GPTQ-Int4量化版本为例 ,更低新加坡出国劳务招聘信息45岁月新在多少钱量化后模子权重中断了72% ,利润总吞吐提升了1.5倍 ,元象同时遗失了95% 的大模威力。

元象大模子开源30款量化版本 可更低利润部署 利润总吞吐提升了1.5倍

开辟者能够依据妙技 、开源款量软硬件设置装备铺排和详细需要选择分歧推理框架和数据精度的日本劳务化版模子 。要是本可部署要地资源有限 ,能够直接挪用元象大模子的更低 API 效劳(chat.xverse.cn)。

总体来说,利润元象大模子的元象开源量化版本提供了省事快速的部署形式,能够依据需要选择分歧的框架和精度模子停止部署和推理 。

元象大模子下载 :

  • Hugging Face:https://huggingface.co/xverse

  • ModelScope魔搭:https://modelscope.cn/organization/xverse

  • Github:https://github.com/xverse-ai

分享到: