当前位置:首页 > 内容聚合

智源钻研院开源JudgeLM 可评测种种大模子并输入评分 院开源通过立异要领

()11月13日 音讯:智源钻研院开源了一种名为 JudgeLM 的智源钻研种裁判模子 ,能够高效准确地评判种种大模子。院开源

与 GPT-4相比  ,可评JudgeLM 仅需1/120的测种出国劳务签证怎么办理利润,就能够抵达90% 以上的模并评判效果一致性。它能够运用于纯文本 、输入出国劳务咨询公司多模态等多种评判场景 ,评分并能够输入评分 、智源钻研种推断和论述缘由 。院开源

智源钻研院开源JudgeLM 可评测种种大模子并输入评分 院开源通过立异要领

通过立异要领 ,可评JudgeLM 与参照谜底的测种一致性最高突出了90% ,亲近人类展现 。模并JudgeLM 有三个分歧参数版本 ,输入出国劳务咨询公司经营范围离别为70亿 、评分130亿和330亿参数 ,日本工作智源钻研种威力和展现随着参数领域的增大而提升。

另外 ,智源钻研院还开源了一个蕴涵训练和验证样本的数据集,用于透彻钻研大语言模子裁判。JudgeLM 的评判作用高 ,利润低于鉴于 API 的评判要领。

未来 ,JudgeLM 团队将进一步圆满这一裁判模子 ,提供更准确 、高效 、遮盖更多场景的大语言模子评判。

JudgeLM 有关资源:

github :https://github.com/baaivision/JudgeLM

arxiv :https://arxiv.org/abs/2310.17631

demo(33B) :https://218.91.113.230:9004/

分享到: