当前位置：首页 > 内容聚合

智源钻研院开源JudgeLM 可评测种种大模子并输入评分院开源通过立异要领

（）11月13日音讯:智源钻研院开源了一种名为 JudgeLM 的智源钻研种裁判模子，能够高效准确地评判种种大模子。院开源

与 GPT-4相比，可评JudgeLM 仅需1/120的测种出国劳务签证怎么办理利润，就能够抵达90% 以上的模并评判效果一致性。它能够运用于纯文本、输入出国劳务咨询公司多模态等多种评判场景，评分并能够输入评分、智源钻研种推断和论述缘由。院开源

通过立异要领，可评JudgeLM 与参照谜底的测种一致性最高突出了90% ，亲近人类展现。模并JudgeLM 有三个分歧参数版本，输入出国劳务咨询公司经营范围离别为70亿、评分130亿和330亿参数，日本工作智源钻研种威力和展现随着参数领域的增大而提升。

另外，智源钻研院还开源了一个蕴涵训练和验证样本的数据集，用于透彻钻研大语言模子裁判。JudgeLM 的评判作用高，利润低于鉴于 API 的评判要领。

未来，JudgeLM 团队将进一步圆满这一裁判模子，提供更准确、高效、遮盖更多场景的大语言模子评判。

JudgeLM 有关资源:

github :https://github.com/baaivision/JudgeLM

arxiv :https://arxiv.org/abs/2310.17631

demo（33B） :https://218.91.113.230:9004/

相关推荐