()11月13日 音讯:智源钻研院开源了一种名为 JudgeLM 的智源钻研种裁判模子,能够高效准确地评判种种大模子。院开源 与 GPT-4相比
,可评JudgeLM 仅需1/120的测种出国劳务签证怎么办理利润,就能够抵达90% 以上的模并评判效果一致性 。它能够运用于纯文本、输入出国劳务咨询公司多模态等多种评判场景,评分并能够输入评分
、智源钻研种推断和论述缘由。院开源 通过立异要领
,可评JudgeLM 与参照谜底的测种一致性最高突出了90% ,亲近人类展现 。模并JudgeLM 有三个分歧参数版本
,输入出国劳务咨询公司经营范围离别为70亿、评分130亿和330亿参数,日本工作智源钻研种威力和展现随着参数领域的增大而提升。 另外,智源钻研院还开源了一个蕴涵训练和验证样本的数据集,用于透彻钻研大语言模子裁判。JudgeLM 的评判作用高 ,利润低于鉴于 API 的评判要领。 未来,JudgeLM 团队将进一步圆满这一裁判模子 ,提供更准确
、高效 、遮盖更多场景的大语言模子评判。 JudgeLM 有关资源: github :https://github.com/baaivision/JudgeLM arxiv :https://arxiv.org/abs/2310.17631 demo(33B) :https://218.91.113.230:9004/