()11月2日 音讯:Jina AI 宣布了其第二代文本嵌入模子的推出最新希望:jina-embeddings-v2。这个最早进的推出模子是惟一支援8K(8192个token)左右文长度的开源解决计划
。这一造诣使其在性能和在大领域文本嵌入基准 (MTEB) 排行榜上的推出性能方面与 OpenAI 的专有模子 text-embedding-ada-002至关。 Jina-embeddings-v2是推出开源文本嵌入模子的一大步
,在容量和基准性能方面可与已竖立的推出专有对应物相媲美 。它的推出性能优于 OpenAI 的8K 模子 jina-embeddings-v2。值得注重的推出是,与 OpenAI 相比,推出Jina-embedding-v2在分类平稳值、推出重新排名平稳值、推出检索平稳值和摘要平稳值等症结宗旨上展现出更卓越的推出性能。 钻研职员意味
,推出Jina-embeddings-v2以其先进的推出性能完全转变了种种运用顺序
。在执法文献综合中,推出它捕捉和综合少量执法文本中的推出每一个错综庞杂的细节
。看待医学钻研,它嵌入了迷信论文 ,增进了总体综合并增进了突破性的发现。该模子透彻钻研文学综合中的长篇实质
,捕捉主题元素以停止更雄厚的明白。财政展望运用户能够从仔细的财政演讲中赢得卓著的洞悉力,进而增强决议意图流程。在对话式 AI 中 ,Jina Embeddings V2昭著革新了谈天机械人对庞杂用户盘问的赞同。依据其多性能和壮大的性能
,日本招聘Jina Embeddings V2站在转变咱们解决各个畛域庞杂数据集和从中猎取看法的形式的最前沿 。 尝试注解,这种支援左右文的 jina-embeddings-v2优于其余抢先的前提嵌入模子
,强调了更长左右文性能的现实优势。 钻研职员意味 ,他们意图宣布一篇学术论文,仔细引见Jina-embeddings-v2的手艺庞杂性和基准,为AI社区提供更透彻地钻研该模子威力的时机。该团队正在开辟一个相似于 OpenAI 的嵌入 API 平台 ,该平台已退出高级阶段
,可确保用户依据他们的需要量身定制的嵌入模子的无缝可扩张性。另外,Jina AI正在通过涉足多语言嵌入来扩张其语言威力,并盘算引入德语-英语模子。这次蔓延旨在增强他们的产物组合,并增强他们作为野生智能立异指导者的职位中央 。 该模子能够在 Hugging Face 上轻盈收费下载
。前提模子专为需要高精度的刻薄恣意而制定,有用于学术钻研或商业综合等畛域
。相比之下,小型型号的体积仅为0.07G,专为轻量级恣意而设想 ,异常顺应算计资源有限的移动运用顺序或装备上的运用顺序
。意识到野生智能社区的分歧需要 ,Jina AI提出了这两种分歧的模子选项 ,准许用户选择最顺应其算计需要并相符其运用偏好的模子。 项目所在:https://huggingface.co/jinaai/jina-embeddings-v2-base-en?ref=jina-ai-gmbh.ghost.io 民间引见网址:https://jina.ai/news/jina-ai-launches-worlds-first-open-source-8k-text-embedding-rivaling-openai/