Jina-embeddings-v3 是 Jina AI 推出的一款先进的文本嵌入模型,专为多语言数据处理和长文本上下文检索任务设计。模型拥有 5.7 亿参数,支持长达 8192 个 token 的文本处理。通过特定任务的低秩适应(LoRA)适配器和 Matryoshka 表示学习技术,生成高质量的嵌入向量,适用于查询-文档检索、聚类、分类和文本匹配等多种任务。在 MTEB 基准测试中,jina-embeddings-v3 展现超越现有专有嵌入模型的性能,保持较高的成本效益,适合生产和边缘计算环境。

Jina-baidu09embeddings-baidu09v3 – 专为多语言和长文本上下文检索设计的文本嵌入模型  第1张
(图片来源网络,侵删)
Jina-baidu09embeddings-baidu09v3 – 专为多语言和长文本上下文检索设计的文本嵌入模型  第2张
(图片来源网络,侵删)