Granite 3.1是IBM推出的新一代语言模型,具有强大的性能和更长的上下文处理能力。Granite 3.1模型家族有 4 种不同的尺寸和 2 种架构:密集模型2B和8B参数模型,总共使用 12 万亿个token进行训练。专家混合MoE模型:稀疏1B和3B MoE 模型,分别具有 400M 和 800M 激活参数,总共使用 10 万亿个token进行训练。Granite 3.1支持128K令牌的上下文长度,能处理复杂的文本和任务。Granite 3.1引入全新的嵌入模型,覆盖12种语言,增强多语言支持。Granite Guardian 3.1模型具备功能调用幻觉检测能力,提升对工具调用的控制和可观察性。

Granite 3.1 – IBM 推出的新版语言模型  第1张
(图片来源网络,侵删)
Granite 3.1 – IBM 推出的新版语言模型  第2张
(图片来源网络,侵删)