xAR 是字节跳动和约翰·霍普金斯大学联合提出的新型自回归视觉生成框架。框架通过“下一个X预测”(Next-X Prediction)和“噪声上下文学习”(Noisy Context Learning)技术,解决了传统自回归模型在视觉生成中的信息密度不足和累积误差问题。

xAR – 字节联合霍普金斯大学推出的自回归视觉生成框架  第1张
(图片来源网络,侵删)
xAR – 字节联合霍普金斯大学推出的自回归视觉生成框架  第2张
(图片来源网络,侵删)