SpatialGen 是群核科技开源的 模型。模型基于扩散模型架构,支持根据文字描述、参考图像和 3D 空间布局,生成时空一致的多视角图像,且能进一步得到 3D 高斯场景并渲染漫游视频。模型依托海量室内 3D 场景数据,生成的图像视觉真实,物体在不同镜头下空间属性和物理关系准确,能让用户自由穿梭场景,沉浸体验。SpatialGen解决了现有视频生成模型空间一致性问题,为 AI 视频创作等提供强大工具。

SpatialGen – 群核科技开源的3D场景生成模型  第1张
(图片来源网络,侵删)
SpatialGen – 群核科技开源的3D场景生成模型  第2张
(图片来源网络,侵删)