GEN3C – NVIDIA 联合多伦多大学等推出的生成式视频模型

baidu09_com 2025-08-29 5 0

GEN3C 是NVIDIA、多伦多大学和向量研究所推出的新型生成式视频模型，基于精确的相机控制和时空一致性生成高质量的 3D 视频内容。GEN3C构建基于点云的 3D 缓存指导，用输入图像或视频帧的深度估计反投影生成 3D 场景，根据用户提供的相机轨迹渲染 2D 视频，作为生成模型的条件输入。GEN3C 的核心优势在于精确控制相机运动，避免传统方法中因缺乏显式 3D 建模导致的不一致性问题。GEN3C支持从单视角到多视角的视频生成，适用于静态和动态场景，在稀疏视图的新型视图合成任务中取得了最先进的结果。GEN3C 支持 3D 编辑和复杂相机运动（如推拉镜头）的生成，为视频创作和模拟提供了强大的工具。