Grok Imagine:这个新的视频生成模型水平如何?  第1张

拼写有错误。最后,在浏览了大量生成的图像后,我终于找到了一张文字正确、感觉与我给出的提示相似的图片。

虽然我的提示里还有其他问题,但我没能在一个图片里找到。不过,我用来生成视频的图片做了一个相当有趣的梗。它发出的声音听起来就像两只猴子在争吵。总的来说,我喜欢这个视频——它很有趣,也达到了预期目的。

提示词:“A girl running through a dark alley, camera running with her, from the top, it starts to rain and she slips and looks back with fear, the last shot remains focused on her face, a cinematic shot.”

输出:

该工具提供了多种图像选项,但生成的视频并没有完全符合我的要求。虽然一开始效果很好——捕捉到了我要求的氛围和镜头——但随着视频的播放,质量明显下降。AI 生成的伪影变得明显,瑕疵也一目了然。

我怀疑模型表现不佳是因为我的任务包含多个复杂的请求。即便如此,音效还是恰到好处——完美匹配了场景的需求。

我对 Imagine 的看法褒贬不一。Imagine 最棒的两点是它的速度和生成的图像质量。在视频生成方面,我认为我们很快就会看到它变得更好。目前,该模型落后于 Sora 和 Veo 3 以及像 Hulileo 和 Wan 这样的中国模型,它们都是视频生成潜力的典范。

随着任务的详细程度越来越高,Imagine 的效果也会越来越好,所以在生成视频时一定要尽可能多地提供背景信息。目前生成的声音只是普通的声音;它们与生成的视频不太融合。

Imagine 是一个很棒的模型,但它还有很大的改进空间。鉴于它是 Grok 的第一个图像生成模型,我相信团队很快就会让它超越任何现有模型。目前,该模型表现良好,但鉴于市面上有如此多的先进视频生成模型,它确实感觉略显过时。

话虽如此,请继续尝试一下 Imagine。它非常适合快速片段和短视频来展示创意。而且,由于其相当灵活的速率限制,您可以用它真正创造出有意义的东西。