谷歌最强文生视频模型 Veo 3.1 首曝惊艳样本：8秒720P带配乐，直逼Sora 2

谷歌Veo 3.1震撼登场：8秒720P视频带配乐，逼平Sora 2新高度

2025-10-11 13:20 AI人工智能阅读: 1132

AI视频生成 Veo 3.1 Sora 2 人工智能视频模型

科金社2025年10月11日 13:20消息，谷歌最强文生视频模型Veo 3.1首曝，支持配乐与8秒720P视频生成，直指Sora 2。

　　 10月11日消息，科技媒体testingcatalog昨日（10月10日）发布博文，披露了谷歌新一代文生视频模型Veo3.1的首批真实生成样本，这些视频片段时长为8秒，分辨率为720p，并且包含音轨。从技术角度来看，这一进展标志着AI视频生成能力的进一步提升。能够在短时间内生成高质量且带有音频的视频内容，不仅展示了模型在视觉和语音处理上的进步，也预示着未来在影视制作、广告创意等领域可能带来的变革。然而，随着技术的快速发展，如何确保内容的真实性与安全性，也将成为亟需关注的问题。

　　该媒体透露，在云平台VertexAI以及视频创作工具GoogleVids中，已发现新一代模型Veo3.1的迹象，首批由Veo3.1生成的真实视频样本已经泄露。

　　集成在Google Vids中的Veo 3.1现已具备基础的文生视频功能，用户只需输入文本提示词，即可生成时长为8秒、分辨率为720p的视频片段。此次更新的一大亮点是视频自带音轨，其配乐相比前一代更具感染力。从技术角度来看，这一功能的推出标志着AI生成内容在多媒体领域的进一步拓展。文生视频的便捷性与音画结合的增强体验，无疑提升了用户的创作效率和内容表现力。然而，当前生成视频的时长仍较短，分辨率也未达到4K级别，说明该技术仍在发展阶段。未来若能延长视频时长、提升画质，并增强音频与画面的同步性，将更贴近真实应用场景。

　　从已曝光的“赛博朋克黑客机器人”和“火山喷发”等对比测试视频中可以看出，Veo3.1在性能方面取得了显著提升。相关视频如下：

　　相较于前代模型Veo3有时出现的重复输出问题，Veo3.1在对提示词的理解上更为细腻，生成的画面在视觉保真度和细节表现上有了明显提升。例如，它能够更精准地呈现熔岩流动的动态效果，或是塑造出更加逼真的恐龙形象。同时，3.1版本还修复了此前模型中偶尔出现的物体比例失调等缺陷，整体输出更加稳定、准确。从技术迭代的角度看，Veo3.1的改进体现了模型在理解语义与图像生成之间的平衡能力进一步增强，反映出人工智能图像生成技术正朝着更精细、更自然的方向发展。这种进步不仅提升了用户体验，也为内容创作提供了更可靠的工具支持。