04 Sep 2025 2 min read 人工智能

腾讯Voyager：自动化视频生成迈入新纪元，算力与许可限制并存

腾讯近期发布了其Hunyuan生态下的新模型Voyager，该模型旨在通过自动化数据管道大幅提升视频生成效率。Voyager能够自动分析视频数据，处理摄像机运动并计算帧深度，无需人工标注即可处理海量视频素材，已处理超过10万个视频片段。此举标志着视频内容创作在自动化程度和效率上迈出了重要一步。

Voyager的训练与运行需要强大的计算资源，建议使用80GB GPU内存以获得最佳效果。腾讯已在Hugging Face上开源模型权重及代码，支持多GPU并行推理，可显著提升处理速度。然而，其许可协议限制了在欧盟、英国和韩国的使用，且服务月活用户超1亿的商业部署需额外授权，这为其全球推广带来一定挑战。

在由斯坦福大学制定的WorldScore基准测试中，Voyager取得了77.62的综合得分，在物体控制和风格一致性方面表现尤为突出。尽管其在摄像机控制方面略逊于竞争对手，但整体性能已属行业领先。高算力需求和对生成长、连贯“世界”的局限性，意味着基于此技术的实时交互体验尚需时日，但其自动化流程和优异表现，预示着生成式AI在多媒体内容创作领域正开启新的可能性。

查看消息来源

订阅情报

推荐情报

开源间谍软件Stealerium自动化色情勒索，侵犯用户隐私新高度

Google Pixel 手机迎来 Material 3 Expressive 界面更新，强化个性化与互联体验

Apple Siri整合Gemini，语音助手AI升级战局重塑

瑞士发布开源大模型Apertus，对标Llama 3，强调合规与信任

Autodesk：AI浪潮下的坚固壁垒与增长引擎