2 min read

腾讯Voyager:自动化视频生成迈入新纪元,算力与许可限制并存

腾讯Voyager:自动化视频生成迈入新纪元,算力与许可限制并存

腾讯近期发布了其Hunyuan生态下的新模型Voyager,该模型旨在通过自动化数据管道大幅提升视频生成效率。Voyager能够自动分析视频数据,处理摄像机运动并计算帧深度,无需人工标注即可处理海量视频素材,已处理超过10万个视频片段。此举标志着视频内容创作在自动化程度和效率上迈出了重要一步。

Voyager的训练与运行需要强大的计算资源,建议使用80GB GPU内存以获得最佳效果。腾讯已在Hugging Face上开源模型权重及代码,支持多GPU并行推理,可显著提升处理速度。然而,其许可协议限制了在欧盟、英国和韩国的使用,且服务月活用户超1亿的商业部署需额外授权,这为其全球推广带来一定挑战。

在由斯坦福大学制定的WorldScore基准测试中,Voyager取得了77.62的综合得分,在物体控制和风格一致性方面表现尤为突出。尽管其在摄像机控制方面略逊于竞争对手,但整体性能已属行业领先。高算力需求和对生成长、连贯“世界”的局限性,意味着基于此技术的实时交互体验尚需时日,但其自动化流程和优异表现,预示着生成式AI在多媒体内容创作领域正开启新的可能性。

查看消息来源

订阅情报