Lightricks 公司宣布推出其最新的 AI 视频生成模型 ——LTXV-13B。这款拥有130亿参数的模型在生成高质量 AI 视频方面速度提升了30倍,并且能够在普通消费级硬件上运行,而无需昂贵的企业级 GPU。  

QQ_1746590080454.png

LTXV-13B 的核心技术是 “多尺度渲染”,这一创新方法显著提高了视频生成的效率。通过逐层生成视频细节,创作者能够在标准的桌面计算机和高端笔记本上制作专业品质的 AI 视频。Lightricks 的联合创始人兼首席执行官 Zeev Farbman 表示:“我们的用户现在可以以更高的质量和一致性创作内容,并且能够更好地控制整个过程。”  

AI 视频生成面临的一个主要挑战是巨大的计算需求。许多公司如 Runway、Pika 和 Luma 等的模型通常需要在云端运行,并依赖于配备80GB 以上显存的多台企业级 GPU,导致普通用户很难在本地进行部署。Farbman 指出,LTXV-13B 能够在消费级 GPU 上有效运行,使得高质量视频生成不再是少数人的特权。  

多尺度渲染的创新使得 LTXV-13B 能够逐步生成细节,首先在粗糙的网格上创建场景的粗略概览,然后将场景分成多个小块,并逐步填充更多细节。这种方法类似于艺术家从草图到精细绘制的过程。此外,该模型采用了更压缩的潜在空间,降低了内存需求,同时保持了视频质量。  

与许多领先的 AI 模型不同,Lightricks 选择将 LTXV-13B 完全开源,用户可以在 Hugging Face 和 GitHub 上访问。这一举措旨在加速研究和改进,鼓励学术界和开发者使用该模型。Farbman 表示,与 Getty Images 和 Shutterstock 的合作,Lightricks 可以合法获取训练所需的内容,降低版权风险,增强商业应用的合法性。  

QQ_1746590053161.png

为了支持初创企业,Lightricks 还决定将 LTXV-13B 免费授权给年收入低于1000万美元的公司。这一策略旨在建立一个开发者和公司社区,以展示该模型的价值。Farbman 表示,尽管 LTXV-13B 在技术上取得了显著进步,AI 视频生成仍然有局限性,目前仍未能达到好莱坞电影的水平,但在动画等领域有着广泛的应用前景。  

LTXV-13B 现已作为开源版本发布,并将在 Lightricks 的创意应用中得到应用,包括其旗舰讲故事平台 LTX Studio。  

项目:https://huggingface.co/Lightricks/LTX-Video

划重点:  

🎥 Lightricks 推出的 LTXV-13B 模型能在普通硬件上生成高质量视频,速度提升30倍。  

🔍 新模型采用 “多尺度渲染” 技术,逐步生成视频细节,提高效率。  

🤝 Lightricks 将 LTXV-13B 开源,并免费授权给年收入低于1000万美元的初创企业。