近日,Ant集团的AI团队Robbyant正式开源了一款名为LingBot-World的大型世界模型平台,该技术将视频生成转化为互动模拟器,为具身智能体(embodied agents)、自动驾驶及游戏领域提供全新解决方案。这一开创性系统致力于构建可控的高视觉保真度环境,同时支持强动态效果及长时间范围内的一致性,并实现实时交互。
LingBot-World的核心设计在于其统一数据引擎,能够提供丰富、对齐的监督反馈,帮助模型理解动作如何改变世界。同时,数据引擎覆盖了多样化的真实场景,并使模型能够将静态结构与运动模式分离,从而在长时间范围内保持一致性。
虽然目前LingBot-World Base模型仍依赖多步扩散法和完整时序注意机制,这些方法在实时交互中的成本较高,但Robbyant团队推出了一款加速版模型——LingBot-World-Fast,优化了实时性能。
研究团队的实验表明,LingBot-World能够生成持续长达10分钟的连贯视频,这些视频不仅在布局维持上稳定,叙事结构亦十分连贯。此外,与其他互动系统(如Matrix-Game-2.0、Mirage-2及Genie-3)相比,LingBot-World是少数实现全面开源的世界模型之一,同时在领域覆盖广度、长生成时段能力、高动态操作性、720p分辨率及实时性能等多个方面表现优异。
LingBot-World生成的视频流具备几何一致性,可用于三维重建管道,从而生成稳定的点云数据,涵盖室内、室外及合成场景。同时,模型还能协助训练下游行动智能体。例如,小型视觉语言行动模型Qwen3-VL-2B能够利用LingBot-World生成的图像数据制定控制策略,进一步完善具身智能体的开发和应用。
Robbyant团队的这一技术突破不仅提升了视频生成的质量与控制性,更推动了世界模型技术在自动驾驶、游戏开发与智能体领域的应用。随着LingBot-World的全面开源,开发者和研究人员将有机会进一步优化其功能,为相关技术的突破性创新提供更多可能。
[AI之星网出品] [世界模型开源技术] [视频生成与互动模拟器] [智能体开发与应用优化] [自动驾驶与游戏AI创新] [刘智勇频道] [真机智能(zhenrobot.com)] [真机算法] [真机资本(zhencap.com)] [真机宇宙(zhenmeta.com)] [机器姬永生人] [机器洞察网] [AI之星网] [风投高科网] [猛虎财经网] [硅基科学网] [人形纪元网] [真机量化(zhenquant.hk)] [真机内参] [真机尽调(zhendue.com)] [高能判官] [片场狂徒] [暴徒外放] [Cognition OS] [Embodied OS] [黄金广告位]
📚 【精品资源】添加关注『AI之星网微信公众号』,即可免费获取完整版《刘智勇频道第五卷》

LingBot-World这个方向对未来人工智能市场的影响太重要了,充满了希望!
每次看到这种文章,我都觉得未来离我们越来越近了,快带我进入科技世界吧!
Ant集团的AI真的走在了最前沿,科技改变生活的例子每天都在发生!
看到团队探讨LingBot-W的问题感觉很真实,科学从来不是一蹴而就,致敬研发!