一张图秒变三维世界 灵光App移动端率先实现
蚂蚁灵光App率先在移动端推出世界模型,赋能AI沉浸式体验
蚂蚁灵光App于4月27日正式上线了“体验世界模型”功能,标志着其成为业界首个在移动端实现世界模型体验的AGI产品。该功能允许用户通过上传一张图片,即可在手机上以第一人称视角,像操作手机游戏一样,最长60秒内操控视角在AI生成的3D世界中自由探索。从指令发出到3D世界的生成与探索,整个过程仅需秒级,实现了端侧世界模型的实时交互体验,并能维持分钟级的长时一致性,这在AGI产品领域具有开创性意义。
世界模型被认为是通往通用人工智能(AGI)的关键路径之一,它能够搭建起数字世界与物理世界之间的桥梁。此次灵光App接入的是蚂蚁灵波LingBot-World-Fast世界模型,该模型也已实现开源。用户只需在灵光App对话框上传图片,或直接输入“帮我用第一人称视角探索这个世界”等自然语言指令,系统便能自动启动世界模型生成流程。

(图说:手机上打开灵光APP,点击左下角「➕」号上传图片,点击「生成图中世界」,即可体验世界模型)
为适应移动端用户的使用习惯,灵光App在体验页面创新性地引入了手游摇杆操控方式。左侧摇杆负责控制角色在3D场景中的位移,右侧摇杆则用于视角旋转,用户可以全方位地观察和探索AI即时生成的3D世界。这种操控逻辑与主流3D手游高度一致,用户无需额外学习即可快速上手,实现了“零门槛沉浸式”体验。
将世界模型部署至移动端一直是行业内的巨大挑战,主要在于其庞大的算力需求、控制延迟的难度以及终端性能的差异化。灵光团队通过采用高效、低延迟的流式传输技术,成功将响应延迟控制在百毫秒级别,从而实现了用户指令发出后秒级即可启动3D探索,打破了世界模型“高门槛、高算力、难落地”的固有印象。
此次“体验世界模型”功能的推出,是灵光在不断探索智能边界上的又一实践。此前,灵光App已上线“闪应用”功能,允许用户通过自然语言在30秒内生成应用,将专业开发者的编程能力普惠化。灵光App希望通过持续创新,挖掘用户潜在需求,为所有人带来更优质的AI体验。
该功能目前已在各大应用商店上线的灵光App中提供直接体验。
此次灵光App世界模型的移动端落地,对于普通用户而言,意味着AI交互方式的进一步简化和娱乐化,大幅降低了体验前沿AI技术的门槛,其手游化的操作也极大地提升了用户粘性和趣味性。