发布日期:2026-02-19 21:05 点击次数:69

蚂鸠集团旗下具身智能公司蚂蚁灵波科技近日书记,其自主研发的LingBot-VLA具身大模子及后磨练代码已全面开源。该模子已与星海图、松灵、乐聚等机器东谈主厂商完成适配,考据了跨不同构型机器东谈主的搬动材干,为行业提供了可复用的时间框架。
在磨练效力方面,蚂蚁灵波科技构建的后磨练器用链发达凸起。在8卡GPU成立下,该器用链竣事单卡每秒处理261个样本的隐晦量,磨练效力较StarVLA、OpenPI等主流框架普及1.5至2.8倍,权贵镌汰了数据与算力本钱。这一冲突为大范畴模子磨练提供了更经济的处置决策。
基于海量的确宇宙数据的预磨练究诘,蚂蚁灵波科技初次系统探索了VLA模子性能随数据范畴增长的礼貌。履行败露,当预磨练数据从3000小时逐渐膨胀至20000小时,模子鄙人游任务的胜仗率捏续权贵普及。值得详确的是,即使数据量达到20000小时,模子性能仍未波及瓶颈,标明其仍具备通过加多数据量进一步普及性能的后劲。
为撑捏这一究诘,快乐彩app蚂蚁灵波科技构建了掩饰9种主流双臂机器东谈主构型的20000小时的确磨练数据集,包括AgileX Cobot Magic、Galaxea R1Pro等机型。在上海交通大学开源的GM-100具身评测基准测试中,LingBot-VLA在3个不同机器东谈主平台上的跨实质泛化平均胜仗率从13.0%普及至15.7%(无深度信息)。引入深度信息后,其空间感知材干进一步增强,平均胜仗率攀升至17.3%。
同时开源的LingBot-Depth空间感知模子聚焦的确场景的深度补全需求。该模子依托奥比中光Gemini 330系列双目3D相机进行数据网罗与考据,通过深度引擎芯片直出数据磨练优化,可将不完好意思、受噪声遏抑的深度传感器数据滚动为高质料三维测量欺压。履行标明,其在深度精度与像素掩饰率两项中枢想象上卓越业界顶级工业级深度相机,在NYUv2、ETH3D等基准测试中达到现时最优水平,并保捏视频级时间一致性。
{jz:field.toptypename/}现在,LingBot-Depth模子已通过奥比中光深度视觉履行室认证,在精度、踏实性及复杂场景适当性方面达到行业跳跃标准。这一效力为机器东谈主、自动驾驶汽车等智能终局提供了更精确的三维视觉处置决策,鼓吹了具身智能时间在的确场景中的落地诓骗。