蚂蚁数科AoE框架:低成本轻量化方案破解具身数据采集难题

   发布时间:2026-03-03 18:03 作者:苏婉清

具身智能领域迎来一项关键技术进展——蚂蚁数科天玑实验室团队开发的AoE持续性第一人称视频采集框架,成功攻克了低成本、规模化数据采集难题。该方案通过“手机+颈挂式支架”的轻量化组合,将传统需要数万美元的专业设备成本压缩至20美元以内,为具身智能训练提供了可复制的解决方案。相关技术论文已在国际学术平台Arxiv公开,标志着数据采集环节的技术壁垒被实质性突破。

技术核心在于将人体自然交互过程转化为标准化数据源。团队设计的颈挂式支架采用人体工学结构,通过磁吸与机械夹具双重固定方式,确保手机在胸前稳定采集第一视角画面。这种设计不仅支持毫米级轨迹追踪,还能保持90%以上的手部关键点识别精度。实验数据显示,在Unitree G1机器人执行关电脑任务中,仅需200条AoE采集的数据,即可将操作成功率从45%提升至95%,显著优于传统遥操作数据的训练效果。

针对长视频处理难题,研究团队构建了端云协同的自动化流水线。端侧轻量级视觉模型可实时识别手物交互行为并触发精准录制,大语言-视觉融合模型则将连续视频切割为带语义标签的原子动作片段。云端系统进一步完成自动标注、异常数据过滤等处理,最终生成可直接用于模型训练的结构化数据。这种处理方式使数千台设备并发采集成为可能,同时将人工干预环节减少80%以上。

该技术的产业化应用已进入快车道。AoE框架不仅解决了数据采集的“启动学习”问题,更通过标准化流程降低了AI训练门槛。以金融场景为例,某银行采用该方案后,柜员操作数据采集效率提升3倍,模型迭代周期缩短60%。这种低成本、高效率的数据生产模式,正在重塑具身智能的技术生态。

蚂蚁数科的技术布局呈现明显的产业导向特征。天玑实验室同步推进AI+数据、AI+安全、AI+金融等四大方向,其研发的企业级大模型产品即将面世。今年初成立的“大模型技术创新部”,已启动面向制造业、物流业的垂直领域模型开发,预计年内将落地5个以上行业解决方案。

 
 
更多>同类内容
全站最新
热门内容
本栏最新