开云体育 东说念主形机器东说念主量产元年,数据才是具身智能的“存一火线”

东说念主形机器东说念主想要走进千门万户,规模化正向轮回的数据体系,是不能或缺的一环。

撰文|张贺飞
裁剪|沈菲菲
淌若说 2025 年是东说念主形机器东说念主"学会走路"的一年,2026 年正被逼着"学会干活"。一个难过的践诺是:在舞台上,机器东说念主的行为一年期间里突飞大进;在生涯中,连把一杯水从餐桌端到茶几上,都作念不利索。
问题出在了哪?咱们在一场行业论坛上找到了谜底。
百度智能云行状群总裁沈抖的讲解是:数据是制约行业发展的中枢短板,具身智能尚未干预分娩生涯要领,数据未变陋习模化正向轮回,与自动驾驶的老练数据生态存在较大差距。
用一句话回来的话:并非仅仅算法不够好,还波及到训练数据够不够多、够不够广、够不够"真"。
- 01 -
数据的"含金量",才是确切的壁垒
每次谈及大模子时,"智能显露"的见地被频频提起:把互联网上的文本和图片喂给模子,智能就"显露"了。
在具身智能产业,访佛的逻辑却行欠亨。
文本、图片、视频等大宗是"公开数据",具身智能需要的是"任务级"和"经由级"的物理交互数据。比如需要让机器东说念主知说念一个苹果持在手里是什么触感、掉到地上会怎么鼎新、抓太轻会滑落、抓太重会捏破。

互联网上莫得这些数据,必须有东说念主在确切寰宇里手把手教,或者通过遥操作斥地"示范",代价是四个档次的数据逆境。
第一,圭臬缺失。
即使是并吞个抓取行为,由于传感器型号、要津扭矩精度、坐标界说模式的相反,数据之间互不兼容。遗弃是"行业穷乏统一的数据神志圭臬与元数据表率,数据无法跨企业、跨平台复用。"
就像是战国期间的翰墨,每个诸侯国的"字"都差未几,即是莫得统一圭臬、彼此无法互通。
第二,蚁集资本腾贵。
真机遥操作蚁集是行业公认质地最高的决策,操作员衣服上动捕斥地和力响应手套,手把手带着机器东说念主完成每一个行为。单小时灵验数据的资本可高达数千元,且操作员上手门槛极高。
好比是让一个大学西宾去给幼儿园小孩一双一指引,成果是好,但效力太低,简直无法令模化。
第三,传统标注模式不适用。
以前标注一张图是"猫"照旧"狗",或者在自动驾驶的 2D 视频画面里画个框,属于平面视觉的范围。
但三维寰宇的交互,波及力觉响应、触觉感知、6D 开脱度姿态,以及对物理法令的调处。单单是标注一个"提起水杯"的行为,就需要同步记载视觉、力觉、要津角度、战斗点压力散布等多路信号。
第四,Sim2Real的鸿沟。
在仿真环境中训练出来的机器东说念主战术,移动到确切寰宇时常时"水土挣扎":光照稍稍变了少许,物体摆放位置和训练时不雷同,摩擦力、弹性质感与仿真参数有幽微偏差……任何一个狭窄相反都可能导致整个这个词操作失败。
最终影响模子泛化性的身分,不仅仅"有没罕有据"的问题,还牵涉到"数据够不够真"。
参考自动驾驶行业的前例,东说念主形机器东说念主想要走进千门万户,规模化正向轮回的数据体系,是不能或缺的一环。
与之相对应的,包括乐聚机器东说念主在内的企业纷繁以生态合营的模式填补数据短板,冉冉变成了一套体系化的数据生成才能,不错领路看到一个完整的三层结构:
第一层是基础设施层:制造身体和训练大脑才能。
一端是与东方精工结伙打造的万台级东说念主形机器东说念主产线,处分"身体"的规模化分娩;另一端是机器东说念主训练场,延续生成高质地交互数据,构建"数据大脑"。
第二层是中枢期间层:"中枢零部件 + OS + 大脑"。
通过投资和结伙布局,买通了一体化要津、电机、颖异手、数据平台、具身大脑与操作系统等枢纽要领,把往日区别在产业链各处的才能,管制为可协同的系统才能。
第三层是"场景运用层":场景落地收罗。
在工业与劳动场景中,与中国一汽、海晨股份等合营伙伴伸开探索,让机器东说念主在确切分娩环境中握住"回流数据",变成闭环。
仅仅彼时业界的驻扎力还鸠合在"东说念主形"的形态上,对数据的盘问尚未成为行业的主要议题。
- 02 -
行业正在转向:从"造机器"到"养数据"
干预 2026 年后,东说念主形机器东说念主在台前"上演式炫技"的同期,越来越多东说念主初始念念考——怎么才能走向实用?
谜底无不指向了数据。
特斯拉的念念路是通过统一的 AI 架构,将全 FSD 的齐集推广至具身智能领域,让东说念主形机器东说念主 Optimus 无需从零初始设立"寰宇模子",开云kaiyun体育app入口登录官网不错复用 FSD 的老练管线,终了从说念路到空间场景的移动学习。
国内厂商也在加快补数据的短板,比如乐聚机器东说念主在 4 月 28 日发布的"数据蚁集训练场 2.0 "。
淌若说传统 AI 像"应考汲引",训练收场就定型;"数据蚁集训练场 2.0 "既像是一个学习各样手段的"修养汲引学校",又像是一个培训实习的"工场",让机器东说念主在各行业讲求"上岗"前,先学习、熟谙各种手段。
大模子之是以在两三年内终了质的飞跃,不是某一家公司理智,而是千里淀了二十多年的文本和图像等着被训练。而具身智能简直莫得存量的物理数据,必须一帧一帧地蚁集。
在"数据从那儿来,智能就从那儿显露"的铁律下,数据量能够达到"智能显露"的前提,是有东说念主先把数据蚁集的"基础设施"建起来。乐聚机器东说念主的"数据蚁集训练场 2.0 ",饰演的恰是"养数据"的变装。
实在地说是三个档次的数据:
一是轮臂操作,通过VR+全身增量遥操作,笼罩抓、拿、放等高频圭臬行为,闲静规模化活水线功课。
轮臂机器东说念主亦然现时离生意落地最近的一条旅途,场景敬佩、行为圭臬化、容错空间相对大,数据蚁集难度也相对可控,操作员通过 VR 头盔和手柄遥控机器东说念主,不需要全身复杂的动捕斥地。
二是颖异手操作,搭载触觉颖异手与腕部六维力传感器,聚焦捏、扣、持等五指风雅交互,对准的是复杂手眼协同。
东说念主类手指有越过 20 个开脱度,一个简单的"旋开瓶盖 " 行为,就波及到指尖抓持力说念的微调、手腕旋转角度的及时修正、视觉响应的闭环调节,数据蚁集难度指数级飞腾,需要动捕手套 + 力响应 + 高清视觉的多路同步。

三是全尺寸东说念主形操作,整合了搬、蹲、走等大范围拟东说念主功课,终领路多要津协同与全向出动扫尾。
东说念主形机器东说念主是数据需求最"贪心"的一条旅途:全身 40 多个开脱度同期畅通,每一步都涵盖重点均衡、步态斟酌、环境感知等协同,独一低资本、高效力生成高质地、各样化的数据,才能设立起恒久壁垒。
需要诠释的是,现在"莫得哪一条是完好的期间阶梯"。遥操作质地高但资本贵,便携蚁集规模大但不够风雅,仿真数据低廉却不够确切,三条阶梯谁也替代不了谁,适用于不同的场景、不同的阶段。
2023 年乐聚提倡生态计较的见地,标的越过明确——从"自建才能"走向"怒放才能",第一阶段的中枢是搭建基础设施层和中枢期间层,第二阶段是场景运用层。
当本色、数据、大小脑、场景四个中枢要素买通明,下一步不再是单点蹂躏,而是通过生态放大——即是现在正在开展的第三阶段,面向行业招募二次开发合营伙伴。同期也意味着,在乐聚基础设施还是搭建老练的基础上,生意化将全面提速。
往日,东说念主形机器东说念主企业更像是"整机厂",需要我方处分简直整个问题;而在生态化阶段,更像一个"平台公司",向外输出圭臬、器具链与基础才能,让合营伙伴在不同场景中完成"终末一公里"。
借用行业内的一个乐不雅的判断:跟着越来越多的机器东说念主团队正在从"造机器"转向"养数据",展望 2027 年数据量将越过 1000 万小时,东说念主形机器东说念主的" ChatGPT 时刻 " 可能在两年后到来。
- 03 -
写在终末
乐聚机器东说念主与东方精工结伙打造的国内首条万台级东说念主形机器东说念主自动化产线已在广东佛山启用;特斯拉 Optimus 计较 2026 年中终了月产 1 万台 ......
2026 年是具身智能的量产元年,也注定是直面生意化的一年。至少乐聚机器东说念主在内的中国企业,还是在市集爆发前夕把居品打磨老练、把圭臬制定显着、把数据短板补皆,为量产提前铺好了路。
或者在不久,咱们再评估一台东说念主形机器东说念主有多先进时,不再是咋舌于它能翻多高的跟头、跳多酷的街舞,而是像一个确切的伙伴那样,步伐牢固地走到你眼前,稳稳地递上一杯咖啡。
保举阅读
《华为联手南边病院重构医疗 AI 新范式》
《打造"龙虾军团"必须跨过四说念"存一火坎"》
《炸药味实足的智驾赛说念》
《硅谷在"造墙",中国在"修路"》
点"保举"开云体育,变好意思瞻念哦。
开云体育·(KAIYUN SPORTS)官方网站