一、张磊参加的是一场机器人采集数据的试岗培训
在北京五道口的一栋大楼里,全副武装的张磊(化名)正在慢慢把桌上的几个羽毛球挨个放进旁边的球筒里。
他头上戴着装有两个摄像头的黑色头盔,两个手腕各绑一个小型摄像机,五六根不同接口的数据线缠在腰上,手上戴的手套也布满传感器。
这看似是一件很简单的事情,但是他必须用正常速度一半的慢动作,且不能有任何多余动作,最好手也不要出汗。
因为过快或者多余的动作会让他采集的数据作废,手出汗则有可能浸湿手套,影响灵敏度。这双手套要5万元,弄坏了他可赔不起。
大学毕业两年,这是张磊做的第四份数据采集工作。
前三份工作里,他主要通过设备操控机器人本体,让机器人做出指定动作,再把数据留下来训练模型。
行业里把这种方式叫真机遥操。
第四份工作有些不同。这家公司没有机器人,只有自己研发的可穿戴采集设备。
采集员穿戴这些设备完成指定动作,就能采集人类手部、身体和第一视角视频数据,再提供给机器人公司、模型公司做训练。
“就是卖数据的。” 张磊替他们总结。
过去两三年,具身智能持续升温。但缺乏数据,成为了具身智能发展的关键瓶颈。
物理AI数据服务平台觅蜂科技董事长兼CEO姚卯青告诉「甲子光年」,具身智能模型要达到像GPT-3.5那样开箱即用的类人初步能力,大概需要一亿小时量级的数据。
目前全球有效的具身智能数据仅约几十万小时,中间还有2~3个数量级的差距。
这条巨大的数据缺口,正在催生一条新的产业链。
政府、国资平台、机器人公司、数据公司、采集设备公司、工厂、劳务中介,以及像张磊这样的年轻数采员,开始用资本、设备、场景、组织能力和身体劳动,为机器人搭建一座沉默的数据底座。
在机器人真正服务人类之前,越来越多普通人,先成了机器人的数据工人。
1、做数采的年轻人
张磊今年二十多岁,身高超过一米八,我们在那场放羽毛球的试岗培训上遇到他。当时,我们以普通面试者的身份参加了同一场试岗培训。
培训间隙,张磊会眯着细长的眼睛慢悠悠地跟身边人传授做数采的经验。在几十个参加培训的新人里,他是为数不多的老手。
他从2024年就开始做数据采集,当时他刚从一所“双非”本科院校毕业,读的是文科,毕业第一份工作在售楼处卖房。
他想多挣点钱,一位在科技园工作的亲戚告诉他人工智能更有发展前景,于是改行做了数据采集员。
那一年,国内人形机器人创业正热。多家头部企业宣布推出人形机器人。据IT桔子统计,2024年国内人形机器人领域共有56起融资,总金额超过50亿元。
张磊的第一份数据采集工作是在北京一家人形机器人初创企业,公司太小,名字他已经记不得了。
那家公司做双足机器人,当时技术还不够成熟,机器人走两步就容易摔倒。操控这样的机器人采数据,也有风险。
张磊特意给自己买了意外险,“就怕机器人抽风砸到我”。
此后,张磊在各个人形机器人公司之间辗转,先后在千寻、松灵都做过数据采集,接触了各种数据采集方式。
操纵机械臂的、头上戴VR设备的、脖子上挂摇杆的,都干了一遍。
这些都属于真机遥操,采集的数据精度高,成本也高,是过去两三年机器人数据采集的主要方式。
对张磊来说,这是一份能赚钱的工作。
他对工资算得很细:一天的底薪是200元,加班两小时能多赚80元,再算上交通补贴,能超过300元,如果上夜班还能再多100元。
他热衷于加班和上夜班,最多的时候一个月到手收入9000多元。每份工作的时间都不长,大多是临时工。
张磊觉得与其费功夫争取转正,不如去找下一份数采工作。
“就是想赚点快钱。” 张磊毫不讳言。
他觉得自己还年轻,正好可以适当“消耗”一下,“现在不变现的话,难道等自己老了?”
张磊说自己小时候家里穷,父母在河南农村种蔬菜大棚,养大他和哥哥两个儿子。
哥哥一路读到中科院计算机专业博士,今年即将毕业。张磊没那么擅长读书,但也想靠自己成家立业。
老家的商品房一套要40万元。他想趁年轻多攒点钱,以后和女朋友买房结婚。
他并不太考虑自己为机器人采集数据可能是在教机器人取代自己,他想的是赚几年数采的钱后就找个交五险一金的正式工作稳定下来。
尽管这份稳定的工作在哪里现在还不知道。
“反正近些年人工智能发展飞速,用人需求还挺大的,最起码这几年内都不愁。” 张磊说。
他更愁的是数据采集本身的枯燥。
二、采集员需要把同一个动作重复几百遍与几千遍
采集员需要把同一个动作重复几百遍、几千遍,动作还不能变形。张磊形容这份工作“无聊到头秃”。
他愿意干日结和周结,也是在给自己一个心理安慰:每天结算,至少还能感觉到自己正在赚钱。
除了张磊这样的临时工,也有在大型数据采集厂工作的年轻人。
00后李子豪(化名)是一家大型数采场的实习采集员,他即将从人工智能专业毕业。
不过,他就读的是河北一所二本师范院校,学校听起来和人工智能没有太大关系。
高考填报志愿时,他原本想报土木工程。毕竟在他成长的二十多年里,中国房地产快速发展,包工头们赚了不少钱。
“我觉得挺好的,当个包工头。” 李子豪小声嘟囔。
后来,家里花钱帮他找的志愿填报指导老师说,房地产已经不行了,未来是人工智能的时代。于是,他读了人工智能相关专业。
他入学那年是2022年,不久后ChatGPT横空出世,人工智能在学校里突然成了热门方向。仅他所在的一个班级,就有50多人。
但毕业之后,同学们并没有都从事人工智能相关工作。“去哪儿的都有,有的没有工作,现在还在家躺着呢。” 李子豪说。
他自己找到了这份数据采集工作,想先试一试。实际工作和他想象中人工智能的光鲜时髦相去甚远。
最近,他正在采集机器人夹三明治的动作数据:握着两个手柄,按规定轨迹把桌上的海绵三明治模型夹到盘子里。
操作时要注意两个机械夹爪不能碰到,动作不能偏移出摄像头范围之外。
操作一遍大概需要两三分钟。同样的动作,李子豪要重复700多遍,才能采够客户要求的数量。最近需求多,他和同事们周末也在加班。
机器人产业的未来感,落到这些年轻人身上,常常变成一种重复劳动。
1、大型
2、数采场:的科幻与现实
张磊和李子豪,分别站在机器人数据采集的两个阶段。
张磊最开始入行时,数据采集还更多是机器人公司自己的事。
创业公司买机器人、搭场景、招临时工,让采集员围着自家机器反复遥操,采回来的数据也主要供自己训练模型。
这是一种小规模、自用型、项目制的数据采集。
从张磊到李子豪,机器人数据采集完成了一次扩容:
2025年以来,各地政府和国资提供资金和土地,支持建设大型数据采集场,把它作为具身智能发展的基础设施。
据《中国经营报》统计,目前全国至少有15座规模较大的具身智能数据采集场。
除了北京、上海等一线城市,郑州、无锡、济南、绵阳等二三线城市也在建设,京津冀、长三角、珠三角及西南经济圈均有部署。
「甲子光年」在这里看到,占地近5000平方米的数据基地分成上下两层,搭建了家居、商超、工业等6大类30多个采集场景,部署机器人120多台。
北京人形具身数据负责人夏华林告诉「甲子光年」,目前这里一年的数据产能最高能达到十几万小时,可产出超过千万条任务级数据,主要来自真机采集。
这些数据大多按小时或任务条数出售,一小时售价500到1000元不等,客户主要是头部机器人企业和大模型公司。
除了卖数据,一些客户也会租用北京人形的场地,像租摊位一样租一个场景,把机器人推过来调试,北京人形按标准化流程提供支持。
北京人形成立于2023年,不仅采集数据,也造机器人、训练模型,是挂牌了“国家地方共建具身智能机器人创新中心”的“国家队”。
夏华林说,随着近两年各地都开始建设数据采集场,一些地方政府也会请他们去交流,提供建设、运营方面的支持,“政府也想带动就业、培养产业。”
在大型采集场里,数采员大多毕业于普通本科、大专或职业院校,基本都是00后,不少人是校招生。
90后赵建龙(化名)毕业于一所本科院校的软件工程专业。
毕业后,他先去了北京工作,2025年应聘到家乡二线城市的人形机器人训练场,做数据管理相关工作,负责对数采员采集的数据进行管理并向客户交付。
他工作的大楼里摆着一百多台人形机器人。赵建龙形容那是“机器人军团”。刚来工作时,看到那么多机器人,他兴奋喊到:“真牛啊!”
这家国企背景的训练场大约有90多名员工,80%都是数采员。这些数采员比赵建龙更年轻,有人因为喜欢高达,专门来做数采员。
赵建龙觉得在北京工作时房租贵、生活成本高。现在这份工作给了他回家乡圆技术梦的可能。
他在小红书开了账号,专门采集数据、训练机器人的日常,希望多认识些关注机器人的朋友一起交流。
“以后想在技术上更精进,我也想成为机器人大佬。” 赵建龙说。
“整个流程就相当于一个数据漏斗一样,可能你采了100个小时,漏斗筛选下来只有50个小时有效。” 这名负责人说。
具身智能数据采集需要走出数采场。
三、这套判断在行业里仍有争议
1、走出数采场
数采一定要依赖机器人本体吗?
2024年前后,学术界开始系统探索UMI、Ego等不依赖机器人本体的数据采集方式;到2025年下半年开始,这一路线开始在产业界明显升温。
Ego指人类第一视角视频。采集员通过头戴式摄像头,记录人眼所见的环境、物体和手部动作;
UMI指通用操作接口,常见形态是通过手持夹爪、数据手套等设备,采集人类手部操作轨迹。
这类方式的核心变化是:不再要求每一条数据都由机器人本体采集,而是让人穿戴设备,在真实场景中完成操作,再把这些动作转化为机器人模型可以学习的数据。
工厂的工人、超市的理货员、居家的宝妈,都可能同时成为戴着摄像头、数据手套的数采员,一边工作,一边为机器人采集数据。
张磊最新的一份数据采集工作——带着手套把羽毛球放到球桶里,就属于无本体采集方式,可以说他见证了数据采集技术路线的变迁。
过去两三年,VLA模型是机器人“大脑”的主要思路。
它把视觉、语言和动作结合起来,让机器人看见环境、理解任务、执行指令。
但VLA对真机数据依赖较强,需要遥控真机一对一采集每一帧操作数据。
一台机器人价值不菲,用来采集数据也有产能上限。真机遥操的天花板,成了机器人模型训练难以突破的瓶颈。
近期,英伟达首席研究科学家、具身自主研究团队负责人范麟熙(Jim Fan)在红杉AI Ascent 2026大会上提出,用WAM(世界动作模型)取代VLA模型,用UMI和Ego数据取代真机数据。
Jim Fan预测,未来一到两年,遥操占比会越来越低,接下来会出现大量针对不同机器人硬件、不同场景量身定制的数据穿戴设备。
最终,机器人的“主食”会变成人类第一视角视频。
这套判断在行业里仍有争议。更符合行业现实的说法是,无本体采集短期内很难完全替代真机遥操,尤其在高精度操作、复杂工业任务中,真机数据仍然不可替代。
但无本体采集至少打开了一种新的可能:
在数据缺口极大的情况下,用更低成本、更大规模、更真实的方式堆出一批基础数据,先提升模型对物理世界的泛化能力。
对于嗅觉灵敏的创业者来说,这已经足够。
一批从穿戴式数采设备切入的公司,开始搅动机器人数据产业链。
2、一副手套背后的新生意
2025年,在深圳和东莞创业的90后林成志接到一家美国公司的需求,对方希望他帮忙落地生产一批穿戴式数采设备。
林成志告诉「甲子光年」,这家美国公司的创始人是华人,产品已经设计好,但美国的制造成本太高,于是回到中国寻找合作伙伴。
这正是林成志擅长的事。
此前,他在大疆等消费硬件公司做了7年NPI开发,2024年开始自主创业,主要服务硬件初创公司做产品落地。
依托深圳、东莞一带的制造能力,这批数采设备在美国打样需要25天,到他手里只用了5天。
完成客户委托后,林成志看到了机会,开始自己下场做数采设备和数据采集。
为了提高采集精度,他放弃了业内流行的夹爪,改用更贴合人手的数据手套。
录制视频的头显设备上也增加了深度图功能,试图让平面视频变成三维图像。
张磊试岗培训的公司,也研发了自己的数采设备。
操着湖南口音的培训负责人介绍说,他们公司的穿戴式设备融合了UMI、Ego等多种技术。
除了固定在头上、手腕上的四个摄像头,采集员还要戴两副手套,分别采集手指关节数据和力度数据。
两副手套算下来价值接近10万元。一名采集员在培训结束后试图拽着手指摘下手套,负责人马上在旁边大喊:“不能使劲拽呀!”
这些娇贵的设备还不够成熟。
培训一开始光调试设备就花了大半个小时,中间卡了三四次。
硬件还要和映射手部动作的采集软件相连,软件一打开,里面那双3D的手会扭曲成各种诡异的角度,张磊需要一直平举双臂,等搭档一点点对照调整。
“太累了。” 终于能放下手臂摘掉设备时,张磊叫苦连连,抱怨设备不够智能。负责人在旁边不屑一顾:
“肯定没那么智能,等到那么智能的一天可能机器人已经开始服务人类了。”
行业头部公司和资本也在入场。
智元机器人旗下的觅蜂科技推出MEgo系列无本体数据采集设备,包含操作轨迹还原精度可达1毫米的数据采集夹爪和头部300°全景摄像头、腕部细节捕捉摄像头等。
2026年5月,这套设备首批量产发货。6月,觅蜂科技宣布完成新一轮数亿元天使+轮战略融资。
四、机器人连走路都还摇摇晃晃
起步更早的公司则感叹终于等到了自己的风口。
熊鹏航是灏存科技的创始人,他们从2016年就开始做手指关节角度数据采集的研发,目前推出了全身动捕设备、数据手套、高精度传感器等产品。
但十年前,机器人连走路都还摇摇晃晃,更谈不上重视手部动作。
刚从法国毕业回国创业时,熊鹏航跟投资人解释未来机器人会需要人类动作数据来训练,大部分人觉得他在讲科幻故事。
十年后,情况发生了变化。
熊鹏航告诉「甲子光年」,2026年一季度公司拿到超千台国内订单和数个海外头部客户的订单。
意大利一家机器人团队直接飞到灏存杭州总部,要当场验证他们数据手套的精度是不是真能做到0.001度。
“今年开始,很多客户找我们合作时决策周期明显缩短,有的从第一次接触到签约,只用了一两周的时间。” 熊鹏航说。
无本体采集看起来很轻:一副手套,一个头显,一段视频,一个动作。
但它背后是一门硬件生意。设备要足够便宜、足够稳定、足够容易佩戴,还要能把人类动作转化成机器人真正可用的数据。
这件事刚刚开始。
1、如何让更多人接纳新型数采
设备只是第一环。
林成志首先想到的是工厂。
他的父辈在东莞做了30多年小商品生产制造,积累了不少工厂资源。林成志组织起40多家工厂,把采集设备发放给工人佩戴,让工人一边工作一边采集数据。
采集重点是手部操作数据。采集完成后,再由林成志的团队进行清洗、标注,卖给人形机器人公司和模型公司。
他也根据客户需求设计生产采集设备,提供定制化采集服务。
但让工厂配合,并不容易。
林成志说,不少工厂主最初并不愿意开放生产线。尤其是给品牌做代工的工厂,生产线上的操作有保密要求。
并且,工人佩戴设备边工作边采集数据,也会影响工作效率。
对计件工来说,操作慢了会直接影响收入,工人自然会抗拒。
林成志于是去联系做自有品牌的工厂,并给工厂和工人提供补贴。根据场景不同,每小时补贴10元到40元不等。
一些态度开放的工厂开始愿意合作。
打动他们的重要原因是,工厂主希望在自家工厂采集的数据,未来能训练出更适合自己生产线的机器人,并优先到自己的工厂“上岗”,帮助降低用人成本、提升效率。
除了在工厂采集,林成志也鼓励工人下班后戴着设备回家,在做家务时采集数据。工人们乐意在下班后赚一份外快,很快招募到30多人居家采集。
觅蜂科技采用的则是加盟方式。
姚卯青介绍,他们发布了“蜂巢数据共创行动”,想吸引有零售、酒店、物流等不同场景的合作方,把这些场景开放出来做数据变现。
比如一个药店或者杂货店的老板,如果愿意合作,就可以把觅蜂的设备放到店里采集数据。
体量更大的互联网巨头,则直接用自己的场景和员工来采数据。
2026年3月,京东宣布将利用旗下丰富的业态场景,发动内部超10万名各类职业员工、外部50万各行业人员,开展“人类历史上规模最大的数据采集行动”。
当采集场景从园区和实验室扩散到工厂、社区和家庭,还有一个角色开始变得重要:
劳务中介
。
2、被机器人采集的人
佩戴设备后,还有各种要求。
在培训最后,负责人告诉台下的数采员:
这句话听起来很宏大。
居家采集的视频里,隐私如何保护?工厂生产线上的动作数据,权属归谁?采集员动作不合格,谁来判断,谁来承担成本?
中介抽成是否透明?不合格不结费,会不会引发新的劳动纠纷?
这些通过手套、头显和摄像头采回来的数据,到底能多大程度转化成机器人真实能力?
这些问题暂时还没有标准答案。

远见网
