关于ZAKER Skills 合作
钛媒体 4小时前

婴儿期的自变量上门保姆应该“ 0 元购”

文 | 市象,作者 | 景行,编辑 | 古廿

" 压榨也是越来越狠了。"

某机构机器人数据采集员李华(化名)对「市象」表示,在数据采集领域,甲方一直在试图增加有效采集时长,以追求用更低的成本提升数据获取量,给到新岗位的工资也在走低。

李华所在的机构,起初对采集员的要求是每日提供 4 个小时有效数据,时间自由分配,累了可以休息,但每日红线不能少。

但目前,企业已将数据时长要求提高到 5 个小时,据说正在考虑再提升到 6 个小时。

这份来自一线从业人员的观察,能从侧面印证具身智能创业公司在数据维度,是如何焦虑、追赶,生怕落后于人。

5 月 25 日,自变量机器人发布公告,公司率先在国内推动机器人常驻家庭真实应用。具体做法是,由志愿者提出申请,自变量提供搭载 WALL-B 世界统一模型的全新机器人进入这些家庭,开展家政工作。

此前,自变量还与 58 同城合作发布 149 元 3 小时智能保洁服务,由家政阿姨、自变量机器人、工程师三方协作完成上门保洁。

但服务本身遭遇了舆论风波,有消费者评价称,机器人的工作效率远不及人工,且过程中依赖人工监督。

有业内人士评价:目前多少是不具备实际消费价值的,多数消费者还是尝鲜心理,企业可能更看重保洁过程中的数据。

因此在具身智能圈子里,还有一个调侃是:如果企业更需要机器人上门,那这 149 元是不是应该付给愿意让机器人上门的家庭。毕竟占用了 3 个小时的家庭空间,酒店钟点房也差不多是这个价格。

从上门到驻家这还远远不够,近期自变量还在公开招募 UMI&EGO 采集项目供应商,背后是整个具身智能行业的数据饥渴症。

绕不开的数据荒

极度饥渴,这是整个具身智能行业对训练数据的真实态度。

" 自动驾驶需要约 100 亿英里的训练数据。" 在今年年初的发言中,特斯拉 CEO 马斯克如此表述。理由是,只有积累足够庞大的数据量,才能覆盖更多极端场景,实现全无人的完整自动驾驶。

自变量对此的观点相近。在公开表述中自变量提到,人类从婴儿时期迈出的第一步也是走得很慢,经常犯错,每一个伟大的旅程,都是从踉踉跄跄的第一步开始。

具身智能模型的主流训练方法是模仿学习,即采集员使用带有传感器的夹爪,反复进行同一个动作,并将每一个关节的运动数据加以记录。

无论是佩戴摄像头进行劳动,所产出的第一视角视频,还是传感器数据,都意味着谁能更快以更低成本拿到天文数字的数据量,谁就能在具身智能的竞赛中占得先机。

在业内,雇佣大量数据采集员进行标准劳作,以供给数据训练,这成为行业的通行做法。

京东已在宿迁搭建全国首个具身智能数据采集社区,让采集员头戴设备干家务,或在工厂里裁剪服装;特斯拉要求采集员戴好 5 颗摄像头,每天用 8 个小时在实验室拿杯子、擦桌子、拉窗帘,在工厂的传送带上工作。

在此方面,自变量花的心思要更多。

在与 58 同城合作开展的保洁套餐活动中,自变量选择了 " 加量少加价 " 的打法。

「市象」粗略检索 58 同城保洁服务发现,下沉市场(三线及以下城市)价格约为 44.86 元每小时起,一线城市约为 45.59 元至 46.56 元每小时起。相比之下,自变量的机器人服务定价要略高于常规保洁服务市场价。

尽管对自变量来说,149 元 3 小时的价格,远远不及机器人测试成本与工程师的人力成本。但对消费者而言,现阶段的机器人家政难以体现实际价值,更多是花钱买个热闹。

这也是博主体验套餐发表 " 动作慢、声音大、专人陪跑 " 的吐槽后,官方第一时间发文回应,承认机器人比人笨难以避免的原因所在。

另一层是,消费者贡献家庭场景,为自变量的数据采集添砖加瓦,不仅拿不到报酬,还要为此额外付费。

李华向「市象」介绍了数据采集背后的企业成本重压——动辄 30 万元以上的机器人价格,加上 200 元以上每天的采集员人力成本。即便抛弃机器人本体,采用附带高精度传感器的夹爪训练,单人一天采集的数据也只有 500 条左右。

想要进一步增产,必须扩大产能,其中训练场地、高精度采集设备、采集人员缺一不可。

而受限于训练场地、采集设备的高昂成本,具身智能企业率先思考的,往往是在采集人员身上做文章。这也是为什么,李华的每日有效数据时长要从 4 个小时扩展到 6 个小时。

同时企业不得不想方设法广开财源,解决采集模式的持续性问题。" 公司不仅在招人做采集,还一边卖采集设备,一边销售采集数据,客户一拨拨的来。" 李华表示。

同时,能给到采集员的待遇也在走低。李华表示,采集员的工作内容,就是拿起一个机械夹剥开水果皮、叠好衣物,从业门槛只需大专及以上,所谓的上岗面试,只是初步熟悉工作内容。

这在业内早已是常态。「市象」整理发现,市面大量数据采集员岗位不要求全职,对工作时间与工作时段也不作要求,20 元的时薪随处可见。

尽管大部分岗位标榜高科技环境,简单轻松,但仍然被求职者冠以 " 赛博流水线 " 的称谓。

李华表示,这份工作胜在简单明了无需思考,可以边听音乐边干,但时间一长,肩膀和手腕显著酸痛,大部分求职者都是看一眼就离开。

省钱才是驻家机器人的关键?

从家政上门服务,到走进志愿者家庭成为新的家庭成员,自变量的数据采集方案迭代,核心不在于 " 见世面 ",而是人力成本的大幅下降。

为确保不打扰用户生活,自变量 CEO 王潜给出了严格的隐私保护政策,如原始图像打码,用户同意后设备才开机,设备全程不向第三方共享。

自变量表示,对于具身智能而言,要见更大的世面,核心不再更大的算力集群,不在更 SOTA 的模型,而在生活日常中。

这一判断基于现实考量。当今时代,机器人的硬件能力早已完善,匮乏的是应对小概率场景的智能性。

在公开演讲中,自变量联合创始人兼 CTO 王昊将实验室固定环境训练的数据称为糖水数据,将真实家庭环境中复杂、充满随机性的数据称为牛奶数据。

前者稳定可控,但缺少对真实世界的认知能力;后者采集成本更加昂贵,但具备对物理环境随机性的应对底气。

上门家政的业态中,自变量采用的是一人一机,现场管理;但在驻家工作后,陪同安全员的工作被完全取代。

从专人现场监督,到后台工程师监督,从全程管理走向长尾管理,一切如 Robotaxi 故事。

有无人车从业者对「市象」表示,相较安全员模式,后台监督可以大大节约人力:" 上路后,几个维修人员定期查看车辆即可,跟着导航走就没问题,有极少数情况出现事故,派人去现场就行。"

在 Robotaxi 跨过成本拐点的历史进程中,这是相当重要的一环。

以百度萝卜快跑为例,2024 年百度宣布,萝卜快跑每单服务成本首次低于传统网约车,验证了 Robotaxi 的商业逻辑。

三个事件共同促成了这一商业模式的成立,分别是硬件成本,人力成本与规模效益:

其一是车辆成本跳崖式下降。从第五代车 Apollo Moon 到第六代 Apollo RT6,萝卜快跑整车成本从 48 万元骤降至 20.46 万元。

背后是核心传感器的价格跳水。借助禾赛科技等厂商的传感器,萝卜快跑能以几千元的价格替代早期的昂贵进口雷达。

其二是安全员的减配。早期的主驾安全员得以尽数退场,让车辆实现独立上路,而不需要在复杂路况下人工接管,驾驶模式变成云端监控。

其三是全天运营的效率质变,同时也是人力减配的副产品。在武汉,数千台 RT6 的运营昼夜不息,24 小时运营 + 品牌认知度提升,令萝卜快跑在单个区域产生巨大的规模效益。

回看自变量机器人,它要解决的问题要更复杂。

相较售价 9.9 万元起,主攻运动场景,以关节电机为主要硬件成本的宇树 G1,主攻家政方向的自变量需要更高的双臂自由度、细致性更强的机械手。

更关键的在于,要深入到服务场景中,完成更精细的环境理解与操作,自变量选择大力投入 WALL 系列大模型研发,并在传感器、计算平台等 " 大脑 " 维度大力下成本。

以自变量 Quanta X2 量子 2 号为例,仅传感器体系,就搭载有一个 2D 激光雷达(构建地图)、4 个超声波传感器(近距离避障)、一个 RGBD 相机(物体识别)、一个 3D-TOF 相机(中距离环境感知)、一个单点 TOF(补充测距)、一个红外传感器(辅助感应)。

反观宇树 G1,感知系统仅 LIVOX MID360 3D 激光雷达与 Intel RealSense D435i 深度相机两个核心传感器。

自变量机器人需要更多的感知能力以适应精细环境的工作,并支付更高的 BOM 成本。同时也面临使用寿命与迭代速度的压力。企业需要将机器人成本压至极低,以保证购入家务机器人的家庭,在成本上打赢人工服务。

这意味着,自变量的入家梦,是一场与时间的赛跑。

在零部件成本下降之前,自变量都无力回答一个核心问题,如何在成本战中赢下人工队,让用户确信,自己不是为企业花钱打数据工。

(文中人物为化名。)

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容

企业资讯

查看更多内容