Vol.196 产业观察37|如何打通机器人与现实世界交互的"最后一厘米"? - 主题精读稿

Vol.196 产业观察37|如何打通机器人与现实世界交互的"最后一厘米"? - 主题精读稿

原始链接: https://www.xiaoyuzhoufm.com/episode/693a292637f52a644e4e0009 播客名称: 高能量 发布时间: 2025年12月11日


前言:灵巧手——具身智能的"最后一厘米" (00:00 - 03:00)

本期峰瑞资本产业观察邀请星际光年创始人魏德浩与峰瑞资本投资人颜黔杭,深入探讨灵巧手在人形机器人领域的核心价值与技术挑战。灵巧手是人形机器人与现实世界交互的关键环节,是迄今为止最好的、最通用的末端夹具。这场对话涵盖了从技术路线选择到商业落地、从创业心得到行业趋势的全方位洞察。


一、创业初心:从 AI 数字世界到物理世界的跨越 (00:03 - 06:00)

魏德浩从 2021 年开始研究灵巧手,至今已四年。他的创业动机源于一个核心洞察:AI 大模型的通用操作能力已在数字世界得到验证,但将其带入真实世界需要一个关键载体——灵巧手。

AlphaGo 战胜李世石、腾讯王者荣耀 AI 击败顶尖玩家,这些成就让魏德浩看到了 AI 的通用操作能力。马斯克所说的人形机器人是通用载体,而机器人若想真正与世界交互,离不开一双完美的手。然而,当时市场上并没有一个真正好用的灵巧手,这成为 AI 在物理世界应用的巨大障碍。

魏德浩在清华读研期间,自己一人从结构做硬件、做运控、做算法,具备了全栈工程能力。他创业的初心就是为具身智能时代打造一款真正好用的灵巧手,这个初心到今天也没有改变。

颜黔杭回忆第一次见到魏德浩的场景:去年五月,魏德浩还没毕业,在北京租了一个小房子,卧室里摆满了 CNC、3D 打印机和各种工程板,他自己在这个小房间里搭出了最早的原型机。这是一个经典的极客画像——动手能力很强、真的发自内心想改变世界的年轻人。

颜黔杭认为,中国每一次的创新都是有追求有理想的人推动的小变革逐渐累积起来的。魏德浩想用底层创新打破现有设计的僵局,将灵巧手的各项指标从"此消彼长"的瓶颈状态,变成"齐头并进、同步优化"的状态。


二、技术路线之争:为什么选择绳驱? (06:00 - 20:00)

2.1 四种技术路线的对比分析

魏德浩在 2021 年开始做灵巧手时,面临四种技术路线选择:

电驱方案(关节直驱):直接把电机塞进每个关节。优点是控制简单,缺点是在人手体积下能塞进关节的电机很小,扭矩和速度受限,无法媲美人手。

连杆传动方案:电机放在手掌,通过连杆带动关节。优点是手指可以做得纤细,缺点是刚性结构抗冲击性差,外界碰撞会直接传导到电机,容易损坏。要做到 15 自由度以上,手掌会非常厚。

人工肌肉方案:用新材料模拟人类肌肉,通过受热收缩或弯曲特性控制运动。这完全是实验室产品,技术成熟预计需要 15-20 年。

绳驱方案:从仿生学角度,人手的驱动肌肉大部分在小臂位置,通过肌腱连接到手指关节。绳驱是唯一能把速度、负载、体积、重量、精度同时拉到最高的方案,也是最接近人手的方案。

魏德浩坚定选择了绳驱方案,尽管这条路更难,当时做的人更少,而且极其不稳定。

2.2 绳驱的三大难题与解决方案

难题一:绳索寿命

灵巧手需要的绳索是一个综合性能很强的全新品类,既要抗断力特性,又要低蠕变、带一定弹性、耐磨。星际光年测试了全球约 30 种不同的绳索,包括极限运动绳索、跳伞伞线、钓鱼线等,发现没有一个是专为灵巧手设计的。最终自研了 PythonKable 绳索,将绳索寿命提升到 50 万甚至 80 万次

难题二:绳索蠕变

绳索长期使用会变长,影响控制精度和负载。之前的方案要么加额外电机张紧,要么手动拧紧,本质上都需要停机预紧。魏德浩设计了一个可自动张紧的结构,搭配自己写的运动算法,实现了使用过程中的自动张紧,解决了这个顽疾。

难题三:柔性并联绳驱机器人的控制问题

这需要算法与硬件的协同开发,是星际光年作为软硬件一体公司的核心优势。

2.3 投资人视角的技术路线判断

颜黔杭从投资角度解释了为什么看好绳驱:

首先明确目标:灵巧手要接近人一样灵巧,同时保证精度、负载、成本可控。

然后看成熟度:绳驱手更接近"从实验室走出来、到落地产品、到商业化"的过程,更符合投资节点。技术有问题,但不是科学问题,是工程问题。

关节电机的问题:要把电机做得特别小又性能很好,这本身就在挑战传统电机行业。

绳驱的成本优势:因为手上没有太多机械结构部件,可以做得非常轻,未来成本下降空间比关节电机更大。

颜黔杭坦言,行业很期待中国真的有一款好用、耐用、便宜的绳驱灵巧手面世,供具身智能研究人员使用。


三、灵巧手是"AI 定义的硬件" (27:00 - 35:00)

3.1 为什么灵巧手需要小脑模型

星际光年的使命是"推动具身智能通用操作,引领产业变革"。要推动具身操作落地,需要两件事:一是让 AI 具备通用能力,二是配合好的末端执行器。

世界上真正具备通用操作能力的,有且只有人的手。 灵巧手在物理意义上是唯一真正具备通用操作能力的末端夹具。同时,人手数据是最易得的——不管是海量互联网视频,还是采集人类动作数据,都是人手数据最丰富。

但问题来了:一个 15-20 主动自由度的灵巧手,买回来之后用户能干什么?传统机械臂可以写运动学模型,给定末端位置就能运动,但灵巧手不行。

灵巧手是人类历史上第一个用 AI 定义的硬件。 只出售硬件是不完整的,用户真的用不起来。星际光年要做的是软硬件一体的灵巧手操作平台,带有小脑模型,让用户拿到手就能做操作任务。

3.2 为什么 VLA 大模型不适合灵巧操作

魏德浩做过 VLA 大模型研究,指出一个 10B 的 VLA 大模型控制频率只有 3-10 赫兹,无法满足高实时性的灵巧操作需求。

举例:让灵巧手端咖啡,中途被人碰了一下。对人来说是分层控制,可能只传到脊髓就直接调整姿势。但 VLA 要把碰撞的视觉信息传回大脑、判断、再执行,300 毫秒到 1 秒就过去了,咖啡早就倒了。

除非发明全新范式,让 VLA 模型做到快速反应、轻量化、部署到端侧,否则按现在的 Transformer 架构都很慢。 所以今天所有 VLA 用在灵巧操作的,大部分都是把灵巧手编码成两指夹爪或做 Pick and Place,这限制了想象力。


四、数据采集的创新:内外骨骼双模态系统 (33:00 - 38:00)

操作模型离不开数据。魏德浩把数据采集系统分为两类:

遥操作:A 端到 B 端实时遥操机器人,采集的数据非常真实。但很慢——一个数据采集工人一天可能只能采集几百条数据。要达到亿级别数据规模,时间和人力成本极高。特点:准而不快。

数据手套:直接采人手数据,映射到灵巧手。一天可以采几千甚至上万条。但人手和灵巧手有差异,数据迁移有精度损失。特点:快而不准。

魏德浩发明了内外骨骼双模态数据采集系统,理念是"像幼儿园老师手把手教孩子写字一样,手把手教灵巧手做操作"。穿戴着灵巧手直接采集,一方面采到的是灵巧手自己的数据,另一方面又能做到人手采集的速度。又快又准。

这个方案 2021 年就提出了,最近斯坦福、MIT 的研究人员都在 follow 这套工作,做类似的内骨骼数据采集方案。


五、开源生态:降低门槛,养大行业 (37:00 - 45:00)

5.1 为什么做开源灵巧手

魏德浩在研究生期间没有可供 DIY 的灵巧手硬件,所有东西都要自己搭。他相信世界上一定有很多像他一样的极客,没有豪华实验室配备,但想做灵巧手研究。

星际光年开源了一款高自由度灵巧手方案,价格是市面同等自由度的五分之一,所有资料包括结构、上位机、软件全部开源。目的是让想做灵巧手的极客们都能很好地拿来开发。

5.2 开源对商业化的价值

颜黔杭认为,灵巧手处于很早期阶段,行业资料稀缺,入门门槛高。灵巧手第一步的商业化是给更多人研发具身智能操作,没必要维持高门槛,应该降低门槛吸引更多人进来。

先把生态养起来,再推动商业化。如果生态没起来就推动商业化,用户就这么少,商业化天花板不够高。

非灵巧手研究方向的科研人员,如果对具身操作感兴趣,有了好的学习资料和开源材料后,就能快速入门,根据自己的想象力搭建不同类型的灵巧手。


六、软硬件一体化:灵巧手的终极壁垒 (39:00 - 42:00)

颜黔杭被问及灵巧手的终极壁垒是机械设计、核心执行器性能还是感知与控制算法,他的回答是:最重要的是把算法与硬件的协同做好,即软硬件一体。

灵巧手不是单纯的硬件产品,后面的算法至关重要。算法做得好离不开硬件做得好,硬件往前推进又带着算法走,形成螺旋上升的局面才是终极壁垒

如果算法很强但不自己做硬件,用别人的硬件就会在算法突破时被局限;硬件很强但不做算法,又得等别人的算法做好。商业竞争唯快不破,软硬件一起抓才是核心的终极壁垒

峰瑞的投资风格是先投本体,再基于对本体进度的认知,回头寻找上游供应链的投资节点。他们希望人形机器人最终交付的不是只有硬件让用户自己琢磨,而是一个功能完善的产品——像一个聪明、身强力壮的年轻人,教他什么他就学什么,培训一下就能做任务、带来价值


七、应用场景:精细化操作的巨大市场 (45:00 - 50:00)

7.1 什么场景需要灵巧手

颜黔杭提出了思考框架:对照目前人去介入的事情来看。传统工业机器人能干好的事情,不需要回到人工方式;但很多场景是传统工业机器人干不了、必须人亲手做的,这就是灵巧手的市场

例如纺织行业,布料需要人手去做,目前没有好的自动化方案。各类原来很难用传统自动化替代、必须由人手亲自完成的任务,就是灵巧手成熟后要拓展的市场,不管工业还是消费端。

消费端的例子:用灵巧手替代人做奶茶。今天的方案是自动化流程,夹柄夹杯子、饮料倒过来,不是接近于人工作的状态。

工业端的例子:柔性装配。为什么大量工业装配线还需要流水线工人?像富士康手机组装,机器人做不了精细零部件组装,需要人去感觉"啪一下掐进去了"。这些场景慢慢会随着灵巧手的成熟,一步步渗透进去

7.2 现阶段的定位

目前高自由度灵巧手还没有完善的控制模型。当下最直接的商业用途是:各种想研究具身智能操作的人,买回去研究灵巧操作系统。让手去抓物品、弹钢琴、转核桃等。

应用爆发还比较早,需要两个条件:产品本身成熟,以及集成商能很好地用起灵巧手。现在处于打磨产品、陪伴早期科研客户和种子用户探索场景的阶段。


八、从极客到 CEO:创业者的成长 (48:00 - 58:00)

8.1 团队搭建是最难的一环

魏德浩坦言,团队搭建是创业以来最难的点。作为全栈工程师,他知道需要什么样的团队,但实际搭建过程经历了很长时间。有的人进来后发现基础站和期望不一样,有的技术栈确实需要但没招到,等人进来才恍然大悟原来需要这样的人。

8.2 CEO 的时间分配与战略思考

魏德浩从技术极客转型,很长一段时间还在自己打螺丝、写代码。后来他思考:公司是一个组织,每个人都是运转机器的一部分。CEO 的事情是找钱、做战略、定产品路径。

定战略最重要的是"不做什么",是拒绝。 这像热力学定律一样——公司创立过程中会不由自主把方向做多,看到什么都想做。但初创公司真正重要的只有一件事:商业模式。

8.3 颜黔杭对极客 CEO 的建议

极客转型的优势是解决问题能力强,对人才有很强吸引力。缺点是自己强了,容忍不了别人比自己弱。公司是整体,要把所有人有机组合起来发挥,人力资源利用率越高越好。

一个好的早期 CEO 的标准:战略定好、钱拿好、把钱花出去(主要花在人身上)、提高花在人身上的 ROI

颜黔杭观察到魏德浩从去年刚认识时的状态已经变化很大,这就是环境迫使你成长——如果不成长,环境就会给你教训


九、量产鸿沟与供应链管理 (55:00 - 62:00)

9.1 量产是必须跨过的坎

颜黔杭指出,量产是产品定型完善后必须面对的坎,所有硬件产品都会在这个坎上有教训。他能做的是提醒魏德浩知道这里有坎,让他踩坑时摔得轻一点。

三个核心挑战:

  1. 供应链管理:选什么供应商配合,选什么人做什么事。机加件要选谁做?又便宜又好,保证稳定交付。

  2. 零部件节奏配合:一个产品后面有几百个零部件,零部件之间的供应链节奏如何配合。

  3. 资金管理效率:做一个样机、做一百个交付产品、做一万个产品,资金损耗率不一样。东西越多,各种环节的损耗累积起来,非常考验企业整体管理能力。

9.2 当前的成本构成

灵巧手现在的成本 95% 以上花在:非标机加件、电机、电路板。

  • 所有件都不是标准件,没有模具,全是机加工
  • 电机没有标品,6mm/8mm/10mm/13mm 空心杯电机都是为灵巧手定制的非标件
  • 触觉传感器的板子也是非标,自己打样
  • 量不大,价格很高,供应商也是赔钱陪跑

9.3 耐用性的矛盾

灵巧手还在技术打磨阶段,做到很强的耐用性确实困难。硬件需要底蕴积累,需要时间。

耐用性和产品研发有本质矛盾:追求技术前沿探索,研发速度和迭代速度都很快,就找不到稳定版本做可靠性测试。停下来测试,研发进度就停了。魏德浩希望大家对灵巧手和类似的早期科技公司多一些理解。


十、中国具身智能的优势与短板 (64:00 - 68:00)

10.1 中国的优势:场景、客户、供应链

第一,有场景有客户。

第二,有供应链。 两方配合起来,迭代速度比美国快。

颜黔杭举例:在深圳华强北订个板子,晚上直接送到。如果创始人在美国,供应链在深圳,发现问题需要重新定做,漂洋过海十几天才能送到。所以波士顿动力、特斯拉、Figure 在前面研发,国内公司起步晚但追赶速度非常快。

10.2 美国的优势:前沿创新与资本支持

美国公司在前沿创新和资本支持上量更大。Figure 刚融了 10 亿美金。Physical Intelligence 以科研为导向,推出的模型相对较好并全部开源。OpenAI 和 Physical Intelligence 这样的公司虽然名义上是商业化公司,实际更像科研组织,在新方向探索上效率更高。

美国擅长从零到一,中国擅长把一做到一百、一千。

10.3 供应链瓶颈

灵巧手硬件层面没有太多卡脖子的地方。中国新能源和消费电子供应链已经非常成熟,电机、减速器、滚珠丝杠这些在传统行业里都是成熟品类,可以针对灵巧手需求赔钱配合做出来。

唯一的瓶颈是触觉传感器,这也是投资上另一个热点——大家既需要手,又需要手像人一样感知。


十一、融资节奏与行业周期 (69:00 - 75:00)

11.1 星际光年的融资历程

公司成立一年,完成了从天使轮到 Pre-A 轮的融资。融资热度随行业周期波动:

  • 2024 年四五月份:投资人刚投完一波人形机器人,开始关注灵巧手这个核心零部件
  • 到年底前稍微降温
  • 2025 年春节前后(宇树人形机器人上央视春晚):市场非常热,每天有五个以上投资人或 FA 来加微信
  • 六七月份之后又平淡,大家开始质疑"为什么要有灵巧手"
  • 最近大家重新认识到灵巧手的价值,尤其是绳驱的技术优势

11.2 峰瑞资本的机器人投资图谱

分为四块:

  1. 上游核心供应链:星际光年(高自由度绳驱灵巧手)、鹰翅机器人(6-十几自由度灵巧手,不同技术方案)
  2. AI+本体:逐际动力、竹节动力(人形本体)、元洛科技(具身大脑)
  3. 关键传感器:兆关(视觉)、航海微电子(力传感器)
  4. 下游应用场景:2017-18 年投了 Covariant(物流场景机器人智能化落地)

十二、灵巧手的未来:标配组件还是操作系统? (75:00 - 82:00)

12.1 灵巧手与操作系统的类比

魏德浩认为,操作系统执行的是从人端指令到机器端指令的映射,灵巧手执行的是从人的指令到物理世界指令的映射。前半段类似,可以通过语言识别实现;后半段——与人类的交互映射——是很大的技术难点,是小脑模型和灵巧手要突破的事情。某种程度上,星际光年确实想做连接物理交互世界和人类指令世界的"操作系统"。

12.2 五年内成为标配组件

颜黔杭预期,五年后大家就可以看到目标了。今天一个高自由度灵巧手四五万,通过量产成熟后降到几千元——就像早年的激光雷达和空气悬挂从贵价配置逐步下放。如果灵巧手几千元,对机器人总成本影响不大,成为标配不是什么大问题。

如果未来机器人定位是接近人类能力,就离不开跟人一样的灵巧手。二指三指只能做某些任务,更多任务做不了,机器人就被限制在具体场景里。我们有一个美好的理想:机器人买过来即插即用,教他什么他就会做什么。


十三、具身智能与人类劳动力 (78:00 - 83:00)

13.1 科技乐观派与悲观派

颜黔杭从科幻角度分析了两种情况:

  • 乐观派:机器人把人从重复且冗余的劳动中解放出来,人可以去做更多创造性且个人喜欢的事情
  • 悲观派:人的工作被抢了,机器人跟人抢面包吃

这是同一枚硬币的正反面。伦理边界本质上基于对人的安全和价值的保护。用机器人不是为了替代人,而是让人做更有创造性的事情,就像流水线从人参与变到机器参与,把人解放出来也是社会价值的进步。

13.2 魏德浩的观点

魏德浩持客观态度:这是不可避免的大趋势,就像当年淘宝引领线上购物对线下店的冲击,无法改变大势。

类比汽车替代马车:马车夫失业了,但汽车产生了新岗位——修理工、产线工人,促进了整个社会发展。具身智能也会替代一些行业,同时带来新岗位。

如果技术发展过快,替代可能像线上购物替代线下一样狂暴。社会需要抚慰和保障被替代的人的基本生活,相信政府和社会会有答案。

如果发展缓慢、有序,先替代危险场景和招不到人的岗位——这些岗位已经存在了——然后慢慢渗透,就不会对社会某个群体产生大冲击。缓慢有序的替代完全是好事。


十四、给具身智能创业者的建议 (81:00 - 83:00)

颜黔杭认为,最重要的是清晰认识到现在具身智能的边界和问题在哪。边界和问题意味着未解决的、悬而未决的挑战,这些都是创业者未来要争取的战场。

当你比别人更清楚地看清问题和边界在哪,你的战略准确度和创业想法就比别人更精准。 至于具体执行和技术研发,既然想创业,背后都有相应积累,不会空手而行。当大家都有资源和出发点后,方向就很重要。

找到要解决的对的问题,这是最核心的建议。


结语

这场对话呈现了灵巧手从技术原理到商业落地的完整图景。灵巧手是 AI 进入物理世界的关键载体,是"人类历史上第一个用 AI 定义的硬件",需要软硬件一体化的思路来打造终极壁垒。

绳驱方案虽然难度大,但上限最高、最接近人手。星际光年通过自研绳索、自动张紧结构、内外骨骼数据采集系统等创新,正在逐步解决工程问题。开源生态的构建将降低行业门槛,吸引更多人参与研发。

未来五年,高自由度灵巧手有望从四五万降到几千元,成为机器人的标配组件。那些传统自动化方案做不了、必须人手完成的任务——从纺织到柔性装配到做奶茶——都是灵巧手成熟后的巨大市场。

正如颜黔杭所说:这是难而正确但必须有人去做的事情。

目录与工具

从右向左滑动可关闭