超乎年龄的成熟,是不少人对杨丰瑜的第一印象。
这位出生于2000年的年轻人,本科毕业于密歇根大学,目前是耶鲁大学的博士。在求学期间,他发表了世界上最大的视触觉数据集Touch and Go,并提出了世界首个融合触觉的预训练多模态大模型UniTouch。
杨丰瑜的另一重身份,是具身智能企业UniX AI优理奇科技的创始人。在竞争激烈的具身智能赛道,这家2024年初成立的初创企业,发展速度令人瞩目。杨丰瑜形容,他们是“用半年时间走完同行1-2年的开发流程”。
不同于大多数以B端场景切入的具身智能玩家,UniX AI主要聚焦C端家庭场景,2024年7月,UniX AI推出了轮式双臂机器人Wanda。Wanda可以执行抓取柔性物体、洗衣服、擦桌子等操作,并能理解完成一定复杂度的长序列任务。8月,UniX AI携Wanda与另一款双足人形机器人Martian亮相2024世界机器人大会(WRC),稳定的产品及功能展示受到了业内的广泛关注 。
目前,UniX AI正在进行Wanda二代机升级,未来几个月将面向C端种子用户小批量交付。“尽管如今离家庭场景的通用泛化还有距离,但这是一个循序渐进的过程,必须先进入到实际应用场景中,收集高质量的数据,再持续迭代。”杨丰瑜表示。
杨丰瑜补充道,UniX AI在行业做到“后发先至”,得益于公司有一支非常成熟的团队,这支近百人的团队,集合了国内外顶尖技术专家,公司高管来自机器人、消费电子,汽车制造、物流、供应链等行业,在场景端具有丰富的商业化落地经验。此外,公司的触觉大模型UniTouch,极大提升了机器人训练效率,使公司保持快速的功能开发迭代。
据悉,UniX AI成立不久,就吸引了王贺升等国际知名机器人专家加入团队。一个初出茅庐的具身智能公司为何能快速聚拢一批资深行业专家?UniX AI的员工表示,一是看好具身智能赛道;二是对创始人、公司定位与规划的高度认同;三是公司团队组建与产品迭代速度很快。“创业唯快不破”,给了大家强烈的信心,这也是UniX AI逐渐吸引行业专家加入的原因。
在具身智能机器人千帆竞发的当下,杨丰瑜带领的团队,如何理解行业的发展未来,对公司有哪些战略规划,是否给业内带来新变革?以下是UniX AI创始人兼首席执行官杨丰瑜的回答。
创业邦:您为何选择在人形机器人赛道创业?
杨丰瑜:我本科在美国密歇根大学读计算机专业,对具身智能很感兴趣,当时就有创业的想法。我本人提出的UniTouch大模型是世界第一个包含触觉的多模态大模型,在机器人材料识别、非刚性物体抓取等精细操作方面,极大提升了人形机器人执行端的任务效率,给公司奠定了一些技术基础。
在需求端,近两年人工智能发展很快,但我发现尽管大模型解决了人类的部分信息处理、知识获取、艺术创作等上层需求,但却把底层繁重的家务活动留给了人类。如果不解决这一问题,大模型就不能真正地造福人类,这也是AI带来的一个市场机会。我大概去年有了创业的想法,今年上半年才真正把公司组建起来。
创业邦:为什么在今年创业?相对于去年成立的企业,今年会是更适合的时间点吗?
杨丰瑜:从技术角度,今年机器人大脑层面的技术已经趋向成熟,能进行任务理解及规划,这为人形机器人的发展创造了先决条件。而以小脑为核心的具身模型技术路径尚未定型,不同的方案理论上均有机会,整条赛道处在发展初期阶段。
从商业化落地角度,全球有近百家人形机器人公司,但商业化均未取得实质突破。我们本身是奔着落地去的,今年的环境相比起去年明显冷静了,这能让我们看得更清晰。而且经过去年的探索与积累,也能帮助我们站在先驱者的肩膀上进行商业化。
我们今年才成立,但是答卷已经交的很漂亮,今年的WRC上我们的机器人在长达五天的展示中,表现也比较稳定。明年行业的要求就是量产落地,对此我们也非常有信心。
创业邦:您为何选择回国创业?
杨丰瑜:全球AI看中美,中国在AI方面有深厚的技术底子以及相当积极的创业氛围,适合具身智能初创企业发展。此外,中国的终端应用市场庞大,无论是人口基数、工程人才数量、还是场景丰富度,都在全球领先。
在国内,还有自动驾驶等几轮AI技术浪潮的创业经验复用,可以给具身智能创业公司提供借鉴。最后,国内在汽车和机器人方面供应链完整成熟,制造优势领先。无论是从环境、市场、人才还是产业链完整度,都满足了具身智能初创企业的成长需求。
创业邦:如何理解国内前几轮AI技术浪潮创业带来的经验复用?
杨丰瑜:比较能借鉴的是自动驾驶。自动驾驶=AI(软件) 汽车(制造及终端) 驾驶(操作) 乘用/商用(场景),自动化程度划分为L0-L5。自动驾驶的整体技术栈和人形机器人趋同,难点也同样在于物理数据收集,也存在大量corner case(长尾场景),但人形机器人操作场景的复杂性和多样性要更高。
借鉴上一个自动驾驶周期,我们可以得到这些经验:
1.物理数据收集的难度和时间是限制,在短期单靠数据提升AI能力不太现实。
2.其次,纯软件的路径很难跑通,因为涉及和主机厂的复杂交互,以及数据层面的隔阂,导致模型优化受限。所以特斯拉、理想等主机厂自己下场做自动驾驶总体发展的相对较快。
3.创业公司要找准商业化场景,并和模型及数据优势匹配。例如乘用车和商用车作为两个场景门类跨度巨大,甚至商用车领域在矿山、港口、物流等场景也同样存在跨度,所以相关技术和经验无法进行复用。
4.做自动驾驶的成本很高,Uber和Waymo初期都过于依赖昂贵的传感器,导致硬件成本很高。因此,我们在做人形机器人时,要更加注重对算法的研究,以及通过自研硬件降低成本。
5.前期自动驾驶领域的商业化timeline过于乐观,资本市场过度追捧。后期自动驾驶发展乏力,导致市场的投资热情减退。我们会根据人形机器人发展的实际情况,制定小步快走的迭代方案,保证市场对于具身智能的新鲜感。
创业邦:目前公司团队情况如何?
杨丰瑜:我们坚持学术 产业深度结合,由技术创新和产业落地双轮驱动。
目前团队规模近100人,来自MIT、哈佛大学、密歇根大学、加利福尼亚大学、北京大学等顶级院校,以及华为、比亚迪、大疆创新、科沃斯等知名企业。团队研究领域覆盖了结构、电子、算法、深度学习等领域,在机器人操作算法、感知技术、远程操控等方面拥有丰富经验。我们还将继续积极招募海外优秀算法人才,实现技术迭代上保持国际领先。
创业邦:UniX AI的商业化进展如何?
杨丰瑜:我们第一代人形机器人已经开发完毕,从一代产品发布以来,收到的订单意向已经超过了我们的预期。目前正在开发第二代产品,接下来会筛选首批用户并陆续交付。软硬件方面的功能迭代开发,比我们预想中还要更快一些,基本上是用半年时间,达到了行业平均一年半的进度。
创业邦:UniX AI的商业化速度为什么这么快?
杨丰瑜:首先是我们软硬件全栈自研,不依靠外购来解决很多问题,所以迭代速度非常快。我们有一个非常精干的硬件团队,可以随时发现问题、随时修改。软件端也伴随场景和需求的变化,保持敏捷高效的迭代速度。
其次来自于我们的团队构成,我们招团队成员的标准是“穿越周期、打过大仗”,我们有很多行业老兵,在机器人整机结构、电机、谐波减速器等核心零部件领域都深耕很多年,已经有一定量产基础。并且团队管理结构扁平化,决策迅速,大家齐心协力,拧成一股绳往前走。
最后,来自我们算法结构的优势。我们的训练效率很高,能在少量示教的情况下,高效率完成复杂任务,能快速实现迭代更新。面对复杂的C端场景,我们还支持用户通过遥操等方式,共创一些高度非标的场景。
创新速度快、脚踏实地的团队特点,加上工程化能力以及供应链的支持,UniX AI才能在半年时间内,走完友商1-2年的开发流程。
创业邦:UniX AI实行软硬件自研,如何看待硬件自研的必要性?
杨丰瑜:通用人形机器人的性能要求比较高,并且产品初期需要快速迭代,这就要求软硬件深度耦合,才能支撑起迭代速度。另外,人形机器人的关键零部件相较传统工业机器人有很大的不同,还没有成形的供应链,因此很有必要自研。
如果不自研硬件,核心部件掌握在Tier1供应商手中,硬件反馈就会很慢,限制后续的研发迭代。比如硬件升级不灵活,数据收集受限,端口不能完全开放,限制硬件创新的空间。现在部分核心零部件被外商垄断,不自研也存在供应链断供的风险。
一些同行会找一级供应商定制开发,但是人形机器人产量小,定制化开发小规模量产价格较高,会推高BOM成本。而公司自研零部件、自建供应链,达成设计-开发-制造的闭环,更容易降低BOM成本,提高产品性能。
从公司成立第一天开始,我们就在持续搭建供应链,现在已经相对成型了,我们一些零部件已经经历了至少四五代的迭代。未来通过用户和场景落地方面的反馈,我们大概会保持一两个月迭代一次的速度。我们团队成员具有硬件行业量产操盘的经验,在机器人、汽车、消费电子都有资深的积累,可以给我们借鉴,帮助快速搭建产业链。
创业邦:现在的产能规划如何?
杨丰瑜:我们初步规划了一个数千平的厂房,预计年底会正式落地,用于第二代人形机器人的量产,产线预计能支持年千台以上的产能。
创业邦:目前公司的工作重心有哪些?
杨丰瑜:从长期来说,我们还会不断补充技术、商业落地方面的顶尖人才,完善团队,这是我们会持续做的事。
短期来说,目前行业处在类似“iPhone1”的阶段,团队的当务之急是把软硬件平台基础搭好。因为iPhone的初期阶段,是要和合作伙伴、和C端、B端的用户一起去共创场景和生态的。具身智能现在的关键词是“通用”和“泛化”,要实现共创,我们就要力争在高训练效率的基础上,实现更高的泛化性,以更高效的训练效率去完成较复杂的任务。
其次,所有行业的玩家都在试图从场景里找到PMF,另一个重要任务也是要把产品搬到场景里去。具体而言,我们会更关注上一代机器人解决不了的事情,这些尝试目前已经得到了积极的市场反馈。
创业邦:UniX AI的核心竞争力有哪些?
杨丰瑜:我们软硬件全栈自研,有着成本优势。具身智能机器人想要真正产业化,真正进入C端场景,必须大幅降低成本。我们团队投入了大量精力在供应链上,目前我们的物料清单(BOM)成本是在一个苹果智能手机和一个入门级汽车的售价之间。
在算法上,我们的模型相比端到端模型在泛化上相当具有优势,UniTouch大模型仅靠3-5组的数据,就能够比肩端到端模型50组数据的训练效率。另外,我们的模型是一个白盒模型,具备可解释性,而不是一个端到端的纯黑盒模型。这意味着我们有几个关键点,可以人为地进行可视化,并进行添加、删除或修改,增加模型的可干预性和可纠错性。
在功能上,我们已经实现了一些刚需的家务劳动场景,比如洗衣、做饭、洗碗等,此外用户可以通过遥操作的方式,与我们共创一些功能,训练人形机器人学习一些高度非标场景的操作,可以极大提升人形机器人的泛化性。
我们的团队成员来自不同背景,彼此能碰撞出更多火花,而且团队风格务实,一心朝着量产落地的方向前进,不会盲目跟风。
创业邦:视触觉模型带来的优势有哪些?
杨丰瑜:大多数模型主要依靠视觉,但光靠视觉是无法适应末端执行的多样性的,这时候触觉的数据反馈就极其重要。尤其在C端场景,触觉大模型可以处理更加精细的任务。比如一块柔嫩的豆腐,如何让机器人既能抓起来,又不破坏豆腐的外形;或是拧紧瓶盖,如何既保证不漏水,又不让水瓶变形。
操作这件事儿,关键点有几个,一是接触前的轨迹规划;二是接触后,执行器对力学做出的精准反馈。例如给手机充电,只通过视觉是没法判断插头是否连接到位的,只有通过力觉的反馈,才知道插头有没有插到位。三是触觉会弥补视觉在被遮挡、在盲区操作以及抓取柔性物体的困难。
我们的Unitouch预训练模型以及核心关键点技术,可以降低对数据的依赖。相比其他方案,在训练效率和经济性上也更有优势。
创业邦:为什么会选择先从家庭场景切入?
杨丰瑜:准确来说,我们切入的是消费级市场,消费级机器人的市场空间更大,用户粘性更强,有定义一个品类的机会。目前我们选择先进入C端家庭场景,其他的商服场景也在规划中。
家庭场景的优势包括用户基数庞大,具备一定购买力。相较于种类丰富的工业机器人,家庭场景机器人渗透率低,而且这一场景的机器人主要以扫地、陪伴等单一任务为主,缺乏通用泛化的机器人。我们的模型训练效率高,也有快速落地家庭场景的优势。此外,家庭场景及任务种类多样,数据价值大,可以在单一场景中率先优化泛化能力,后续降维切入其他场景。
创业邦:家庭场景的泛化要求很高,公司有何应对策略?
杨丰瑜:现在确实离家庭场景的通用泛化要求还有距离,但我们要抢占先机。创新型消费电子公司切入市场时,1.0产品都比较简单,后续结合自身软硬件研发与用户使用反馈迭代。现在整个人形机器人赛道在萌芽期,我们的核心是要让用户先使用起来,形成正向数据反馈优化产品功能,而不是等到一个成熟的产品出来再进入市场,时间太久也不现实。
创业邦:如何看待B端市场,为何短期内没有选择进入?
杨丰瑜:公司团队在汽车、物流供应链、消费电子等领域拥有很丰富的资源以及场景拓展能力,也很了解B端。的确目前大多数人形机器人公司先选择切入工业场景,但我们对场景深入分析后,认为家庭和商服场景更具有落地价值。
B端分为工业和商业场景,目前均有成熟的在役机器人了。并且我认为人形形态之于工业场景的必要性是难以论证的。工业制造安全性及重复性要求高,容错率极低,选择人形机器人替代人或者工业机器人存在很大挑战,一旦产线上操作失误,造成的损失巨大。
人形机器人在B端进行DEMO测试很容易,但是规模化速度很慢,更适合特斯拉这样的大厂自己做。另外,工业场景相对封闭,任务单一,对通用泛化的要求低,对大多数人形机器人企业而言,也很难在这个场景里形成数据飞轮。
相较之下,人形机器人在商服场景存在机会,例如零售商超、物流、公共服务等领域。商服和家庭两个场景功能需求接近,公司先从家庭场景着手,持续关注商服场景,等商服场景具备商业化条件后,公司可以技术降维,轻松切入这一场景。
创业邦:UniX AI的人形机器人,发售价格大概会是多少?
杨丰瑜:我们的人形机器人正式发售的时候,会给大家一个惊喜的价格。因为我们团队在控制成本方面花了很多精力,控制效果也比较好。目前我们收到了一些订单,通过市场调研,我们的价格肯定会比当前市场上的大部分厂商更低。
创业邦:不少具身智能企业选择“沿途下蛋”,公司会选择这一模式吗?
杨丰瑜:具身智能更类似于150年前的奔驰,技术和方案都没收敛,无论是灵巧手的自由度、手指的数量、驱动关节的方案。从我们的角度说,在行业没收敛的状态下,做核心零部件的销售并不是很合适的生意。不过,要是后续具身智能的出货量比较大的话,我们也不排除对一些核心零部件做分拆。比如我们能量产1万台了,会考虑这个方向。按照现在的收敛速度来看,我觉得这个阶段会很快来临。
创业邦:创立公司以来,遇到了哪些挑战?
杨丰瑜:现在有点像智能汽车行业最初的状态,甚至难度会更高一点。因为智能汽车的方案已经相对收敛了,但人形机器人整体上还没有。在这样一个混沌且充满变数的状态里,把握好节奏、高效率、少犯错、快速迭代,非常关键。
这也是为什么我们说,团队的认知很关键。摆在所有创业公司面前的有非常多的可能性和选择,无论是技术还是场景,该如何去认知、少犯错?如何去组织对接好资源,达成目标?我觉得这些事情很关键,对我们团队来说,最困难的阶段已经过去了,已经交出了不错的答卷。未来行业的挑战是量产和交付,我们团队在供应链侧、产品和销售侧都比较有经验,我们会更有优势一些。
我们不怕犯错,犯错是产品商业化必须经历的一段历程。在这一波具身智能创业的浪潮里,我们已经站在一个比较好的位置了,未来会不断前行。
创业邦:您如何看待人形机器人的未来,UniX AI 未来有哪些发展规划?
杨丰瑜:我们对具身智能保持乐观的态度,根据我们的市场调研反馈,在三年以内推进大规模商业化是完全没有问题的,我们非常有信心。今年和明年我们的核心目标是完善软硬件平台,小批量交付机器人产品。我们接下来会发布第二代Wanda人形机器人,并展示更多新的功能操作。明年年初我们将重点推进人形机器人的量产和落地,落地前会进行一些用户反馈的预热。