人形机器人发展到哪一步了?  | 月度策略观察

 

3月份市场整体震荡,根据我们之前提出的“市场三级火箭”模型,当下市场处于业绩验证的第二级火箭阶段。目前来看,业绩恢复可能慢于预期,但市场预期已经到了较为乐观的阶段,尤其是一些科技股和小盘股。因此我们预计4月市场将迎来短暂的震荡调整,但长期上升趋势不变。业绩差和有潜在暴雷风险警示的公司需要规避,业绩优秀且有一定价值成长属性的大型科技互联网公司在市场下跌时会是比较好的机会。传统顺周期的大公司还需经济复苏信号进一步清晰明确。

 

上个月分享了如何投资像AI这一类新兴行业,这个月继续谈谈对人形机器人领域的一些思考。先说结论,人形机器人通用化时代的到来可能会非常慢,远低于大家的想象。因为相较于自动驾驶,人形机器人的数据积累少几万倍、训练难度高几万倍,一相乘就是几亿倍的差距(这里展示的是数量级,并非精确值)。

 

其实这背后还是我们一直强调的常识。第一,人工智能需要大量的数据训练,而自动驾驶基于“人车合一”的模式可以实现被动数据采集,叠加汽车的大规模保有量,我们可以积累海量的行驶数据用于训练。但人形机器人并不是“人机合一”,没有大脑控制机器人的行为。所以相比自动驾驶,人形机器人的训练数据严重不足。

 

第二,人形机器人需要训练的场景多且难度高。驾驶终归是四个轮子在路上跑的场景,但通用家用机器人的泛化能力必须更强,因为场景和动作是无限多的,任务复杂度非常高。我们现在熟悉的大语言模型,各行各业的问题都能回答,这是知识之间的迁移,但动作之间的迁移是非常难的。

 

举个例子,我们学会开车可能只需要1个月,但学会乒乓球可不止1个月,而且会打乒乓球也不是立刻就会打网球的。这是因为人体运动的控制和执行是一个复杂的神经连接过程,像球类运动这样的复杂技能需要小脑的深度参与,这正是当前人形机器人缺失的关键模块。

 

所以,人形机器人的ChatGPT时刻可能就是当“大脑-小脑-控制系统”能够打通,才是大爆发的开始

 

首先是大脑能力,即大语言模型能看到且理解这个动作,对小脑发出指令。接下来还需要打通小脑到控制系统/身体的连接,这是一种知识、运动与控制的交互。如果无论问什么问题都能给到答案、无论给什么动作都能模仿学习,那么人形机器人就迎来了“ChatGPT时刻”。这本质上是泛化能力极强,能灵活调用知识和动作。

 

再进一步思考,站在当下看,人形机器人行业未来的发展可能有两种路径:

 

第一种是自下而上的,让机器人学习各种各样的场景,当拼凑到足够多的场景之后再去销售。这种商业模式短期容易实现,但长期竞争会更激烈,因为容易被模仿。而且如果覆盖的场景不够多,可能导致消费者不愿意支付太多的溢价(例如扫地机器人的使用场景过于单一)。

 

第二种是自上而下的,让机器人训练出一个非常强悍的“小脑”,通过“看”就能模仿人类做出动作,学任何动作都很快。长期看这种模式更容易颠覆第一种模式,虽然从0到1非常难,但从1到100会非常快,这才是难而正确的事情。

 

总结一下,我们对于人形机器人未来的发展充满期待,但看好前途的光明,也需警惕道路的曲折。二级市场往往会因为过度乐观而大幅透支了股价未来的空间,还是要保持理性,从常识出发思考问题。

 

顺着这个话题,最后简单谈谈我们对于AI与量化投资的看法。其实现在很火的“具身智能”概念,与我们主张的“做有逻辑的量化”有着异曲同工之妙。传统的大语言模型依赖预设程序和大量数据进行学习和决策,缺乏与环境实时交互的能力。而具身智能是通过物理身体与环境交互,能够像人类一样在真实世界中学习和完成任务。

 

同样的,股市也是现实世界的映射。如果我们做模型只依赖端到端的AI技术,那么可能无法解决一些现实问题,甚至容易出现幻觉。但如果我们把市场规律和基本常识(逻辑)与AI相结合,就像是将人类的感官装载在机器人上,那么这样的量化模型就更能适应真实的股市。我们认为这是下一代技术的发展路径,从实战上看也实现了不错的效果。

 

 

 

风险提示:本内容登载于此仅出于传递信息之目的,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性,进化论资产不作任何明确或隐含的声明或保证,且不承担信息传递的任何直接或间接责任。相关信息仅供参考,不构成广告、销售要约,或交易任何证券、基金或投资产品的建议。本内容中引用的任何实体、品牌、商品等不代表进化论资产的投资实例。

 

版权声明:本内容版权归进化论资产所有,未经进化论资产授权,任何机构和个人请勿以任何形式发表、转载、改编、摘录、引用。如转载使用,请联系进化论资产获取授权,并注明来源及作者、文内保留标题原题以及文章内容完整性,请勿以任何形式曲解原意。