2022 机器人学习前沿与落地进展到哪了

骆先森 · 发表于 2022-3-1 16:16:31

1 前言

机器人学习Robot Learning一直是我们关注的一个主题，在之前也写过了很多相关文章，比如下文：
又过去了1年半，现在的机器人学习的前沿及落地进展到哪里了？
这篇blog，我们梳理一些学术界及工业界相关的工作，仅包括和深度学习，深度强化学习，sim2real相关工作，必有疏落，还请批评指正。
文中图片均来自paper或网站中的截图。
2 前沿

2.1 ANYmal: 四足机器人能够在野外随便走了

2022 机器人学习前沿与落地进展到哪了第1张图片

Learning robust perceptive locomotion for quadrupedal robots in the wild
ETH ANYmal团队以每年一篇Science Robotic的速度在不断提升基于神经网络的四足机器人的能力。在这篇最新的工作中，通过视觉得到的地形信息被充分利用，完美的深度强化学习训练及sim2real，使得ANYmal可以适应各种复杂地形。这个成果进一步的说明了深度强化学习及Sim2Real在机器人控制上的优越性甚至不可替代性，四足机器人的行走能力得到了极大的提升，目前并没有公开的实验来对比AnyMal和波士顿动力的Spot之间的行走能力差别，但我确信ANYmal肯定会更强。这个成果也进一步让大家看到了四足被广泛应用的前景。
2.2 Agility Robot: Cassie 两足机器人能走5公里路了

2022 机器人学习前沿与落地进展到哪了第2张图片

OSU Bipedal Robot First to Run 5K
CSL seminar: Alan Fern
方法论和ANYmal的四足基本一样，就是深度强化学习+Sim2Real，只是两足显然要比四足更难，因此目前两足的效果看起来比四足要差一些，但能够在平坦地面连续走5km也很强了。这成果是波士顿动力用传统控制方法很难达到的效果。可以预期这一两年两足机器人应该也能达到四足的水平，在不平坦的野外行走。
2.3 Nvidia：Isaac Gym

2022 机器人学习前沿与落地进展到哪了第3张图片

Isaac Gym - Preview Release
Isaac Gym 经过Nvidia相关团队3年的研发，终于是越来越成熟，Isaac Gym的数据直接在GPU上通过Pytorch Tensor API处理，绕过了CPU的过程，使得Isaac Gym的仿真速度超级快，一个好的GPU就可以等价原来要几百上千CPU集群的训练效果。当然，现在的Isaac Gym对视觉输入输出的支持还不够好，但对于四足，机械手等非视觉控制任务已经是一个非常好的训练环境了。
Google也推出了brax 支持类似Isaac Gym的效果，但底层原理和实现手段不一样，主要是基于Jax，对渲染支持不足。
https://github.com/google/brax
2.4 机械手: CoRL 2021 best paper：A System for General In-Hand Object Re-Orientation

2022 机器人学习前沿与落地进展到哪了第4张图片

A System for General In-Hand Object Re-Orientation
以前OpenAI只能转小方块，现在MIT的工作拓展到能转任意物体，算是一个不错的突破。方法上就是深度强化学习，这个工作因为疫情并没有在真实机械手上实现。对于未来的VR/AR应用，这个工作也具有潜在的应用价值，可以更好的去模拟抓取的动作。
2.5 负向进展：OpenAI 关闭其机器人研究小组，停止了机器人研究

这可能是去年非常重磅的新闻了，原因是相比于NLP，机器人学习的数据太难获取了。所以OpenAI 机器人小组的leader Wojciech Zaremba 改去做GPT相关工作了。
这确实也是事实，机器人学习太需要环境和可用于模仿的数据，但两者目前都比较难以获取。但正因为难，我们更应该去做它。去造环境也好，或者造数据也好。
2.6 Robot Design with AI

通过AI来设计机器人的形态是一个非常有意思的方向，当然目前还处于比较早期的阶段。有一些有意思的工作，比如：
2.6.1 Embodied Intelligence via Learning and Evolution

2022 机器人学习前沿与落地进展到哪了第5张图片

2.6.2 Jie Xu (MIT CSAIL) 做了很多相关的工作

2022 机器人学习前沿与落地进展到哪了第6张图片

到最近的这一篇，已经到了sim2real的阶段，很强。机器人结构通过AI来探索和Automl探索网络结构有点类似，对于未来机器人的结构设计将会产生重要的影响。
2.7 机械臂相关：没有令人惊喜的研究出现

不管是DeepMind，还是Google brain，Nvidia及四大，机械臂相关的研究都中规中矩，没有惊喜，没有太多可以认为突破的研究，当然简单的机械臂抓取问题已经在工业界基本解决了，并处于落地状态。
2.8 Physics-based Animation：Daniel Holden: SuperTrack

这一两年来physics-based animation倒是涌现了挺多有趣的研究，Daniel Holden的SuperTrack算是其中的一个。physics-based animation和机器人相关性非常大，因为其实就是做virtual robot，只有sim，没有2real的阶段而已。
2 minutes papers https://www.youtube.com/watch?v=szOMIn0YyUM&t=252s 也有相关的介绍。
在我看来，机器人学习要有突破，首先就要在physics-based animation上突破，然后再考虑sim2real。前面的ANYmal和Cassie都是在虚拟环境中训练突破。
2.9 Differential Physics for Robot Learning

Daniel Holden的SuperTrack就是基于可微分物理来实现的，可以算是一个蛮大的突破。因为这个要训练好很难。
前面提到的Google Brax https://github.com/google/brax 就是可微分的。SuperTrack是学出来的model，brax则是环境自带可微分属性。
model-based learning 在RL领域本来就是能极大提升训练效率的方法，现在应用到机器人学习中能够成功也就可以极大的提升机器人学习的训练效率。
当然现在这个方向也才刚起步，接下来要看像SuperTrack能否更进一步的处理更复杂的碰撞问题，同时不再只是简单的模仿一段mocap，而是真正学会某个技能。
2.10 Language Model and Decision Making

语言模型和决策最终要走到一起，毕竟从人类的角度看，语言和行为是无缝连接的。但怎么做好也还在早期。个人比较看好的是预训练模型结合RL做finetuning，或许我们就可以看到更智能的能说话还能行为的机器人or游戏里的NPC。
2.11 小结

从上面的一些学术前沿进展看，这一年半来机器人学习在Locomotion行走上取得了较大的突破，同时出现了一些全新的研究方向具有较大的潜力，但距离我们想要看到的General Purpose Robot通用机器人还是有很远的距离。我们需要更好的机器人模拟器，还有更好的获取有效数据的方式，这样或许可以离General Purpose robot更近一点。
当然，Tesla 在去年8月份提出了Tesla bot，目标就是通用机器人：

2022 机器人学习前沿与落地进展到哪了第9张图片

虽然作为机器人学习领域有所了解的人感觉tesla bot很扯，但马斯克也没说马上要实现呀。梦想还是要有的，10年后实现也是巨大变革。
个人认为Tesla如果收购agility robotics应该会大幅度加快他们的进度。
3 机器人学习落地情况

3.1 机械臂抓取

AnyGrasp令人印象深刻，GraspNet 可以抓取各种物品了。主要的几家机械臂抓取初创公司都在落地，包括xyz robotic，covariant 等等（之前的blog有讲）
这些落地更多的还是依赖计算机视觉，控制还是传统控制，深度强化学习在里面的作用相对来说没有那么大，根本的原因还是在于对控制的要求没有那么高。而像四足行走这样的控制，要用传统控制来做的话会麻烦很多，而用深度强化学习却可以很快训练出一个控制器。
由于目前的机械臂抓取的落地方式和深度强化学习及sim2real关系不大，所以我不太认为按照这个方式落地未来能迁移到通用机器人。
3.2 Google EveryDayRobots and Intrinsic

Google 绝对是深度强化学习和Sim2Real的深度信仰者，所以Google X长期在孵化相关的机器人项目，去年都作为独立子公司运营了。虽然Google已经做了一些突破，但现在离很好的落地还是有一定距离的。
我非常期待Google能够做出落地的产品，但是因为Google 非垂直整合的关系，类似Waymo，最终说不准Tesla做的更好。
4 小结

总结一下，这一年半来机器人学习还是取得了挺多的进展，有的是突破性的，有的则是开了新坑，工业界则在继续推进落地，Google和Tesla 或许最有希望。当然作为这个方向的坚定信仰者，我们也需要行动起来，或许会有新的机会出现。

上一篇：高端医疗|深度走访嘉会国际医院
下一篇：BCG 波士顿咨询实习生上海

881314 · 发表于 2022-3-1 16:17:01

请问下，目前有没有双臂进行零件装配工作，涉及力、视觉等多模态输入的。我比较感兴趣这个方向，不知道有没有组做这个的，考虑申博[小情绪]

鹿晗我的命唯爱 · 发表于 2022-3-1 16:17:26

这是一个不错的方向，但到目前我看到的还没怎么有这方面太多的文章（我有半年多没看了，也许有新的文章出来，或许我没看到），一开始我也是准备用强化学习做零件装配[捂脸]。说真的，仿真环境也许可以，但实际环境，会遇到各种问题。

bangmang · 发表于 2022-3-1 16:17:35

感觉在无人机上的应用好像没有其他方向多

【闫帮】love妮 · 发表于 2022-3-1 16:17:47

"简单的机械臂抓取问题已经在工业界基本解决了，并处于落地状态"。。。好像深度学习这一套在工业上不太行吧[思考]

白金会员	积分	兔币	帖子
白金会员, 积分 3408, 距离下一级还需 1592 积分	3408	1846	1562
在线时间：0 小时	最后登录：2024-2-6

白金会员	积分	兔币	帖子
白金会员, 积分 3337, 距离下一级还需 1663 积分	3337	1815	1522
在线时间：0 小时	最后登录：2024-3-6

白金会员	积分	兔币	帖子
白金会员, 积分 3200, 距离下一级还需 1800 积分	3200	1744	1458
在线时间：0 小时	最后登录：2023-10-16

白金会员	积分	兔币	帖子
白金会员, 积分 3481, 距离下一级还需 1519 积分	3481	1902	1579
在线时间：0 小时	最后登录：2023-9-23

白金会员	积分	兔币	帖子
白金会员, 积分 3426, 距离下一级还需 1574 积分	3426	1863	1565
在线时间：0 小时	最后登录：2023-10-17

[问答] 2022 机器人学习前沿与落地进展到哪了

关联主题

精彩评论4

辽宁94-110广东，周琦复出改变内线平衡，张

索尼Xperia 1 VI有望5月17日发布改动不小

土木工程院校排名出炉！学科特点分析，就业

王晶老婆罕现身！美貌不输一众“晶女郎”

以色列驻联合国代表：没料到哈马斯还潜伏在

主场16分完败广东！杨鸣公开批评：除了赵继

港股再大涨！汽车股、房地产股走高

说了不要给一诺公孙离，史上最水FMVP皮肤拥

TCL电视别乱买，5月这三款更值得推荐，屏幕

LPL转会期爆料汇总，LWX已经被开除，EDG夏

鸡蛋大小！广州多地降下冰雹，“天空数次闪

万科，破鼓万人捶

日本扩大出口管制范围：项庄舞剑，意在沛公

选秀节目强势回归！盘点内娱选秀综艺发展史

抵制成功！田馥甄退出天津演出，直言很遗憾

张颂文新综艺《灿烂的花园》：口碑两极分化

余承东卸任华为终端BG CEO，何刚接任：背后

心肺复苏首次纳入河南郑州中考，按压力度是

辽宁94-110广东，周琦复出改变内线平衡，张

从6000万到11亿外加一条人命，《城中之城》

主角脸对女演员有多重要？看《无限超越班》

轰20很快对外公布，台中将：轰20完全隐形，

鸡蛋大小！广州多地降下冰雹，“天空数次闪

20岁谷爱凌惊艳颁奖礼，穿“黄金战袍”气场

花费53万竞买法拍房，拖延近一年多难收房;

万科，破鼓万人捶

我老公是国足！球员妻子开保时捷撞车后打人

“木头姐”谈特斯拉目标价，说对了吗

3个半小时，点球10-11，夺冠热门出局，黑马

巴勒斯坦“入联”遭美阻挠，联合国一票否决

财神驾到

绿林道的

一抹伤

哇哇的哭

冷香丸