人形机器人走向何方

发布时间:2024-12-05 18:43:00 来源: sp20241205

  在全球追逐的“新质生产力”中,人形机器人是摆脱传统经济增长方式、生产力发展路径的核心要素之一。

  本报记者 彭德倩

  近日传出信息,英伟达、微软、OpenAI等正共同投资一家人形机器人初创科技企业Figure AI。与此同时,另有多家大型科技公司在该领域落子布局。

  几个月前,我国发布的《人形机器人创新发展指导意见》明确时间表:到2027年,人形机器人技术创新能力显著提升,相关产品深度融入实体经济,成为重要的经济增长新引擎。

  业界已有共识,人形机器人这一集成人工智能、高端制造、新材料等先进技术的新质生产力载体,将对社会产业变革和全球竞争格局产生颠覆性影响。

  在全球视野中,它有着怎样的发展脉络?未来,人形机器人走向何方?

  新质生产力载体

  多方必争之地

  “给我一个紫色的球。”人形机器人HRP-2接到实验员的指令。

  从57米的高度,人形机器人HRP-2看着下方的桌子,桌面上分别放了2个红色和绿色的球,机器人回答:“我看不见它。”

  实验员发出指令:“继续寻找。”

  这是2008年春发生在图卢兹法国国家科学研究中心系统分析与架构实验室中的一幕。

  人们对人形机器人的理念并不陌生。它作为一种旨在模仿人类外观和行为的机器人,尤其特指具有和人类相似肌体的种类,很早以前便出现在科学幻想领域。然而,随着工程机械、机器学习,特别是人工智能的发展,近年来,人形机器人理论功能进一步拓展,并直接上升为国家、企业的必争之地。

  在全球追逐的“新质生产力”中,一个具备人工智能且在物理形态上可以无限突破人类极限的设备,便是摆脱传统经济增长方式、生产力发展路径的核心要素之一。

  去年在上海举行的世界人工智能大会上,特斯拉CEO马斯克就此谈及,“地球上机器人的数量将超过人类,人形机器人将取代人类劳动中重复、无聊且危险的工作”。

  此言一出惊世骇俗,细想却在情理之中。与之相呼应的是国内企业傅利叶智能现场发布GR-1通用人形机器人——身高1.65米,体重55公斤,全身自由度达40个,最大关节模组峰值扭矩可达300牛·米,步行速度可达到每小时5公里,负重50公斤,具备快速行走、敏捷避障、稳健上下坡、抗冲击干扰等运动功能。结合认知智能,它能够与人协同完成动作,在工业、康复、居家、科研等多应用场景具备潜能。

  看得见摸得到的实物,为“狂言”增添了可信度。

  上溯人形机器人的历史,其诞生可以追溯到15世纪的达·芬奇时代,现代意义上的类人机器人研制源自20世纪上半叶的美国,但真正深入的研究则始于20世纪60年代。

  自那时算起,迄今为止人形机器人的发展可分为四个阶段。第一阶段是以日本早稻田大学打造的WABOT-1为代表的全尺寸机初步行走阶段;第二阶段是以本田人形机器人等为代表的系统高度集成的能力破冰时期;第三阶段是以强复合运动能力为特征的技术突破发展阶段,突出代表者为波士顿动力Atlas;第四阶段是以特斯拉Optimus机器人为代表的产业化落地阶段,该阶段尚处于发展前期。

  1972年,日本早稻田大学制造出的WABOT-1机器人,是世界上第一台全尺寸人形机器人,能用日语与人交流,能抓握和运输物体。后继者WABOT-2还能够读取乐谱并弹奏电子键盘。

  由于人形机器人是机器人技术的集大成者和战略制高点,美、韩、德、意、法、俄等国家纷纷开展了人形机器人研究。最具代表性的当数日本本田研制的ASIMO机器人和美国波士顿动力研制的Atlas机器人。ASIMO和Atlas在技术路线上分别是电机驱动和液压驱动,位置控制和动态力控的典型代表。

  日本本田在电机驱动、精密传动、实时控制、步态规划、平衡控制等方面取得了系列突破,于2000年基于仿人机器人P2推出ASIMO机器人。ASIMO身高1.3米,体重48公斤,具备智能交互和灵活行走等功能,手部可完成端茶、拧瓶、倒水等基本动作;腿部具备行走、跑步、单/双脚跳,以及上下楼梯等能力,最高运动速度9km/h,但对未知不平整地面和未知扰动适应性差。

  2018年,本田宣布停止继续开发ASIMO,但仍在组织开发新一代人形机器人。

  2013年,波士顿动力发布了初代Atlas机器人。Atlas由外置电驱动液压动力系统提供动力,高1.83米,全身28个液压驱动关节,能够实现碎石路面下的稳定行走。2016年,波士顿动力公布了新一代Atlas机器人,配备机载液压动力系统,能够实现雪地、山地行走,以及倒地后的快速起身,表现出了优异的运动灵活性,同时展现了双臂协同搬运重物的操作能力。

  2017年,它完成了立定跳跃、跳高、跳转身和后空翻等动作;2019年完成了一套高难度体操动作(慢起手倒立、前滚翻、前空翻、原地180°空中转体、分腿跳、360°空中转体);此后,企业又陆续发布了酷跑、三连跳、全身协调操作任务等新功能。目前,波士顿动力Atlas被公认为运动性能最强的人形机器人。

  2022年10月1日,特斯拉发布人形机器人Optimus原型机。Optimus身高约1.73米,重约56公斤,在汽车工厂可以进行搬运、给植物浇水、移动金属棒。该机器人运用特斯拉最先进的人工智能技术和算力极强的DOJO D1超级计算芯片,共用特斯拉“完全自动驾驶”系统,延续纯视觉感知解决方案,具有低成本、强智能、多场景运用、产业化发展等优势,未来将在家庭和工业等场景开展应用。

  具身智能

  让AI进入物理世界

  人类多年的研究实践,使人形机器人成为集机械、电子、材料、传感器甚至人机协作等多门技术学科于一体的高精尖领域,对周遭环境感知、硬件本体设计、运动控制能力等有着近乎极致的整合要求,并逐步形成复杂的跨领域高精尖产业链网络。

  目前,处于一线水准的人形机器人可实现的本体能力有:在特定区域内缓慢行走并探索、记忆环境;通过电机转矩控制能力,较精确把控动作力度大小;自主学习人类动作(如抓取地上不同形态的物体)的模拟数据,实现对相关动作行为的模仿等。

  有研究认为,人形机器人的初步应用场景涵盖特种领域、制造业典型场景、民生及重点行业,需要进一步强化的功能有三——

  一是强化复杂环境下本体控制、快速移动、精确感知等能力。

  二是聚焦3C、汽车等制造业重点领域,提升人形机器人工具操作与任务执行能力。

  三是拓展人形机器人在医疗、家政等民生领域服务应用,满足生命健康、陪伴护理等高品质生活需求,推动人形机器人在农业、物流等重点行业应用落地,提升人机交互、灵巧抓取、分拣搬运、智能配送等作业能力。

  未来,人形机器人将成为人类生产生活的重要参与者,并进一步成为衡量一国科技实力和国力水平的重要标志。环境感知传感器与信号处理、智能控制、本体设计及材料工艺和能源优化——人形机器人研制覆盖的四大技术群,成为竞争的前沿阵地。其中,以人工智能为核心要素的智能控制技术尤为关键。

  当下人工智能已成大势所趋。由此延伸的前瞻性研究认为,下一个浪潮是具身智能。作为人工智能进入物理世界交互的载体,具身智能将人工智能技术与机器人实体相结合,让“大脑”有了可支配、可感知、可交互、可行动的“身体”,作为人类的重要伙伴和助手,带来便利和效益。

  值得一提的是,具身智能旨在基于机器与物理世界的交互,创建软硬件结合、可自主学习进化的智能体,通俗来讲就是创造能够感知、推理并与物理世界进行各类互动的不同形态的机器人,它们在真实的物理环境下执行各类型任务,实现人工智能的自主进化。

  换句话说,在科技前沿领域,人工智能和人形机器人不仅仅是“前者赋予后者灵魂”的关系,两者是相互刺激、双向促进的。

  去年,英伟达CEO黄仁勋就曾公开表示:下一波人工智能浪潮将是一种被称为“具身AI”的新型人工智能。

  在全球范围内,对人形机器人的理论探索和研发实践再次成为目光焦点。各路人工智能大模型纷纷涌现,计算机视觉、计算机图形学、自然语言、认知科学等技术逐步成熟,推动具身智能进入快速发展期。

  2023年3月,ChatGPT开发商OpenAI领投了挪威的一家人形机器人公司1X Technologies。后者准备利用这笔资金加大其即将推出的双足机器人模型NEO的研发力度,以及在挪威和北美大规模生产其首款商用机器人EVE。

  2023年7月,斯坦福大学李飞飞教授团队公布了具身智能的最新成果——VoxPoser(大模型接入机器人),把复杂指令转化成具体行动规划,人类可以随意地用自然语言给机器人下达指令,机器人无须接受额外数据训练。这一方案利用了视觉语言模型,以便感知与分析出真实场景中的目标。(解放日报) 【编辑:曹子健】