我们想让AI(人工智能)做的事:做饭、打扫房间、洗衣服晾衣服叠衣服、扔垃圾、铲屎,以及费时费力的一切手续,还有为我们工作赚钱。而AI实际在做的事:聊天、绘画、写作、作曲、打游戏……
虽然这是网络上很有名的一个段子,但也说明:想要机器人具备人的形态,帮人类“干活”,哪怕是拧螺丝这样的小事,难度也不小。
昨天上午,屡屡被推到聚光灯下的90后“天才少年”稚晖君,交出从华为离职后的首份答卷:通用人形机器人“远征A1”。
而就在两天前,杭州宇树科技首款通用人形机器人H1发布,在国内外社交媒体上引发热议,还得到了OpenAI(推出ChatGPT的公司)联合创始人的点赞。同一天,浙江大学控制科学与工程学院机器人实验室,带着新一代人形机器人悟空4.0亮相2023世界机器人大会。
去年被特斯拉“擎天柱”点燃的人形机器人概念,似乎在国内迎来了一个集中爆发期。
1993年出生的稚晖君,本名彭志辉,网络花名“野生钢铁侠”。过去几年,在一个10平方米的小房间里,他凭一己之力完成了许多有意思的产品研发:会自动驾驶的自行车,给葡萄缝针的机械臂,可以打游戏的充电宝TG体育,以及用螃蟹壳做的一辆火星车。
2020年,稚晖君成为华为“天才少年”项目一员,年薪百万;去年底,他选择离职并开启一段新的事业,创业方向很性感:将AI和机器人深度融合,在现实世界为人类提供劳动力服务的下一代量产型机器人产品。
昨天的远征A1发布会,稚晖君就以这个跟AI相关的段子开场:“如果想让AI在生活中为我们服务,比如做饭、打扫房间甚至是赚钱,它就必须和机器人结合起来。”
而把机器人做成人形,是因为“现实世界的一切都是为人的形态而设计的,人形机器人可以在日常工作中直接适配现有工具、任务和场景,对人来说也更有亲和力。”
身高1.75米、体重55公斤,步速7公里/小时;双手有需要时可替换成螺丝刀、电钻等工具;腿部采用反屈膝设计,同样是为了适配“干活”的场景……现场播放的视频,展示了稚晖君团队对于这款人形机器人的设想:它可以在汽车生产线上从事底盘装配、外观检测,也可以出现在家庭场景——叮嘱家中的老人按时吃药,为小朋友辅导功课,煎蛋也不成问题。成本方面,将控制在20万元以内,使其具备落地商用的可能。
4月,稚晖君在微博上发布招聘信息时就曾表示,现在AI正在往AGI(通用人工智能)圣杯的方向加速迈进,LLM(语言模型)+Robotics(机器人学)的组合已是必然趋势,机器人会很快迎来应用场景爆发的奇点。
2010年寒假,还在念大一的王兴兴用网购的材料,以及家里翻出来的钣金件边角料,借助钢锯等工具,手工完成了一个简易版双足机器人,总共花费200元。
一梦十三年。王兴兴一手创办的宇树科技,本周三发布首款通用人形机器人H1,研发耗时半年。此前,这家科技公司最为大家所熟知的产品是四足机器狗,上过央视春晚、冬奥会,也多次来过杭州(国际)未来生活节。
在演示视频里,身高约1.8米的H1底盘稳健,大踏步前行,还能小步快跑;中途被人踹了一脚,一个踉跄后很快恢复平衡。它甚至学会了预判,提前快闪,避开人的飞踢。
宇树称,这是国内首款能跑的全尺寸通用人形机器人,拥有全球近似规格最高动力性能——重94斤、最大关节扭矩360牛·米。
略显遗憾的是TG体育,H1暂时没法玩石头剪刀布,因为它跟哆啦A梦一样只有两个“拳头”,可选配的“手”尚在开发中。
这样一款机器人,宇树给出的预估价是低于9万美元(约65万元人民币),目前已接受预订,预计四季度左右发货。
H1引发热议的同一天,首次亮相的悟空4.0,在北京开幕的2023世界机器人大会上吸足了眼球钣金件。
这是浙大控制科学与工程学院机器人实验室推出的最新一代人形机器人。自2016年会打乒乓球的悟空1.0诞生以来,实验室朱秋国、熊蓉团队一直在为悟空做更新和迭代研发。
再往前,7月,傅利叶智能首发自研通用人形机器人GR-1;智能清洁品牌追觅则在原有的家庭场景下做衍生,3月底就推出了通用人形机器人。
从ChatGPT开始,AI大模型的爆发为不少行业带去了新的可能钣金件,人形机器人就是其中之一。
稚晖君在发布会上表示,在大模型时代之前,机器人属于专用设备,如今有了大模型的通识能力,通用机器人的曙光乍现。“语言和图像大模型对于机器人领域应用的最大价值,一是在于庞大的先验知识库和强大的通识理解能力;二是在于复杂语义多级推理能力,即思维链。不再需要预先定义,机器人具备先验知识,可自主识别各种物体。”
所谓具身智能,你可以简单地把它理解为“有实际身体并支持物理交互的AI智能体”,可以是AI发展的高阶形态,也可能成为AI的终极形态。而人形机器人的未来,就是具身智能加持下的真正通用机器人。
马斯克在特斯拉2023股东会上大胆预测,未来人形机器人的需求量将远超电动汽车;英伟达CEO黄仁勋则明确表示,下一波AI浪潮就是具身智能;OpenAI也已暗戳戳地发出信号,早在3月就投资了挪威人形机器人公司1X……
国际上,一些顶尖团队近期已拿出这方面的初步成果。比如,斯坦福大学李飞飞教授及其团队,用大语言模型加视觉语言模型接入机器人,使得人类可以随意用自然语言给机器人下指令,像是“打开上面的抽屉,小心花瓶”“按照图片所示,将积木摆好再还原”。
王兴兴坦言,应用场景方面,近一两年,全球整个行业还没有开发出好的实际功能。“我们自己希望能争取未来几年直接落地到工业和服务业。”在宇树看来,人形机器人最早会在高危场所,像是有毒或者辐射场所,替代人类进行一些高危操作;也可以在服务行业落地,比如餐厅、酒店、医院、养老院等,承担基础的互动和服务工作。之后,人形机器人慢慢进入千家万户,这过程也伴随着技术的进一步成熟和成本的降低。
两三年内,人形机器人似乎离我们日常生活还有点距离,但放眼到二三十年甚至是更长的时间范围,这又是一个让人无法拒绝的科技产物。
“我觉得人工智能和机器人就是这个时代的魔法,可以引领我们跳脱自己肉体的极限,去观察我们的生活。”稚晖君曾在央视的采访中这样感慨。
而在王兴兴的眼中,产业风口已开,不远的将来,人形机器人将开启新一轮的工业革命。TG体育TG体育TG体育TG体育