新闻中心 分类>>

bwin必赢稚晖君两年憋出机器人绝活:骑自行车、葡萄缝针还能组“哪吒完全体”

2025-03-12 15:57:40
浏览次数:
返回列表

  智东西3月11日报道,今天,智元机器人正式发布最新全能探索机器人“团宠”——灵犀X2,智元机器人创始人兼CTO稚晖君称,

  X2体重33.8千克,全身28个自由度。灵犀X2的命名寄予了他们对机器人的憧憬:希望它既灵动又犀利。

  这一新“团宠”集三大能力为一体:支持高自由度运动能力的双足人形机器人、搭载情感计算引擎的智能交互机器人、初步具备通用任务执行能力的具身机器人。

  X2在运动方面,能骑平衡车、滑板车、自行车;交互方面,可以基于动作、视觉、语音模型和人类实时自然交流;作业能力方面,拥有简单任务的泛化能力。

  值得一提的是,为了让机器人更像人,X2集成的多模态交互大模型硅光动语中的动作模块,还让其拥有了仿人的小动作,比如坐在椅子上晃脚、走路摆手等。

  作为B站百万up主,这也是稚晖君时隔两年的首次重磅更新,他特意录制了12分10秒的视频将X2从里到外介绍了个清楚。X2的研发耗时三个月,这条视频准备时间长达一个月。

  稚晖君视频B站播放量已超66万。评论区的网友,一边感慨看到了未来家用机器人的雏形、民用机器人真正实用发展方向,并预言这款机器人“已经可以大卖了”,另一边有人在感慨“这种机器规模发展了,人类该怎么办”。

  他们将机器人的硬件系统抽象成一系列可复制的核心组件,包括小脑Xyber-Edge、域Xyber-DCU、智能电源管理系统Xyber-BMS、核心关节模组Powerflow。

  就像无人机爱好者们通过集成飞行这一核心组件,自主组装或定制具备高智能化、自动化功能的无人机系统,开发者也能用这些核心组件快速搭建起一套可靠的人形机器人系统,或者各种形态的人形机器人系统,甚至是稚晖君一直鸽的“哪吒完全体”。

  据透露,他们为X2尝试了TPU、ETPU、EVA等各种材料,这些材料通常被用于鞋底减震缓冲,甚至还尝试了美妆蛋,最终选定了亲和的柔性材料。

  X2的原型机全身自由度28个,在机电关节设计上采用串联结构,没有使用任何一个并联结构,能同时保证惯量上移和传动链完全解耦。

  传统机器人常采用多连杆并联机构以增强刚度,但会增加机械耦合和控制难度。串联结构是类似于人类骨骼结构的关节设计,可以降低机器人的整体重量。

  当前足式机器人的运动控制从传统的model-based的方法转向强化学习,结合深度强化学习和模仿学习算法的优势,X2能像人一样走路、能跑、能转或者跳一点小舞。

  最后,X2总算苦尽甘来,拥有了更强的运动智能水平——学会使用“懒人工具”。点满运动天赋的X2,学会了骑滑板车、平衡车。

  研究人员为其开发了一套基于Diffusion的生成式动作引擎,让X2拥有了和人自然交互的能力。借助大语言模型,其为X2训练了定制的多模态交互大模型硅光动语,光就是视觉、动是动作、语是语音,稚晖君说,X2是第一台真正具备复杂交互能力的灵动机器人。

  通过边缘侧大脑端到端的模型架构以及大量工程优化,X2拥有毫秒级交互反应,能通过人类的面部表情和语音语调精准判断情感状态,并做出相应的回应。稚晖君演示了一个神奇的“自己”和自己对线使用稚晖君声音进行训练,和他谈论了看电影、掉河里该救谁的世纪难题等。

  视频中,X2能自如聊天,接话时几乎没有延迟,讲话时手部还会有相应动作,在问到“这些问题有哪些是预先设置的”,X2给出了“完全随机”的回答。

  基于多模态交互大模型硅光动语,X2可以通过视觉理解和认识世界。当稚晖君举起X2的胳膊放到机器人面前时,它准确识别出了自己的胳膊还有材质。

  硅光动语集成的动作模态,让X2有了“生命感”,它像人一样拥有了呼吸的韵律、好奇心、注意力机制,还会在走路时伴随一些仿人的小动作。

  目前,智元机器人正在完善X2的思维模型,结合硅光动语大模型,将Reaction-Agent作为情感计算引擎,未来赋予机器人更多情绪表达的能力。

  具身智能方面,智元机器人开源了业界最大的具身真机和仿真数据集之一,提出RoboDual的大小脑系统架构以及基于ViLLA架构的基座大模型启元。

  通过一脑多形的“启元”大模型,X2初步具备简单任务对操作物体的零样本泛化能力,例如从货架上取物品:

  稚晖君谈道,这使得机器人的能力可以外溢到日常生活的方方面面实现机器人的“吉祥三保”,即保安、保姆、保洁,同步应用于教育、医疗等多个领域。

  同时,灵犀X2采用轻量化设计,可模块化拓展,拥有完备的二次开发接口,以及预训练模型和“采-训-推”一站式方案,用户可根据需求自由探索,为康养、服务、家庭陪伴等各类场景打造应用,实现“人形机器人人人玩”。

  尽管从人形机器人的各项能力来看,X2并不是最顶尖的,但其展现出的已有能力正是未来人形机器人走入家庭,或者走入各行各业需要具备的基本能力。

  不论从硬件系统、软件算法还是关节结构来看,智元机器人都考虑到了人形机器规模落地普及的趋势。

  未来,基于人形机器人在运动、作业和交互方面的能力,或许可以在不同场景通过模块化设计,让人形机器人深入陪伴、教育、清洁等诸多场景。

搜索