在交互学习中,具身大模型机器人获得了决策的“大脑”和执行的“小脑”,指挥越来越灵巧的“手”,独立完成更多工作。
银河通用机器人有限公司专注具身智能机器人研发,利用亿级仿真数据训练,助力机器人进入超市和家庭,将科幻情节变为现实。
具身智能是人工智能的一种,是指拥有物理身体的智能系统能够通过感知和交互,实时进行物理互动。简单来说,就是不同形态的机器人能在真实环境中获取信息、解决问题、执行任务。
在银河通用实验室,具身机器人的实际演示正在进行:工作人员在平板电脑上选择物品,双臂轮式机器人根据指令,用视觉锁定目标,准确抓取,并放置在篮子里。一系列动作流畅自如,展示了其商业应用场景:夜间药店无人取药,无人超市智能上货。
“机器人可以替代人完成从接单到找药、取药、装袋等流程,交由快递员。”银河通用创始人兼首席技术官王鹤表示,这款机器人充电后即可使用,电量不足时自动回充,适用于药店、超市、工厂管理和理货等工作。
机器人的“能干”得益于海量数据赋予的泛化抓取能力,并在持续数据注入中不断学习应对复杂情况。例如,当药盒倒放或平放时,机器人会直接抓取第二盒药,导致第一盒掉落。升级后,机器人能先整理药盒再抓取。
作为人工智能前沿热点,具身智能成为全球科技竞争新高地。王鹤介绍,具身机器人的技能学习能力与“大脑”的认知能力结合,是未来通用机器人的蓝图。
银河通用致力于在更多场景中应用智能机器人。在家庭演示中,不断完善的“灵巧手”可以打开冰箱、捡起衣服。
仿真合成数据是银河通用的自豪所在。王鹤表示,公司的泛化物体抓取技术在行业领先,成功率超过95%。公司持续攻关,在具身大模型、3D视觉感知和“灵巧手”深度学习算法等领域取得突破。
提到机器人,人们常联想到生产线上机械臂。但机械臂根据程序运作,不具备真正智能。
具身机器人不仅能移动和灵活操作,还能发现问题、理解指令,减轻员工在生产线上来回巡查的工作压力,完成许多任务。这种能力需要多模态大模型和具身智能赋能。
以前,具身机器人的智能化训练只能靠人工采集数据。以写字为例,工程师使用遥控器操作机器人完成整个过程,费时费力地采集数据有限,机器人只是“看起来很厉害”——只能在采集数据的场景中,在物体、光照等因素完全不变的情况下才能用笔写字,一旦脱离特定空间,就无法正常工作。
“想让具身机器人不受环境影响,在常规背景和合理光照下都能正常工作,就需要让它具备类似人类小脑的反应能力。”王鹤举例说,同样是抓取一杯水,对人来说是不假思索的下意识动作;对机器人来说,杯子的形状、材质不同,抓取的动作和角度也不同,只有学习得足够多,才能知道如何操作,这需要海量数据训练出泛化的抓取能力。
训练所需的海量数据从哪里来?靠工程师采集只是杯水车薪。银河通用打破常规,另辟蹊径,运用合成仿真技术合成了“灵巧手”物体抓取的大量数据,每个物体合成了 200 条视频,再从一个物体到一类物体……通过大量注入数据,训练了机器人的抓取能力。
“我们是国内较早实现泛化物体抓取的企业。用物理仿真器生成的数据训练机器人学习抓取、放置等技能,是我们独到的能力。”王鹤说,对机器人本体进行优化后,使用经过仿真环境和算法优化的数据进行训练,可以帮助机器人跨越虚拟与现实的鸿沟。
拓展应用场景
“人形机器人集人工智能、高端制造、新材料等先进技术于一身,有望成为继计算机、智能手机、新能源汽车后的颠覆性产品,将深刻变革人类的生产生活方式,重塑全球产业发展格局。”银河通用联合创始人姚腾洲告诉记者,公司预计今年将发布应用于商店和超市的轮式人形机器人,计划在 2026 年开始量产。
除了轮式人形机器人,银河通用还在加快“灵巧手”、人形机械腿和遥操设备的研发进程,以及解决双足人形机器人软硬件相关技术难题,不断突破应用场景的展示。
人形机器人能否顺利商业化,不仅取决于其自身的能力水平,成本也是一个重要的影响因素。“可以抓取从地面到 1.8 米高空之间物品的机器人,量产后一套成本预计有望控制在 5 万元左右。”王鹤透露,这些机器人可以在顾客到来时负责接待取货,在无人时负责上货盘点,店员可以使用语音指派和控制,价格并不昂贵。
“新生事物往往会面临许多挑战。具身智能是典型的多学科技术交叉行业,制造具身机器人需要产业和研究双轮驱动,既是前沿探索,也能产出学术成果,是很好的产学研联动。”王鹤告诉记者,目前,银河通用已在北京、深圳和苏州三地设立了研发中心,不断发展壮大算法、软件和硬件研发团队。
瞄准行业发展趋势,银河通用将不断提升技术创新能力,持续开发人形机器人的“大脑”和“小脑”,增强环境感知、行为控制和人机交互能力,提升人机交互、灵巧抓取、分拣搬运和智能配送等作业能力,加速大模型训练迭代和产品应用。银河通用也将积极拓展应用场景,加快技术迭代速度,降低创新成本。
还没有评论,来说两句吧...