人形機器人產業化,有哪些關鍵技術需要突破?
如果說ChatGPT為代表的大模型開啟了通用AI新時代,那么多模態具身智能、主動交互式的人形機器人,則為存活在電腦中的人工智能送來了物理軀體,開啟了通用AI在物理上一個人形實體落地的新時代,也是機器人行業從專用到通用,從單一智能到通用智能的一次革命性升級。
如今,在“具身智能”的浪潮下,國內人形機器人產業化加速。業內專家指出,技術研發是人形機器人產業發展的關鍵環節。那么,人形機器人產業化,需要突破哪些關鍵技術?
對于這個問題,工信部印發的《人形機器人創新發展指導意見》曾給出答案。《意見》強調“大腦”、“小腦”、“肢體”等一批關鍵技術取得突破,有助于建立人形機器人創新體系。
原文:人形機器人集成人工智能、高端制造、新材料等先進技術,有望成為繼計算機、智能手機、新能源汽車后的顛覆性產品。到2025年,我國將初步建立人形機器人創新體系,“大腦、小腦、肢體”等一批關鍵技術取得突破,整機產品達到國際先進水平,并實現批量生產。到2027年,人形機器人技術創新能力顯著提升,形成安全可靠的產業鏈供應鏈體系,構建具有國際競爭力的產業生態,綜合實力達到世界先進水平。
仔細來看,“大腦”與大模型、自主決策、行為控制相關,“小腦”則主要指運動控制系統。
“肢體”關鍵技術具體可分為“上肢”“下肢”“軀干”關鍵技術,“上肢”技術是指與機械臂、靈巧手、雙手控制、手眼控制等相關的技術;“下肢”技術是指與仿生關節、仿生腿足、行走控制、足眼控制等相關的技術;“軀干”技術涉及機構系統、材料系統、動力系統、感知系統的控制與運行。
其中,大模型技術在人形機器人“大腦”中具有舉足輕重的作用。
大模型需具備自主可靠決策/多模態感知/實時精準運控+泛化/涌現能力。對于限定的應用場景和任務,從決策層、感知層和執行層三個角度出發,大模型需要具備自主可靠決策能力、多模態感知能力和實時精準運控能力;為了拓展到多樣復雜的應用場景和任務,大模型還需要具備泛化能力和涌現能力。
目前大模型不斷迭代,已出現包含多種能力的“全能選手”,但仍存在感知模態不足、實時性差和泛化能力弱等問題。未來需要不斷優化訓練模型結構、訓練方法和數據集,將多模態感知信息納入模型,同時提高控制指令的生成速度和大模型的泛化和涌現能力。
《意見》提到,打造人形機器人“大腦”和“小腦”,需要開發基于人工智能大模型的人形機器人“大腦”,增強環境感知、行為控制、人機交互能力,推動云端和邊緣端智能協同部署。建設大模型訓練數據庫,創新數據自動化標注、清洗、使用等方法,擴充高質量的多模態數據;科學布局人形機器人算力,加速大模型訓練迭代和產品應用。開發控制人形機器人運動的“小腦”,搭建運動控制算法庫,建立網絡控制系統架構。面向特定應用場景,構建仿真系統和訓練環境,加快技術迭代速度,降低創新成本。
而突破“肢體”關鍵技術,需要用好現有機器人技術基礎,系統部署“機器肢”關鍵技術群,創新人體運動力學基礎理論,打造仿人機械臂、靈巧手和腿足,突破輕量化與剛柔耦合設計、全身協調運動控制、手臂動態抓取靈巧作業等技術;攻關“機器體”關鍵技術群,突破輕量化骨骼、高強度本體結構、高精度傳感等技術,研發高集成、長續航的人形機器人動力單元與能源管理技術。
據人民網研究院發布的《人形機器人技術專利分析報告》顯示,人形機器人的發展已有超半世紀的歷史。
迄今為止,人形機器人經歷了四個發展階段:
第一個階段:1969-1995年,此時機器人運動是一個緩慢靜態行走的過程,以早稻田大學的人形機器人WABOT為代表。
第二個階段:1996-2015年,此時是連續動態行走,這時候更多考慮到了機器人的質心慣量以及質心的加速度等因素,代表是日本本田的人形機器人ASIMO。
第三個階段:2016年至2020年,追求的是高動態的運動性能,以波士頓動力的Atlas機器人做出的令人驚嘆的運動動作為標志。
第四個階段:2021年至今,隨著相關技術的發展與成熟,人形機器人開始進入商業化落地的初級階段,以亞馬遜的Digit和優必選科技Walker為代表,未來可能還會包括特斯拉的Optimus。
最近一年人形機器人的革命性崛起,使業界有頭有臉的科技巨頭都在積極布局。目前來看,發展足夠智能的人形機器人把人類社會的重復性體力勞動接管過去將會是一個造福全人類的科技大方向,也是大國博弈時代背景下,在軍事和經濟領域,一個彎道超車的潛在機遇。