浙江大學教授熊蓉:人形機器人(rén)關鍵技術進展與(yǔ)挑戰
2024-4-10 來源:- 作者:-
4月2日,由中國機器人網、智能穀(gǔ)產業園主辦的「2024中國人形機器人生態大會」在上海順(shùn)利舉行!數千人齊聚,聚焦人形(xíng)機器人產業前沿話題,剖析產業風口,共同探尋產業融合與落地的方向。
在上午的院士專家報告環節中(zhōng),浙江大學教授熊蓉圍繞「人形機器人關鍵技術進展與挑戰」這一主題,展開了(le)主題(tí)報告。
以下是本次(cì)報告實錄,「中國機器人網」整理刪改:
今天,我主要借這個機會向各(gè)位專家領導匯報一下我們這麽多年在人形機(jī)器人方麵所做的工作。
首先,簡要(yào)介紹一下人形機器人的發展背景。人形機器人原來有很多的稱呼,我們一直習慣稱(chēng)之為仿人機器人,這兩年(nián)才明確叫人形機器人。
它很多都是在模仿人(rén)的部分或者全部功能和部分智能,但是人形機器人更強調(diào)類人的形(xíng)態,這種類人(rén)的形態使得它更(gèng)加適(shì)應我們人類為(wéi)自己建(jiàn)設的環境和人(rén)類(lèi)為自己製作的工具,並且能夠有(yǒu)更好的人機交互感受,所以(yǐ)在整個作業上有更強(qiáng)的通用(yòng)性和(hé)適用性。
它的這種通用性可以無縫(féng)替換人(rén)類所從事的一些工作,所以說它是一個未來的重大(dà)產(chǎn)業。當然,一些專用型(xíng)的機器人我(wǒ)們還是要具(jù)備的,因為這些專用機器人的能力超越人類,它們有(yǒu)更強的負載、更精(jīng)準的節拍和(hé)更(gèng)強的一致性。現在專用機器人(rén)無法實現的(de),可能類人的這種形態就可以直接實現無縫替換,因此,人形機器人具(jù)有更加廣闊的市場。
國內外做了非常樂觀的市(shì)場預測,特別是高盛對(duì)人形機器人的市場樂觀度進一步提高。這兩年,一(yī)些產業界的巨頭,包括(kuò)國際的(de)和國內(nèi)的都開始布局人形機器人賽道,從整機到核心零部件,到智能控製(zhì)智能計算(suàn)。總的來(lái)講,人形機器(qì)人進入新的突破期,從原來實驗室樣機的研發進入到產品的樣機以及未(wèi)來產業化(huà)發展的早期階段(duàn)。
我們國家非常(cháng)重視人形機器人的發(fā)展,人形(xíng)機器人已經成為(wéi)了國家的(de)戰略性的新興技術和產業的方向。2023年,工信部先後出台了揭榜掛帥(shuài)的項目以及人形機器人發展的指導意見。在今年1月份,七部委發布推動(dòng)未來產業發(fā)展的實施意見裏麵(miàn)作為創新標誌性產品的第一個就是人形機(jī)器人。
人形機器人並不是今天才有的一個係統,上世紀60年代就已經推出第(dì)一台雙足(zú)行走(zǒu)的機器人,它被認為(wéi)是機器人領域當(dāng)中的技術競爭製高點,是國與國之間競爭科技的顯示點。
主要的難點,首先它幾乎是機器人和人工智能技術的(de)製高點,它的技術的複雜性,導致整機係統(tǒng)的研製具有(yǒu)很高的挑戰性。除了整機,我們還需要融合它的功能(néng)、性能(néng)、材料和各個部件,我們對裏麵的部件提出高的要求,像(xiàng)我們的關節要求它速(sù)度要快(kuài),體積要(yào)小,重量要輕一樣,高功率密度依然是我(wǒ)們現在麵臨(lín)的一個挑戰。
第二(èr)是這(zhè)個係統,它是一個不穩定係統,大多數時(shí)間是(shì)單腳支撐。如果是跑步雙腳通向,和地麵(miàn)接觸的空間和時間(jiān)也都非常的小,而(ér)我們的穩定控製主要發生在小的時間裏麵,使得它的穩定控製很難。
現(xiàn)在很多(duō)的機器人都實現了(le)穩定行走,是不是(shì)能夠到一個真實的環境裏(lǐ)麵適應各種環境的擾動,去適應作業的過程中間由於手臂的用力而帶來的擾動,保持穩定(dìng)性以及(jí)作業的準確性,這都是它的難點(diǎn)。
第三,作為一種通用的形態,它必須(xū)要在各種環境(jìng)裏麵執行各種任務,這對它的智能性提出了更高的要求,這(zhè)也是人工智能領域中間的一個發展的重要的目標,能夠實現載(zǎi)人(rén)功能(néng)向通用人工智能發展。
《人形機器人創新發展指(zhǐ)導意見(jiàn)》裏明確了一個思想:以應用來遷移,通過整(zhěng)機來帶動整個生態的發展。其(qí)中幾個核心,一個是包括部件(jiàn)、整機係(xì)統裏的大腦、小腦(nǎo)以及我們要去支持這些(xiē)研究開發研製的供應鏈和(hé)工具鏈,由此來形成整個行(háng)業的應用和(hé)生態建設。
我們從2000年開始機器人方麵的研究,主(zhǔ)要是關(guān)注機器人的(de)智能性和智能的移動和操作。06年的時候,開始(shǐ)注意到了(le)人形(xíng)機器人。當時,我們主要是以Robocup平台進行技術積累,包括通過機器人的運動平衡控製來進行定位規劃,各種運動實施的生成,在國內獲得多次冠軍。
我們在國家863項目的支持下研製成了2個跟多人對打的機器人,除(chú)了解決(jué)各種部件(jiàn)如何選擇合適(shì)的形(xíng)態,如何進行(háng)集成,我們更主要的還是(shì)解(jiě)決了(le)它的智能控製,這也是國際上麵第一個能夠在(zài)線的動態控製並且和快速的球進行擊打的人形機器人。
11年10月份成果發布以(yǐ)後,也是得到了國內外的(de)廣泛的關注(zhù)。在這個(gè)係統裏麵,機器人行走的速度和(hé)穩(wěn)定性還(hái)是有問(wèn)題的,隻能實現(xiàn)1.2公裏每小時的行走,以及在平整地麵上實現行走。在打球的時候因為行走速度跟不上,主要是(shì)站立打球,用下肢(zhī)來做平衡控製,所以從12年起(qǐ)我們主要(yào)是研究室內外能夠快速穩定行走的人形機(jī)器人。
在這裏,我們研究了包(bāo)括能夠立位控製(zhì)關節、全身控製以及22年發布的能夠在室內外快速(sù)穩定行走的機(jī)器人。裏(lǐ)麵的部件關節(jiē)如何來進行研(yán)製?包括高光密度的電機、有更大緊縮比的緊縮器以及形成高集成的一體(tǐ)化的關節。
另外一個技(jì)術就是複雜(zá)的運(yùn)動建模和控製的問題。目前在國際上對(duì)於人形機(jī)器(qì)人行走的運動控(kòng)製有三條技術路線,一(yī)個是從機理出發,對整(zhěng)機進行運動學和動力學的建模(mó),然後進行設計,進行規劃控製(zhì)。第二種是特斯拉展示的人的(de)運動映射到機器人(rén)上麵。第三個機理模型需要依賴模型的準確性,對於複雜(zá)環境的適應需要人的介入,研(yán)究強化(huà)學習的方法,我們在(zài)這三(sān)個方麵都做了一(yī)些工(gōng)作。
模型(xíng)控製不講了,通過強化學習生成它各種的動作,然後用它(tā)的基本步態,來融合形成環境(jìng)的適應性(xìng),能夠自動選(xuǎn)擇步態的組合。今年年初,我們也把這個方法進一步延伸應用到了人形機器人上(shàng)麵,能夠實現對一(yī)些不(bú)同的地麵的適應,這是通過強化學習的方法(fǎ)來形成的。
我(wǒ)們也(yě)在人機映射方麵做了一係列的工作,怎麽把人複雜的動(dòng)作能夠快速映射到機器人上麵去。最初,把人的雙臂和手的動作映射到一台玉米機器人上麵,解(jiě)決了傳(chuán)統的最優化的映射,隻能(néng)實現(xiàn)一(yī)些(xiē)簡單的動(dòng)作,需要優化時間比較長。
我們在這裏把(bǎ)最優化和目前很熱的深度學習提出來了圖神經網絡下最優(yōu)的學(xué)習方法(fǎ),一個是(shì)大幅(fú)提(tí)升了它的動作的相似性,而且可以保證機(jī)器人的可執行性和(hé)安全性,最主要實現了時間上大幅度的提升,快速把人的各種(zhǒng)運(yùn)動映射到機器人(rén)上麵。我們也是利用現(xiàn)在提出來的語言視覺大模型(xíng),進一步提升我們動作的語義的保持。
人(rén)形機器人必不可(kě)免出(chū)現一些故障,一旦出現故障需要人(rén)介入它(tā)的維(wéi)修,雖然它出了故障,我們依然能夠讓它依然保持一定(dìng)作業的能力(lì),這(zhè)是我們獲得最佳論文獎(jiǎng)的工(gōng)作,假定任何一個關節壞了,它依然可以保證直線行走。
另外一個我們的工作還是放在(zài)機器(qì)人的智能上麵。2000年開始,我們便一直做這方麵大量工作,怎麽讓傳統的機器人在封閉靜(jìng)態的(de)環境裏麵能夠像在動態的開放的(de)環境裏麵一樣能夠長期(qī)自主(zhǔ)的工作,以及從依賴人離線(xiàn)編寫的程序到(dào)自發逐步適應更加豐富的環境和更加多(duō)樣(yàng)的作業。
在這方麵我們也發表了一係列的(de)論文,在這裏我簡要的介紹一下,一個是在移動方麵,我們對於它的長期準確(què)的定位和(hé)導(dǎo)航做了(le)一些工作。我們現(xiàn)在的一些技術已經在多個領域裏麵有應用驗證,包括變電站的巡檢機器人,製造業裏麵新型的AMR,實現複雜地形裏對人的跟隨。我(wǒ)們也實現了產業轉化落地,新型物流機器人目前已經在製造業(yè)裏(lǐ)麵大規模地應用了。
在操作方麵,我們從12年完成了(le)打乒乓球的機器人以後,開始(shǐ)研究它如何能夠操作更多的對象。一個工作就是這種序列性的作業,能不能讓人去展示,然後直接的生成機(jī)器(qì)人程序,我們人做一下這(zhè)個(gè)裝配,對於(yú)人的動作進行解析、理解,去解析出來它是用什麽動作,操作(zuò)了什麽物體,達(dá)到了什麽樣的效果,並且(qiě)去解決我們感知的誤差到執行的精度的要求。我們的感(gǎn)知誤差往往是毫米級的,能夠實現準確的未知(zhī)的推理,然後實現程序自動的生成。我們(men)實現了不同的手電筒、開關,包括(kuò)機器人(rén)關節的這樣一(yī)個(gè)對人的學(xué)習,僅用幾分鍾的時間來(lái)生(shēng)成。
剛才是有人類參照的,但是在開放性環境裏麵我們很難有人的參照,需要機器人(rén)能夠自主的決策,我們也(yě)解決了中間的評價以及能夠快速學習的問題(tí)。
對這種開放混雜場景,我們(men)進(jìn)一步引入了語言大模型和視覺大模型。大模型通過大量數據的訓(xùn)練,雖然裏(lǐ)麵包含了各種各樣的物體,但是它還是有很多的物體是檢測不了的。當它堆點在(zài)一起的時候,它檢測的準確性,定位的準(zhǔn)確性都是很(hěn)低的(de),這直接導致機器人執(zhí)行的失敗。
在(zài)這種情況下,我們怎麽能夠(gòu)讓機器人通過它的(de)行為逐步地收斂到正確的結果裏麵?我們就提出來了(le)把語言大模型視覺大模型和機器人操(cāo)作的模型去融合來(lái)進行(háng)學習(xí),實現了在混(hún)雜場景下,通過它的操作,最(zuì)後來完成我(wǒ)們(men)要求的工作。
通過這樣一係列的,從強化學習、語言模型以(yǐ)及模仿的結合,我們可以讓機(jī)器人完成桌麵的梳理,它會進行長(zhǎng)序列的(de)規劃生成,在最後來(lái)達(dá)到我們的製定的要求。
在機器人的伺服控製中,這種(zhǒng)傳統的方法(fǎ)對於場景的變化,還是有一個局限性。我(wǒ)們用學習的方法的話它非常依賴(lài)於我們的數據。我們能夠實現端到(dào)端的伺服控(kòng)製,包括背景的變化,以及適應傳感器在應(yīng)用過程(chéng)當中不小心把它碰動了(le),它的外參變化了,在這樣的擾動下,我(wǒ)們是不(bú)是依然能夠去適應?以及(jí)如(rú)何適應各種場景裏麵的紋理。
這(zhè)個deepmind通過8個小時的訓(xùn)練可以達到9.98的成功率,我們用一個小時的訓練能夠達到99.99%的(de)成功率,而且它能(néng)夠適應不同的接口以及各種(zhǒng)形狀。
今年3月份,在(zài)浙江省寧波市政府的支持下,人(rén)形機器人創新中心正式啟動,領航(háng)者1號正式(shì)發布。我們在之前(qián)的基礎上進一步做了優化改進,同時也更強調(diào)了賦予類人的學習和操作(zuò)的能力。目前機器人的行走已經完成了(le)室內平整地麵的測試,在如何適應(yīng)各種場景,在執行各種動作之間依然(rán)保證平衡控製(zhì)以及如何進一步提高節(jiē)拍等方麵也在持(chí)續研(yán)究中。我們也研發了靈巧手,能夠實現更快速度的操作。
人形機(jī)器人真正形成一個產品,還是有很多的工作要做。作為一個(gè)產品來講,它要實現高可靠性低成本。從整機來講,它的可靠性都(dōu)是需要進一步降低成本(běn),這依賴於我們的核心零(líng)部件,需要大家都圍繞人形機器人來做。
但是,動力部(bù)件(jiàn)的功率密度跟人形機器人真正實現靈巧運動還是有一定差距的。我們往往說力舉夠了,速(sù)度夠了,體(tǐ)積過大,這個人形機器(qì)人看著比較笨重,或者有一定(dìng)的威脅感了,如何提升部件的性(xìng)能,依然是我們麵臨的問題,像(xiàng)我們的傳感器也(yě)是一(yī)樣的,怎麽樣能夠在(zài)小體積下做到高精度的響應也是我(wǒ)們麵臨的問題。
第二個是運動控製。我們的人形機器人要能夠實現各種靈巧(qiǎo)的運動作業,運動控製是(shì)非常重要的基礎。我們現在在這方麵已經有(yǒu)了很好的基礎,各種技術路線也有突破,能夠去展示一定的(de)能力。但是,我們會看到它對你的作業對象的適應性、環境的(de)適應性還是非常的有限的。如何把機器人環境、任務融(róng)合起來發展,如何把技術路線打通,去推動這方麵的發展,也依然(rán)需要我們去探索。
第三(sān)個是人工智能。目前大模型非常熱,但是真正把大模型部署(shǔ)到機器人上麵,還是有很多的局(jú)限(xiàn)性(xìng)。我們現在的大模型依(yī)然靠數據,有(yǒu)一定(dìng)的泛化能力,還是需(xū)要優化。有了大模型(xíng),等於給我們提供了一個更加好的技術支持(chí)。如何(hé)把大模型融合到(dào)機器人裏麵,實現真正能夠作業(yè)的具身智(zhì)能,現在還是需要研究探索。
投稿箱:
如果您有機床行業(yè)、企業相關(guān)新聞稿件發表,或進行(háng)資訊合作,歡迎聯係本網編輯部, 郵箱:skjcsc@vip.sina.com
如果您有機床行業(yè)、企業相關(guān)新聞稿件發表,或進行(háng)資訊合作,歡迎聯係本網編輯部, 郵箱:skjcsc@vip.sina.com
更多相關信息
業界視(shì)點
| 更多
行業數據
| 更多
- 2024年11月 金屬切削機床產量數據
- 2024年11月 分地區金屬切削機床產(chǎn)量數(shù)據
- 2024年11月 軸承出口情況
- 2024年11月 基(jī)本型乘用車(轎車)產(chǎn)量數據
- 2024年11月 新能源汽(qì)車產量數據
- 2024年11月 新能源(yuán)汽車銷量情況
- 2024年10月 新能源汽車產量數據
- 2024年10月 軸承出口情況
- 2024年10月 分地區金屬切削機床產量(liàng)數據
- 2024年10月 金屬切削機床產量數據
- 2024年9月 新能源汽車銷量情況
- 2024年8月 新能源汽車產量數(shù)據
- 2028年8月 基本型乘用車(chē)(轎車)產量數據