三菱電機研發場景(jǐng)感知交互技術 可給駕駛員提供(gòng)自然直觀的指導
2020-7-27 來源(yuán):- 作者:-
為讓機器(qì)與人類更加直觀、自然地互動,三菱電機研發了一種場景感知交互技術。
據外媒報道,近日,日本三菱電機(Mitsubishi Electric Corporation)公司宣布其研(yán)發了全球首款能夠與人(rén)類進行(háng)高度自然其直觀互動的技術,該技術(shù)基於場景感知能力,能夠將(jiāng)多模態感知信息翻譯成自然語言。該款新技術(shù)名為場景感知交互(Scene-Aware Interaction),整合了(le)三菱電機的專有Maisart緊湊型AI技(jì)術,可以(yǐ)分析多模態感知信息,通過依(yī)賴於上下文情境生(shēng)成的自然語言與人類實現(xiàn)高度自然且(qiě)直觀的(de)交互。
(圖片(piàn)來源:三菱電機)
該技術基於多模態感知信息,如攝像頭捕捉的圖像和視頻、麥克風錄下的音頻信息以及激光雷達測量的(de)定位信息,以識別情境中的物(wù)體。為了對這些不同類別的(de)信(xìn)息進行優先排序,三菱電機研發了注意力多(duō)模態融合技術(Attentional Multimodal Fusion),能(néng)夠自動加權突出的單模態(tài)信(xìn)息,為準確描述場景而選擇適(shì)當詞匯。在采用通用測試集的基準測試中,注意力(lì)多(duō)模態融合技術采用(yòng)音頻(pín)和視(shì)覺信息來取得基於共識的圖(tú)像描述評價(CIDEr)得分,發現比(bǐ)僅使用視覺信息的得分高出29%。三菱(líng)電機(jī)將注意力多模態融合與場景理解技術和基於情境的自然語(yǔ)言生成技術相結合,實現了強大的(de)端到端場景感知交互係統,在不同(tóng)場景下,都可以與(yǔ)用(yòng)戶實現高度直觀(guān)的交互。
(圖片來源:三菱電機)
場景感(gǎn)知交互技術可用於汽車導航應(yīng)用(yòng),為駕駛員提供直觀的(de)路線導航。例如,係統不再指示駕駛員“在50米內右轉”,而是提供場景感知型指導,如“在郵箱前右轉”或“跟著灰色的車向(xiàng)右轉”。此外,該係統還會在預測到附近有物體的行進路徑與車輛的行進路徑相交時,生成語音警報(bào),如“有行人正在過馬路(lù)”。為了實現這一(yī)功能,該係統會分(fèn)析場景,識別出場景中隱藏的視覺路標以及動(dòng)態元素,然(rán)後利用此類東西識別物體(tǐ)和事件(jiàn),為導航生成直觀的句子指導。
(圖片來源:三菱電機)
利用深度神經網絡進行物體識別、視(shì)頻描述、自然語言生成和口語對話等技術最(zuì)近取得(dé)了很多進展,可以讓機(jī)器能夠更好地理解周圍的環境,並更(gèng)自然、更直觀地與人(rén)類互動。場景感知交互技術預計(jì)具有廣泛的適用性,包(bāo)括用於車載信息娛樂係統的人機接口、在建築物中與機器人交互以及工廠自動化係統、監(jiān)控人類健康狀況的係統、為人類解釋複雜場景的(de)監測係統、鼓勵保持社交距離的係統、在公共場所支持(chí)無觸摸操作設備的係統等等。
投稿箱:
如果您有機(jī)床行業、企業相關新(xīn)聞稿件發表,或進行資訊(xùn)合作,歡迎聯係本網編輯部, 郵箱:skjcsc@vip.sina.com
如果您有機(jī)床行業、企業相關新(xīn)聞稿件發表,或進行資訊(xùn)合作,歡迎聯係本網編輯部, 郵箱:skjcsc@vip.sina.com
更多相關信息
業界視點
| 更多
行業數據
| 更多
- 2024年11月 金屬(shǔ)切削機床產量數(shù)據(jù)
- 2024年11月 分地區金屬切削機床產量數據
- 2024年11月 軸承出口(kǒu)情況
- 2024年11月 基本型乘用車(chē)(轎車)產量數據
- 2024年11月 新能源汽車產量數據
- 2024年11月 新能源汽車銷(xiāo)量情(qíng)況
- 2024年(nián)10月 新能源汽車(chē)產量數據
- 2024年10月 軸承出口(kǒu)情況
- 2024年10月 分地區金屬切削機床產量數據
- 2024年10月(yuè) 金屬切削機床產量數據
- 2024年9月 新能源(yuán)汽車銷量情況
- 2024年(nián)8月 新能源汽車產量(liàng)數據
- 2028年8月 基本(běn)型乘用車(轎(jiào)車)產量(liàng)數據(jù)