久久青草精品38国产,日日噜噜夜夜狠狠视频免费,精品国产免费一区二区三区香蕉,精品色卡一线二线三线的

當(dāng)前位置:首頁 >>> 行業(yè)相關(guān)資訊

AI人形機器人研究:與汽車行業(yè)聯(lián)動,主機廠押注人形機器人賽道

發(fā)布時間:2023-11-20 20:32:50

與機械臂、AGV相比,AI人形機器人應(yīng)用場景更具通用性

 

AI人形機器人是指由AI大模型賦能,具有與人類似外觀和運動方式的機器人。AI大模型從語音、視覺、決策、控制等多方面與人形機器人結(jié)合,使機器人具備理解指令并執(zhí)行指令的功能。
 
借助AI大模型賦能,AI人形機器人應(yīng)用場景更具通用性。
 
例如,2023年8月,智元機器人推出的遠征A1,由百億級參數(shù)的WorkGPT大模型賦能,擁有理解指令,并對指令進行任務(wù)編排和執(zhí)行閉環(huán)能力。預(yù)計2024年商用,并率先用于工業(yè)制造領(lǐng)域如3C 制造、 汽車制造,隨后逐步走向to C應(yīng)用如家庭場景。
 
2022年8月,小米推出的Cyberone。其搭載自研Mi-Sense 深度視覺模組+ AI 交互算法,擁有三維空間感知能力,實現(xiàn)身份、手勢和表情識別。此外,在情緒感知上,其能識別85 種環(huán)境語義和 6 大類 45 種人類情緒。未來將率先用于小米智能制造工廠、同時還支持多種應(yīng)用場景,如家庭助理、陪伴機器人、教育輔助等。

智元機器人元征A1應(yīng)用場景示例

 

AI人形機器人大模型從VLM向VLA進化

 

      RT-2一方面吸收了VLM語義推理、問題解決、視覺解釋能力,另一方面能從真實的機器人動作中實現(xiàn)具身任務(wù)推理,且兩方面能夠相互促進。

 

訓(xùn)練方式上,RT-2通過將機器人動作拆解為文本token的形式,實現(xiàn)了直接與視覺語言數(shù)據(jù)混合后輸入VLM進行聯(lián)合微調(diào)。

 

RT-2不僅是對現(xiàn)有VLM模型的簡單而有效的修改,還展示了構(gòu)建通用物理機器人的前景,讓機器人可以推理、解決問題和解釋信息,以在現(xiàn)實中執(zhí)行各種任務(wù)。