成人无码H动漫网站免费_国产精品久久久久久久久久久久人四虎_日韩精品一区二区三区中文无码_夜夜高潮夜夜爽夜夜爱爱_产精品无码久久_亚洲国产精_国产精品亚洲日韩欧美色窝窝色欲

技術解讀丨RoboDual:行業首款通用具身操作的雙系統協同框架誕生 發布時間:2024-10-22 13:00:00


        近日,智元機器人攜手上海人工智能實驗室成功打造了行業首款通用具身操作的雙系統協同框架——RoboDual。


        這一創新成果將Generalist(通才)的廣泛適應性也就是泛化能力,和Specialist(專才)的高效精準性完美融合,顯著增強了機器人操作的靈活性和準確性。


        在傳統的具身智能機器人系統中,“大腦”負責環境理解、任務規劃和決策,推理能力出眾但實操效率不高;而“小腦”則專注于運動規劃和控制,操作能力強但泛化能力有限。兩者通常各自為戰,難以實現協同作業。


        智元機器人與上海人工智能實驗室創新性地研發出RoboDual雙系統協同框架,利用“小腦”低延遲、高精度、訓練高效的優勢來彌補“大腦”實操效率低下的不足。該框架直接部署在機器人邊緣側進行高效推理,“大小腦”交替執行任務。這種設計不僅提高了操作精度和降低了延遲,還大幅提升了場景和指令的泛化能力。同時,在單個任務或場景的微調上也更加高效,并在各項常見評測指標上超越了通才和專才模型。


        下面讓我們一起看下RoboDual系統的技術表現。





        構建通用且泛化的操作策略一直是機器人領域的核心目標。傳統的機器人學習方法通常針對特定機器人和任務來開發模仿學習算法,例如ACT和Diffusion Policy,這些方法在特定場景中表現出色,但在泛化能力上較為有限。隨著機器人在開放、多任務環境中的應用增加,能夠適應不同任務和機器人構型的系統需求也在上升,這促使了通用模型的發展,如RT-2和OpenVLA等。這些模型通過大規模、異構的數據集提升跨域泛化能力,旨在將普遍知識融入到機器人控制中。


        雖然基于 VLA 的通用策略在不同場景中表現出很強的泛化性,但其仍存在一些局限:


           ·目前預訓練好的模型仍不具備zero-shot的遷移能力,而對現有大模型直接微調需要足夠的訓練數據和算力。因此我們需要更高效的路徑來快速適配(adapt)到新場景或新機器人本體;


           ·以OpenVLA為例,這類大模型的參數量龐大,并以自回歸的方式預測每個自由度的動作輸出,推理延遲高(<5Hz),很難對一些動態場景做實時響應,也難以實現需要精細位置控制的操作任務;


           ·當前的通用模型僅能處理單幀的 RGB 輸入,雖然這允許它們可以通過更大規模的(非機器人操作)數據集進行訓練,但在深度信息或觸覺反饋等額外傳感器輸入對機器人操作任務至關重要的情況下,很難靈活擴展輸入模態以提高性能。


221.jpg

RoboDual整體框架結構


        我們發現,在具身走向通用的路徑中,專用策略(Specialist Policy)低延遲、高精度、訓練高效的特點剛好可以彌補當前通用模型(Generalist Policy)的劣勢,于是團隊提出了RoboDual工作,將Generalist的泛化能力和Specialist的精準高效結合到一個協同工作框架中,不僅在操作時的精度更高、延遲更低,還具備更強的場景、指令的泛化能力,同時對于單個任務或場景的微調更加高效。


222.jpg

RoboDual模型框架


        RoboDual中的Generalist部分參考基于Prismatic-7B VLM的OpenVLA架構,以觀察的視頻幀與指令作為輸入,自回歸地生成action latents及相應的離散動作輸出,并將其傳到下游Specialist模型作為condition;Specialist部分采用可擴展的Diffusion Transformer (DiT)架構,接收多種傳感器(如RGB相機)輸入的同時,將Generalist的輸出作為參考,經過去噪得到未來幾步的連續動作。


        同時,由于Generalist與Specialist的輸出頻率不同,為保證較低的控制延遲,Generalist與Specialist實行異步控制(即Generalist輸出一步時,Specialist輸出多步),在較慢,但更魯棒的Generalist輸出指引下,實現順滑且靈巧的動作控制。在真機實驗中,我們采用NVIDIA RTX 5000 Ada GPU進行推理,RoboDual可以實現15Hz的控制頻率。


        在大量仿真(CALVIN)及真機的實驗發現,RoboDual均領先現有的Generalist和Specialist模仿學習方法,可以利用僅5%的數據實現任務和場景的高效適配。此外我們在真機實驗中還設計了眾多泛化場景,RoboDual在不失推理效率的同時實現了更優的泛化性能。


224.jpg
223.jpg

真機任務及泛化實驗


        通過將RoboDual與OpenVLA進行對比,可見RoboDual在同樣的泛化場景中保持了明顯更低的推理延遲。至此,RoboDual提供了一個讓通用操作大模型廣泛落地應用的解決方案。


真機推理效率對比(與OpenVLA)


        智元機器人與上海人工智能實驗室共同研發的RoboDual系統,不僅提供了一個讓通用操作大模型廣泛落地應用的解決方案,更為機器人技術的未來發展指明了方向。隨著RoboDual系統的不斷完善和應用,我們希望它能為機器人操作領域帶來更高效、更精準、更智能的未來。


主站蜘蛛池模板: 一区二区三区在线观看免费 | 欧美又粗又大BBBBXXXX | 亚洲国产成人久久精品软件 | 一区二区中文视频 | 人人澡人人澡人人看添欧美 | 男生戳美女两腿中间那个视频 | 久久久久国产精品免费A片 伊人成色综合人夜夜久久 欧美日韩精品一区二区三区高清视频 | 凹凸精品视频分类国产品免费 | 无码纯肉视频在线观看喷水 | 亚洲成人一区二区在线观看 | 国产成在线观看免费视频成本人 | 97人人添人人澡人人澡人人澡 | 久久99精品久久久久久不卡 | 久久99热这里有精品6 | 精品欧美h无遮挡在线看中文 | 免费一区二区三区视频在线 | 免费在线观看黄色片 | 四虎永久在线精品免费看 | 老熟女草BX× | 久久91精品久久久久久秒播 | 偷拍区清纯另类丝袜美腿 | 久久综合网欧美色妞网 | 复仇者联盟4免费版高清在线观看 | 日本丰满少妇毛茸茸 | 性导航唐人社区 | 精品国产一区二区三区久久久久久 | 成人看片黄A免费看那个网址 | 久久亚洲精品国产精品777777 | 国产成人无码免费视频79 | ab免费在线观看 | 亚洲AV永久无码精品水牛影视 | 无码人妻久久久一区二区三区 | 日本精品VIDEOSSE×少妇 | 欧美在线视频一区 | 轻轻色在线观看 | 久久精品久 | 国产一级免费 | 全部免费毛片在线播放网站 | 亚洲精品av无码重口另类 | 戴着项圈的贵妇被调教 | 黄色一级免费片 |