天天操夜操-天天操夜夜-天天操夜夜爱-天天操夜夜逼-天天操夜夜操-天天操夜夜操狠狠操


首頁
產品系列
行業應用
渠道合作
新聞中心
研究院
投資者關系
技術支持
關于創澤
| En
 
  當前位置:首頁 > 新聞資訊 > 行業動態 > OmniManip引⼊了 VLM 規劃和機器⼈執⾏的雙閉環系統設計,提升機器人3D操作能力  
 

OmniManip引⼊了 VLM 規劃和機器⼈執⾏的雙閉環系統設計,提升機器人3D操作能力

來源:機器人大講堂      編輯:創澤      時間:2025/1/27      主題:其他   [加盟]

近年來視覺語⾔基礎模型(Vision  Language  Models,  VLMs)在多模態理解和⾼層次常識推理上⼤放異彩,如何將其應⽤于機器⼈以實現通⽤操作是具身智能L域的⼀個核⼼問題。這⼀⽬標的實現受兩⼤關鍵挑戰制約:

1. VLM 缺少準確的 3D 理解能⼒:通過對⽐學習范式訓練、僅以 2D 圖像 / ⽂本作為輸⼊的 VLM 的天然局限;

2. ⽆法輸出低層次動作:將 VLM 在機器⼈數據上進⾏微調以得到視覺 - 語⾔ - 動作(VLA)模型是⼀種有前景的解決⽅案,但⽬前仍受到數據收集成本和泛化能⼒的限制。

針對上述難題,北⼤攜⼿智元機器⼈團隊提出了 OmniManip 架構,基于以對象為中⼼的 3D 交互基元,將 VLM 的G層次推理能力轉化為機器⼈的低層次G精度動作。

針對⼤模型幻覺問題和真實環境操作的不確定性,OmniManip 創新性地引⼊了 VLM 規劃和機器⼈執⾏的雙閉環系統設計,實現了操作性能的顯著突破。

實驗結果表明,OmniManip 作為⼀種免訓練的開放詞匯操作⽅法,在各種機器⼈操作任務中具備強⼤的零樣本泛化能⼒。

OmniManip 的關鍵設計包括:

基于 VLM 的任務解析:利⽤ VLM 強⼤的常識推理能⼒,將任務分解為多個結構化階段(Stages),每個階段明確指定了主動物體(Active)、被動物體(Passive)和動作類型(Action)。

以物體為中⼼的交互基元作為空間約束:通過 3D 基座模型⽣成任務相關物體的 3D 模型和規范化空間(canonical space),使 VLM 能夠直接在該空間中采樣 3D 交互基元,作為 Action 的空間約束,從⽽優化求解出 Active 物體在 Passive 物體規范坐標系下的⽬標交互姿態。

閉環 VLM 規劃:將⽬標交互姿態下的 Active/Passive 物體渲染成圖像,由 VLM 評估與重采樣,實現 VLM 對⾃身規劃結果的閉環調整。

閉環機器⼈執⾏:通過物體 6D 姿態跟蹤器實時更新 Active/Passive 物體的位姿,轉換為機械臂末端執⾏器的操作軌跡,實現閉環執⾏。

物體的交互基元通過其在標準空間中的交互點和⽅向來表征。交互點 p∈R3 表示物體上關鍵的交互位置,⽽交互⽅向 v∈R3 代表與任務相關的主要軸。這兩者共同構成交互基元 O={p,v},封裝了滿⾜任務約束所需的基本⼏何和功能屬性。這些標準交互基元相對于其標準空間定義,能夠在不同場景中保持⼀致,實現更通⽤和可重⽤的操作策略。

對于通⽤物體的交互點提取,OmniManip 利⽤視覺語⾔模型(VLM)在原圖(當部件可⻅且實體存在時)或在正交視圖中渲染的 3D ⽹格(當部件不可⻅或實體不存在時)上進⾏定位。

與 CoPa 和 ReKep 等⽅法不同,OmniManip 直接讓 VLM 進⾏ grounding,不會受限于不穩定的 part 分割或聚類結果。

在交互⽅向的采樣⽅⾯,由于物體的規范化空間通過 Omni6DPose 錨定,軸的⽅向與語義對⻬,該團隊讓 VLM 直接對物體標準空間的軸進⾏語義描述,并根據操作任務進⾏匹配度排序,以獲得交互⽅向的候選。

雙閉環系統設計

李⻜⻜團隊的⼯作 ReKep 通過關鍵點跟蹤巧妙地實現了機械臂的閉環執⾏,但其 VLM 規劃過程是開環的。OmniManip 則更進⼀步,得益于以物體為中⼼的設計理念,⾸次在 VLM 規劃和機械臂執⾏層⾯實現了雙閉環系統:

閉環規劃:在實驗中,VLM 推理很容易出現幻覺,導致錯誤的規劃結果(尤其是在涉及 3D 旋轉的任務中,如倒⽔、插筆)。OmniManip 賦予 VLM 閉環規劃能⼒,通過渲染物體的三維模型,幫助 VLM 「腦補」出規劃結果后的物體樣貌,再判斷其合理性。

這⼀功能賦予了 VLM 空間反思能⼒,使其能夠在測試時進⾏推理,類似于 OpenAI 的 O1,⼤⼤提⾼了操作成功率。為了保持框架的簡潔性,研究團隊沒有設計復雜的測試時推理流程,僅作⼀輪校驗就已明顯提⾼了 VLM 的規劃準確率。

閉環執⾏:OmniManip 提取的交互基元位于物體的規范空間中,只需引⼊⼀個 6D 位姿跟蹤器即可輕松實現閉環操作。與 ReKep 使⽤的關鍵點跟蹤器相⽐,基于物體的 6D 位姿跟蹤⽅式更為穩定,并對遮擋具有更強的魯棒性。(缺點則是不如關鍵點靈活、⽆法建模柔性物體操作。)

▍實驗結果

強⼤的開放詞匯操作性能

在 12 個真機短程任務上,OmniManip 均展現出不錯的性能。

雙閉環系統設計為 OmniManip 帶來了約 17% 的性能提升,這證明了 RRC 在有效減少⼤模型幻覺影響⽅⾯的作⽤。

交互基元的魯棒性

VLM 需要基于交互基元對機器⼈操作進⾏規劃,如果交互基元本身存在問題,VLM 就會陷⼊「巧婦難為⽆⽶之炊」的困境。因此,可靠的交互基元⾄關重要。以往的⽅法通常是讓 VLM 直接在相機拍攝的 2D 圖像上采樣交互基元,然后通過相機的內外參數轉換到 3D 空間。

然⽽,由于 2D 圖像存在空間歧義,采樣效果對相機視⻆、圖像紋理和部件形狀等因素J為敏感(例如,當相機平視杯⼦時,之前的⽅法只能對準杯⼦的側壁、⽽不是開⼝)。⽽ OmniManip 則是在物體的 3D 規范空間中進⾏采樣,能夠輕松克服 2D 圖像的局限性,實現可靠的 3D 交互基元提取。

強⼤的拓展性與潛⼒

OmniManip 能夠與 high-level 任務規劃器結合,實現⻓程任務操作

作為⼀種以物體為中⼼的算法,OmniManip 與機械臂本體解耦,能夠零成本遷移⾄不同形態的本體(例如雙臂⼈形機器⼈)。

OmniManip 具有強⼤的通⽤泛化能⼒,不受特定場景和物體限制。團隊已將其應⽤于數字資產⾃動標注 / 合成管道,實現⼤規模的機器⼈軌跡⾃動采集。



中國人工智能系列白皮書:復合多態機器人,具身智能重要實現路徑的技術特點、應用場景及未來發展潛力

探討了復合多態機器人作為具身智能重要實現路徑的技術特點、應用場景及未來發展潛力。報告通過多模態感知、多場景適應和功能解耦等技術核心,全面分析了智能機器人如何革新服務與生產模式

移動機器人(AGV_AMR)專用激光雷達產品發展藍皮書-銷售數量約210000 臺, 銷售規模約 8億

中國市場AG V/AMR專用激光雷達銷售數量約 210000 臺, 銷售規模約 8億元; 相信 3D多線 激光雷達將在移動機器人領域迅速打開市場

表情陪伴人形機器人:AI 陪伴的高級賽道,市場需求近萬億,老年人群中的潛在需求約4200億

測算出陪伴機器人在老年人群中的潛在需求約 4200億元人民幣,陪伴機器人在青年人群中的潛在需求約5000億元人民幣,在醫療場景下也有較大的應用前景

表情陪伴人形機器人:AI陪伴的高級賽道,需求近萬億,老年人需求約 4200億

人人都需要陪伴,中國陪伴機器人潛在市場需求近萬億;老年人群中的潛在需求約4200億元;在青年人群中的潛在需求約5000億,自閉癥兒童的情緒監控領域也有較大的應用前景

醫療場景陪伴機器人市場前景:潛在需求約39億

全球5歲以下患自閉癥兒童人數超過60萬人,平均每個兒童每年花費6萬 美元,每年治療費用約360億美元。假設當前的陪伴機器人價格為6500美 元(參考東芝的宮原香苗機器人價格6500美元~12000美元),若每個自閉 癥兒童配備一個陪伴機器人,潛在市場需求為39億美元

青年陪伴機器人市場前景:潛在需求約5000億

陪伴機器人在中國青年人群中的潛在市場需求約5000億,售價將會在0.5-6萬元區間,我們認為以2萬元/臺作為價格的中性假設是合理的

深圳人形機器人產業發展情況:具有人形機器人產業先發優勢

深圳市機器人產業發展良好,且擁有優必選、逐際動力、樂聚機器人等一批本體企業,發布了優必選Walker X、樂聚夸父、逐際動力CL-1等人形機器人產品,已具有人形機器人產業先發優勢

珠三角人形機器人產業發展情況:全球人形機器人供應鏈的重要集聚區

珠三角地區是全球人形機器人供應鏈的重要集聚區,控制、伺服系統技術較為領先;以深圳為發展重心,廣佛莞為發展主力的人形機器人產業發展格局

長三角人形機器人產業發展情況:完整的機器人產業鏈條

長三角是我國工業機器人產業發展最為完備的區域之一,產能規模大,產業鏈條完整,產業投資集聚度高,以上海為核心,蘇州、南京、常州、杭州、寧波、蕪湖多點發力的發展格局,綜合實力走在全國前列。

京津冀人形機器人產業發展情況:產業鏈協同發展模式

北京科技創新資源豐富,產業發展程度在三地居于首位,而天津與河北工業基礎也較雄厚且傳統產業轉型需求旺盛,故許多機器人企業采取北京研發,生產,落地在天津,河北的模式,且河北發展成為京津機器人企業的重要零部件供應地

老人陪伴機器人市場前景:潛在需求約4200億

陪伴機器人在中國老年人群中的潛在市場需求為4200億人民幣,未來中國陪伴機器人(含桌面級、寵物級、表情陪 伴機器人)的售價將會在0.5-6萬元區間

機器人產業面臨的三個主要問題:行業內卷無序價格競爭,關鍵核心技術和占有率低

機器人產品在技術上趨于同質化,難以形成明顯的差異化競爭優勢;部分關鍵核心技術仍需突破,限制產業進一步發展;部分國產機器人品牌在高端市場表現相對薄弱
 
資料獲取

服務機器人在展館迎賓講解
新聞資訊
== 資訊 ==
» 輪式移動機器人的構成要素:車體、車輪、支
» 智能機器人自主位置的檢測常用的五種方法
» 輪式移動機器人的種類:車輪數、運動約束性
» 上海市支持人工智能賦能廣告業創新發展的若
» 杭州市具身智能機器人“強鏈補鏈” 三年行
» GB/T 45873-2025《信息技術
» 2025AI賦能教育行業發展趨勢報告-解
» 國家標準丨GBT 45988-2025《
» 2025年人工智能就緒度白皮書-企業數智
» 北京經濟技術開發區關于推動具身智能機器人
» 上海市進一步擴大人工智能應用的若干措施[
» 人形機器人面臨的問題與突破方向-沒有一個
» 垂直領域具身智能機器人的野望?餐廳,家政
» 我們距離真正的具身智能大模型還有多遠,在
» 機器人產業規模化的機遇與挑戰,增長速度快
 
== 機器人推薦 ==
 
迎賓講解服務機器人

服務機器人(迎賓、講解、導診...)

智能消毒機器人

智能消毒機器人

機器人底盤

機器人底盤

 

商用機器人  Disinfection Robot   展廳機器人  智能垃圾站  輪式機器人底盤  迎賓機器人  移動機器人底盤  講解機器人  紫外線消毒機器人  大屏機器人  霧化消毒機器人  服務機器人底盤  智能送餐機器人  霧化消毒機  機器人OEM代工廠  消毒機器人排名  智能配送機器人  圖書館機器人  導引機器人  移動消毒機器人  導診機器人  迎賓接待機器人  前臺機器人  導覽機器人  酒店送物機器人  云跡科技潤機器人  云跡酒店機器人  智能導診機器人 
版權所有 © 創澤智能機器人集團股份有限公司     中國運營中心:北京·清華科技園九號樓5層     中國生產中心:山東日照太原路71號
銷售1:4006-935-088    銷售2:4006-937-088   客服電話: 4008-128-728

主站蜘蛛池模板: 亚洲欧美中日韩中文字幕 | 久久精品一区二区三区日韩 | 91sex国产| 国产欧美日韩一区二区三区在线 | 视频二区 | 国内精品免费久久久久妲己 | 91热久久免费频精品动漫99 | 亚洲精品影院久久久久久 | 天天噜天天爽在线视频 | 亚洲欧美另类日本 | 日本大bbbbb 日本大尺度叫床戏做爰有声音 | 久久久国产精品免费视频 | 亚洲精品久久久久中文 | 久久综合本色宗合一本色 | 中文字幕国产欧美 | 免费岛国小视频在线观看 | 国产99精品一区二区三区免费 | 免费奸逼视频 | 亚洲精品乱码中文字幕无线 | 99高清免费国产自产拍 | 国产精品高清一区二区三区不卡 | 激情综合网五月 | 国产欧美激情一区二区三区 | 性视频高清免费视频播放 | 欧美精品在线看 | 久久久亚洲 | 日韩黄在线观看免费视频 | 怡红院日本一道日本久久 | 成人午夜两性视频免费看 | 国产日产亚洲精品 | 国产福利自产拍在线观看 | www日本www| 日本五级床片全部免费午夜 | 久久久久久中文字幕 | 国产综合亚洲欧美日韩一区二区 | 成人福利视频在线播放 | 亚洲国产人久久久成人精品网站 | 日本中文字幕在线精品 | 国产成人一区二区在线不卡 | 在线日韩欧美一区二区三区 | 成人亚洲欧美 |