試想一下,當(dāng)具身智能機器人走入生活場景:你想喝可樂,告訴機器人說“幫我拿瓶冰鎮(zhèn)可樂”,具身智能機器人先掃視客廳,鎖定冰箱位置,同時認出沙發(fā)旁的你正看著電視。它走近冰箱,用手感知門把弧度,調(diào)整力度拉開門,目光定位到可樂所在的冷藏層,輕拿起瓶子避免晃動,遞過來時還不忘提醒“有點冰”。而這背后,具身智能機器人需要具備“聽懂”指令、“感知”客廳環(huán)境、“識別”冰箱和可樂、并精細操作物體的多重能力。這些看似簡單的動作,實則是對機器人“認知-決策-執(zhí)行”全鏈條能力的嚴苛考驗——從理解人類語言的意圖,到感知復(fù)雜環(huán)境、精準(zhǔn)定位物體,再到靈活地完成符合物理規(guī)律的精細操作,每環(huán)缺一不可。

在近期結(jié)束的2025世界人工智能大會(WAIC 2025)上,梅卡曼德就將這些能力搬上了舞臺:通用具身“眼腦手”可讓機器人具備多種AI核心能力,讓未來場景照進現(xiàn)實成為可能。
高效自主處理長線程復(fù)雜柔性任務(wù)
疊衣是非常常見的長序列柔性任務(wù):看似簡單,對機器人卻極具挑戰(zhàn),尤其是面對T恤、襯衫等柔性且易形變的非剛性物體。梅卡曼德通用“眼+腦”能力可以讓機器人很好地應(yīng)對這一難題。
在視頻里,機器人可以精準(zhǔn)識別衣物的邊角、褶皺,清晰掌握衣物的形態(tài)與擺放情況。“大腦” 自主思考、決策疊衣任務(wù)邏輯,規(guī)劃出從抓取到抻平、對折再到整理成形的完整步驟。雙臂機器人協(xié)同運作,輕柔抓取衣物,在避免拉扯導(dǎo)致變形的同時,嚴格按照規(guī)劃步驟執(zhí)行,高效、快速將無序衣物自主疊放整齊。
自主認識、精細操作海量真實物體

真實物理世界中有數(shù)百萬種真實物體,小到一顆螺絲、一個紐扣,大到重型機械、精密儀器,形態(tài)各異、功能不同。對于具身智能機器人而言,要在不同場景中發(fā)揮作用,操作這數(shù)百萬種海量物體的能力至關(guān)重要。梅卡曼德憑借通用機器人 “眼腦手” ,在物體的泛化性識別、抓取上展現(xiàn)出巨大能力。在視頻里,梅卡曼德的“眼腦手”讓機器人可以自主認識并精細抓取海量真實物體:“眼睛”可以自主識別各種真實物體,“大腦”能理解不同物體的操作邏輯,“手”能精準(zhǔn)執(zhí)行相應(yīng)操作,還可以認識標(biāo)簽并自主分類,效率高。
理解自然語言指令,自主執(zhí)行多樣任務(wù)

通過Mech-GPT,機器人能夠理解物體大小、顏色、形狀、種類等各種常識信息,并根據(jù)自然語言指令完成物體精準(zhǔn)抓取、放置、組合等多樣任務(wù)。
對于應(yīng)用到更多場景的具身智能機器人而言,自主推理、理解人類需求,理解自然語言指令非常重要。這是機器人能否精準(zhǔn)捕捉人類需求、高效完成復(fù)雜任務(wù)的關(guān)鍵——畢竟,人類早已習(xí)慣用日常話語傳遞意圖,而非刻板的代碼指令。只有當(dāng)機器人能像人類一樣“聽懂”弦外之音、理清邏輯順序,才能真正讓具身智能機器人在家庭、辦公、服務(wù)等場景中發(fā)揮實際價值。
梅卡曼德通用機器人“眼腦手”,則賦予了機器人高階智能——機器人具備類人的推理和理解能力,自主理解自然語言指令,進行多輪對話,并執(zhí)行復(fù)雜、多樣的任務(wù),讓具身智能機器人真正可以理解人類需求。適配人形機器人等多種形態(tài)機器人能力

梅卡曼德通用機器人“眼腦手”可適配人形、雙臂、輪式、單臂等多種形態(tài)機器人,讓具身智能機器人有望走入更廣泛的家庭、服務(wù)場景,走入千行百業(yè):當(dāng)“眼腦手”與人形機器人結(jié)合,憑借類人形態(tài)的靈活性,能深入家庭、餐廳、零售等充滿復(fù)雜布局的生活服務(wù)場景;結(jié)合輪式機器人時,可在倉儲物流場景中高效完成貨物搬運、貨架整理等任務(wù);而與單臂機器人適配后,憑借協(xié)同作業(yè)的優(yōu)勢,能在零售或精密制造車間參與貨品抓取、零部件組裝等高精度工作,大幅提升生產(chǎn)效率,這也是梅卡曼德具身智能“眼+腦”已經(jīng)實現(xiàn)大規(guī)模、跨場景應(yīng)用的領(lǐng)域。
梅卡曼德通用機器人“眼腦手”,源于我們持續(xù)、快速迭代的多項AI先進技術(shù):
| 眼:Mech-Eye高精度3D相機
基于技術(shù)的快速迭代,Mech-Eye內(nèi)置多項先進AI算法,對各種真實物體可以生成精細的高質(zhì)量點云數(shù)據(jù);精度可達微米級,讓機器人“看”得更清楚。


以上點云由Mech-Eye高精度3D相機采集,物體依次為顏色豐富的烘焙工具&食物、日常護膚品及化妝用品、日常洗漱用品、材質(zhì)/細節(jié)豐富的玩具。
| 腦:Mech-GPT機器人多模態(tài)大模型
梅卡曼德和張建偉院士聯(lián)合推出的Mech-GPT機器人多模態(tài)百億參數(shù)大模型,基于數(shù)百萬真機數(shù)據(jù)和自研VLA技術(shù),賦予機器人類人的學(xué)習(xí)、理解、推理、規(guī)劃及執(zhí)行能力,讓機器人感知動態(tài)變化的真實物理環(huán)境,理解自然語言,并完成復(fù)雜多樣任務(wù)。

| 手:Mech-Hand五指靈巧手
Mech-Hand仿1.7m身高人手設(shè)計,具備多個關(guān)節(jié)及自由度,搭配自研泛化AI抓取算法,像人手一樣具備抓、捏、握、按、捻等多種復(fù)雜動作,穩(wěn)定精細操作各種常見真實物體。
Mech-Hand五指靈巧手抓取玩具、水果、飲料、積木等各種各樣的物體。
梅卡曼德是全球范圍內(nèi)極少數(shù)實現(xiàn)具身智能機器人跨行業(yè)、多場景、大規(guī)模落地應(yīng)用的科技公司之一。其通用機器人“眼+腦”已在全球落地15000+套,預(yù)計2025年出貨量將過萬臺。
公司在具身智能大模型、AI算法、AI軟件、機器人規(guī)劃等核心技術(shù)上積累深厚,技術(shù)升級迭代迅速,同時在AI、具身智能等先進技術(shù)方面研發(fā)進展迅速、成果突出。除關(guān)鍵能力外,通用機器人“眼腦手”可以讓機器人更快速、高效地執(zhí)行任務(wù),在任務(wù)泛化性、環(huán)境復(fù)雜度、執(zhí)行效率等方面均優(yōu)勢明顯,未來將加速推動具身智能機器人走進千行萬業(yè)。