極智嘉發(fā)布全新通用機(jī)械臂操作技術(shù)方案,破解倉(cāng)儲(chǔ)超大規(guī)模商品揀選難題
點(diǎn)擊:1698
A+ A-
所屬頻道:新聞中心
8月27日,全球智能機(jī)器人引領(lǐng)者極智嘉 (Geek+,股票代碼:2590.HK)正式發(fā)布全新通用機(jī)械臂操作技術(shù)方案及全球首個(gè)專為倉(cāng)儲(chǔ)場(chǎng)景打造的具身智能基座模型 Geek+ Brain,旨在攻克倉(cāng)儲(chǔ)自動(dòng)化中的長(zhǎng)久難題——超大規(guī)模商品 SKU的精準(zhǔn)揀選與高效適應(yīng)。
Geek+ Brain為極智嘉通用倉(cāng)儲(chǔ)機(jī)器人提供“超級(jí)大腦”。而首個(gè)通用機(jī)械臂操作技術(shù)方案則聚焦揀選場(chǎng)景,通過(guò)新一代具身智能技術(shù)首次系統(tǒng)性地解決了海量商品形態(tài)、材質(zhì)差異帶來(lái)的機(jī)械臂抓取難題,實(shí)現(xiàn)了全品類、全場(chǎng)景、高適應(yīng)性的自動(dòng)揀貨,為行業(yè)帶來(lái)革命性的應(yīng)用技術(shù)。
此次發(fā)布標(biāo)志著極智嘉的技術(shù)版圖從移動(dòng)機(jī)器人領(lǐng)域延伸至機(jī)械臂智能應(yīng)用,展現(xiàn)出強(qiáng)大的產(chǎn)品技術(shù)研發(fā)和業(yè)務(wù)拓展能力,并將進(jìn)一步釋放其在倉(cāng)儲(chǔ)智能化市場(chǎng)需求中的巨大發(fā)展?jié)摿Α?/span>
通用機(jī)械臂操作技術(shù)方案
解決超大規(guī)模商品揀取難題
在倉(cāng)庫(kù)超大規(guī)模揀貨場(chǎng)景中,“貨物多樣性、環(huán)境動(dòng)態(tài)性”一直使其成為是最難被機(jī)器人完全替代的環(huán)節(jié)之一。
倉(cāng)儲(chǔ)揀貨的核心是“精準(zhǔn)抓取不同貨物”,倉(cāng)儲(chǔ)貨物形態(tài)與材質(zhì)適配難,重量和易損性差異極大等痛點(diǎn),直接導(dǎo)致傳統(tǒng)機(jī)械臂的抓取通用性不足:涵蓋“硬(紙箱、盒子等)、軟(袋裝零食、衣物等)、脆(玻璃制品、化妝品)、散(零件、生鮮)”等多種類型,需要采用不同抓取邏輯。
同時(shí),倉(cāng)儲(chǔ)場(chǎng)景中貨物遮擋、堆疊無(wú)序等環(huán)境變化,會(huì)導(dǎo)致感知精度不足,視覺(jué)識(shí)別與定位出現(xiàn)誤差:“相似外觀混淆”(物品難以被識(shí)別分隔)、“貨物遮擋”(堆疊時(shí)下層貨物被遮擋)等問(wèn)題,要求更高的感知泛化能力。
極智嘉的首個(gè)通用機(jī)械臂操作技術(shù)方案,專為解決這一難題而來(lái)。它通過(guò)多目相機(jī)捕捉高精度 3D環(huán)境信息,結(jié)合系統(tǒng)訂單信息,通過(guò) Geek+ Brain模型完成智能揀選工作:精準(zhǔn)分割物品并識(shí)別材質(zhì)特征,推理生成完整 3D信息和空間定位,進(jìn)而判斷最優(yōu)抓取點(diǎn),智能決策末端執(zhí)行器的吸盤(pán)選擇和機(jī)械臂運(yùn)動(dòng)軌跡,穩(wěn)穩(wěn)完成智能擺放。
圖1機(jī)械臂揀選工作流程圖
亮點(diǎn)1:基于統(tǒng)一協(xié)同的多任務(wù)感知模型
深度融合 2D語(yǔ)義與 3D幾何網(wǎng)絡(luò),大幅提升了透明或反光等復(fù)雜材質(zhì)物體的深度估計(jì)精度,以及外觀相似物體的分割準(zhǔn)確性。同時(shí)實(shí)現(xiàn)檢測(cè)、分割、深度估計(jì)等多任務(wù),降低推理延遲。
圖2多任務(wù)感知模型
亮點(diǎn)2:基于仿真增強(qiáng)的完整三維形狀預(yù)測(cè)
構(gòu)建了包含完整三維幾何信息的物體仿真數(shù)據(jù),支持遮擋區(qū)域補(bǔ)全、完整三維估計(jì)、堆疊推理,將“視覺(jué)識(shí)別”擴(kuò)展為“空間理解”,使機(jī)器人具備更接近人類的空間推理能力,不僅“看得見(jiàn)”,還能“想得出”,有效提升了多物體抓取中的穩(wěn)定性與安全性,減少抓取時(shí)因缺少完整 3D信息造成的滑落或碰撞。
圖3完整三維形狀預(yù)測(cè)
亮點(diǎn)3:多維度感知
基于多維度感知技術(shù),實(shí)現(xiàn)對(duì)柔性物品、易碎品及復(fù)合材質(zhì)的高精度識(shí)別。系統(tǒng)不僅能精準(zhǔn)區(qū)分軟硬材質(zhì),識(shí)別布料等難吸附材料,還可通過(guò)條碼區(qū)域檢測(cè)主動(dòng)規(guī)避關(guān)鍵信息區(qū)域,避免遮擋或損傷,顯著提升抓取的安全性與成功率,相較傳統(tǒng)方案,在復(fù)雜多變的應(yīng)用場(chǎng)景中展現(xiàn)出更強(qiáng)的適應(yīng)性與運(yùn)行穩(wěn)定性。
圖4基于多維度感知技術(shù)實(shí)現(xiàn)高精度識(shí)別
亮點(diǎn)4:基于強(qiáng)化學(xué)習(xí)的通用抓取策略
無(wú)需數(shù)據(jù)標(biāo)注,直接面向任務(wù)的學(xué)習(xí)與優(yōu)化。結(jié)合多維度感知理解,優(yōu)化物品抓取點(diǎn)判斷與末端執(zhí)行器控制策略,支持根據(jù)物品特性自由選擇吸盤(pán)組合,提升抓取成功率與穩(wěn)定性。
圖5優(yōu)化物品抓取點(diǎn)判斷與末端執(zhí)行器控制策略
極智嘉通用機(jī)械臂貨品揀取技術(shù)可實(shí)現(xiàn)四大客戶價(jià)值:
Model-free:即插即用,快速部署
依托 Geek+ Brain海量真實(shí)數(shù)據(jù)預(yù)訓(xùn)練的通用模型,基本實(shí)現(xiàn) Model-free,即插即用, 48小時(shí)快速部署。新入 SKU也無(wú)需額外訓(xùn)練,極大簡(jiǎn)化了上線流程。
99.99%+準(zhǔn)確率:精準(zhǔn)識(shí)別,穩(wěn)定抓取
基于對(duì)貨品物理屬性全面的語(yǔ)義理解和空間感知能力,在開(kāi)放環(huán)境中未知海量貨品的識(shí)別準(zhǔn)確率極高,搭配 Double Pick雙重校驗(yàn)技術(shù)和掃碼模塊可達(dá)更高準(zhǔn)確率,漏揀、錯(cuò)揀與返工率極低,作業(yè)節(jié)拍穩(wěn)定可預(yù)期,精準(zhǔn)高效。
百毫秒級(jí)別推理:效率翻倍,全天作業(yè)
通過(guò)輕量化模型與剪枝優(yōu)化,實(shí)現(xiàn)百毫秒級(jí)別高效率、低延遲快速推理,多環(huán)節(jié)順暢銜接,逐單揀選綜合效率穩(wěn)定達(dá)到行業(yè)平均人效 2倍以上,且能 7*24小時(shí)不間斷作業(yè),讓倉(cāng)儲(chǔ)作業(yè)效率倍增。
本地化模型:數(shù)據(jù)安全,自主掌握
模型采用本地化部署模式,所有業(yè)務(wù)數(shù)據(jù)均存儲(chǔ)于客戶自有服務(wù)器,不與外部網(wǎng)絡(luò)交互。從數(shù)據(jù)采集、處理到模型運(yùn)算,全程處于客戶自主管控范圍,徹底規(guī)避數(shù)據(jù)泄露、隱私風(fēng)險(xiǎn),為業(yè)務(wù)安全保駕護(hù)航。
圖6通用機(jī)械臂貨品揀取技術(shù)的四大客戶價(jià)值
Geek+ Brain:面向倉(cāng)儲(chǔ)場(chǎng)景的具身智能基座模型
極智嘉的具身智能基座模型 Geek+ Brain采用“感知-策略”兩段式分層架構(gòu),由 Perception Model(感知模型)與 Policy Model(策略模型)兩個(gè)核心層組成。
感知模型:聚焦空間智能,環(huán)境理解能力,整合 2D/3D感知,專注于環(huán)境與物體信息的精準(zhǔn)建模。
策略模型:基于感知模型的環(huán)境理解,自動(dòng)生成合理、高效和可執(zhí)行的操作策略。
圖7 Geek+ Brain分層架構(gòu):Perception Model + Policy Model
分層架構(gòu)保證了“數(shù)據(jù)到?jīng)Q策”路徑的高效閉環(huán)與系統(tǒng)擴(kuò)展性。其分層設(shè)計(jì)提升了可解釋性,支持逐層定位與優(yōu)化,極大提高研發(fā)和運(yùn)維效率。該架構(gòu)具備高度靈活性,可分階段積累數(shù)據(jù)、按需替換模塊,并與硬件解耦,支持多樣化末端執(zhí)行器。同時(shí),分層實(shí)現(xiàn)輕量化部署和模塊級(jí)更新,在保障系統(tǒng)穩(wěn)定性和精度的同時(shí),顯著降低算力成本,更契合工業(yè)和倉(cāng)儲(chǔ)場(chǎng)景對(duì)于可靠與高效要求。
構(gòu)建強(qiáng)大數(shù)據(jù)金字塔
Geek+ Brain使用基于千萬(wàn)量級(jí)公開(kāi)數(shù)據(jù)集訓(xùn)練的預(yù)訓(xùn)練模型,再經(jīng)過(guò)仿真數(shù)據(jù)與數(shù)年積累的行業(yè)數(shù)據(jù)進(jìn)行模型后訓(xùn)練,最終得到可實(shí)時(shí)處理 2D/3D圖像陣列的高性能視覺(jué)抓取模型。同時(shí), Geek+ Brain構(gòu)建數(shù)據(jù)生產(chǎn)、模型訓(xùn)練、評(píng)測(cè)、部署四大核心平臺(tái),提供完整的數(shù)據(jù)閉環(huán)支撐。
圖8數(shù)據(jù)金字塔模型
圖9 Geek+ Brain四大核心平臺(tái)
邁向通用倉(cāng)儲(chǔ)機(jī)器人
7月30日,極智嘉宣布成立具身智能子公司,聚焦機(jī)械手揀貨、通用機(jī)器人等具身智能技術(shù)和業(yè)務(wù),目標(biāo)直指物流、制造等B2B場(chǎng)景。
極智嘉創(chuàng)始人兼 CEO鄭勇表示:“‘通用倉(cāng)儲(chǔ)機(jī)器人’是子公司的首個(gè)戰(zhàn)略方向。極智嘉將秉承‘場(chǎng)景驅(qū)動(dòng)’理念,以倉(cāng)儲(chǔ)場(chǎng)景的真實(shí)痛點(diǎn)作為技術(shù)演進(jìn)的突破點(diǎn),確保每一步突破都能產(chǎn)生可量化的商業(yè)價(jià)值。”
因此,極智嘉選擇由點(diǎn)及面地逐步實(shí)現(xiàn)"通用倉(cāng)儲(chǔ)機(jī)器人"戰(zhàn)略構(gòu)想:
1.單點(diǎn)突破期 (當(dāng)前):以貨品揀取場(chǎng)景作為首站,解決業(yè)界難題,實(shí)現(xiàn)真無(wú)人揀選
2.場(chǎng)景通用期:拓展至搬運(yùn)、打包等環(huán)節(jié),向通用性演進(jìn)
3.生態(tài)共建期:基于 Geek+ Brain構(gòu)建模型生態(tài),促使模型資源不斷豐富、生態(tài)逐漸壯大,致力于成為全球倉(cāng)儲(chǔ)具身智能生態(tài)主導(dǎo)者
在當(dāng)前的具身智能領(lǐng)域中,倉(cāng)儲(chǔ)物流場(chǎng)景憑借其龐大的市場(chǎng)規(guī)模、明確的作業(yè)流程與迫切的智能化需求,成為最適合技術(shù)落地、商業(yè)化價(jià)值最高的核心賽道之一。然而,倉(cāng)儲(chǔ)環(huán)境對(duì)技術(shù)的可靠性、準(zhǔn)確性及效率提出極高要求。
極智嘉在倉(cāng)儲(chǔ)領(lǐng)域的深厚場(chǎng)景認(rèn)知、數(shù)據(jù)積累、全球客戶資源和業(yè)務(wù)網(wǎng)絡(luò),為公司發(fā)展“通用倉(cāng)儲(chǔ)機(jī)器人”帶來(lái)得天獨(dú)厚優(yōu)勢(shì)。
作為公司邁向“通用倉(cāng)儲(chǔ)機(jī)器人”的關(guān)鍵一步,通用機(jī)械臂操作技術(shù)方案和 Geek+ Brain這兩項(xiàng)技術(shù)成果標(biāo)志著極智嘉在具身智能領(lǐng)域從技術(shù)架構(gòu)到應(yīng)用閉環(huán)的關(guān)鍵突破,也為“真無(wú)人、全智能”倉(cāng)儲(chǔ)時(shí)代的到來(lái)提供了具身智能技術(shù)基石。
(審核編輯: 朝言)
分享