特斯拉與小鵬的機(jī)器人靈巧手破局——靈巧智能何以打造“有用的手”?
當(dāng)特斯拉仍在為靈巧手的工程化與可靠性問(wèn)題所困,當(dāng)小鵬汽車公開表示靈巧手因高成本與技術(shù)難度短期內(nèi)難以普及時(shí),整個(gè)行業(yè)都面臨一個(gè)共同難題:為何靈巧手?jǐn)?shù)量眾多,卻依然難以投入實(shí)際應(yīng)用?
許多產(chǎn)品不得不在性能、壽命與成本之間做出艱難取舍:要么為性能犧牲成本,成為實(shí)驗(yàn)室中的“奢侈品”;要么為成本妥協(xié)性能,淪為“精致的玩具”。
今天,我們將分享靈巧智能如何打造真正“有用的手”。

一、產(chǎn)業(yè)之問(wèn):為何靈巧手“遍地開花”,頭部企業(yè)仍稱“不實(shí)用”?
一些靈巧手品牌宣傳聲勢(shì)浩大,甚至號(hào)稱占據(jù)全球80%市場(chǎng)份額,但真正的產(chǎn)業(yè)用戶為何遲遲不愿買單?答案簡(jiǎn)單而殘酷:因?yàn)樗鼈兯麄鳌⒀菔旧踔潦圪u的,往往并非產(chǎn)業(yè)真正需要且敢于使用的產(chǎn)品。
以下三個(gè)問(wèn)題,或許是它們不愿透露的真相:
1)靈巧手究竟是要替代“人手”,還是“工具”?
靈巧手的目標(biāo)并非二選一,而是在“替代人手”與“替代工具”之間找到平衡,其終極愿景是“替代人手”。
替代“人手”方向追求復(fù)制人類手部全部功能,實(shí)現(xiàn)在任何人類工作環(huán)境中無(wú)縫替代,核心設(shè)計(jì)理念是極致的通用性與擬人化,典型代表為特斯拉Optimus GEN3的22自由度靈巧手。
替代“工具”方向則主張“為何非要是手?解決問(wèn)題的是一系列專用工具”,其核心是在特定任務(wù)中追求高效、可靠與低成本,典型代表為特斯拉Optimus GEN1的6自由度靈巧手。
2)哪些場(chǎng)景真正需要靈巧手?
以汽車制造業(yè)為例,沖壓、焊接、噴涂等前序車間自動(dòng)化率可達(dá)90%甚至100%,但總裝車間仍依賴大量人工。這并非技術(shù)不足,而是由總裝工序特性、成本效益及人機(jī)優(yōu)勢(shì)對(duì)比共同決定。
總裝涉及成千上萬(wàn)零件的組裝,許多步驟需根據(jù)實(shí)際情況微調(diào)、對(duì)位、卡扣,遠(yuǎn)非簡(jiǎn)單的“抓取-放置”,涵蓋非標(biāo)準(zhǔn)化操作、精細(xì)操作及綜合感知決策等復(fù)雜需求。
類似這樣的場(chǎng)景正是靈巧手的核心應(yīng)用點(diǎn)——狹窄空間的精細(xì)感知與微動(dòng)操作,需要手、感知與大腦的協(xié)同作業(yè)。
3)為何靈巧手必須與場(chǎng)景深度結(jié)合?
靈巧手的“靈巧”并非固有屬性,而是在特定環(huán)境與任務(wù)中通過(guò)物理交互涌現(xiàn)的能力。脫離具體場(chǎng)景,靈巧手便失去存在的價(jià)值與意義。
首先,硬件設(shè)計(jì)由場(chǎng)景需求驅(qū)動(dòng)。工業(yè)裝配可能僅需“三指手”完成抓取、插入等重復(fù)任務(wù),而彈鋼琴演奏則需要“五指”協(xié)同。
其次,控制算法的有效性高度依賴場(chǎng)景知識(shí)。靈巧手控制極為復(fù)雜,其智能體現(xiàn)在算法上,而算法的效能完全取決于對(duì)場(chǎng)景的理解。未與場(chǎng)景結(jié)合的靈巧手僅能執(zhí)行預(yù)設(shè)軌跡,無(wú)法適應(yīng)微小變化;而與場(chǎng)景深度結(jié)合的靈巧手,通過(guò)視覺(jué)、力覺(jué)、觸覺(jué)等傳感器實(shí)時(shí)獲取信息,調(diào)整抓取力、姿態(tài)與手勢(shì),實(shí)現(xiàn)魯棒且柔順的操作。
最后,學(xué)習(xí)與訓(xùn)練數(shù)據(jù)源于場(chǎng)景?,F(xiàn)代靈巧手控制日益依賴機(jī)器學(xué)習(xí)(尤其是強(qiáng)化學(xué)習(xí)與模仿學(xué)習(xí)),而模型性能嚴(yán)重依賴于訓(xùn)練數(shù)據(jù)的質(zhì)量與廣度。
二、靈巧智能的解決方案:突破“不可能三角”,以操作的“力”為核心,打造“有用的手”
繩驅(qū)(腱繩傳動(dòng))被公認(rèn)為實(shí)現(xiàn)類人靈巧手的理想路徑,國(guó)內(nèi)靈巧手企業(yè)眾多,空心杯電機(jī)與腱繩供應(yīng)鏈成熟,為何繩驅(qū)靈巧手廠商不足5家?答案簡(jiǎn)單而殘酷:繩驅(qū)手的設(shè)計(jì)難度、量產(chǎn)工藝與可靠性挑戰(zhàn)勸退了大多數(shù)玩家。

靈巧智能選擇以機(jī)械與控制的復(fù)雜性,換取本體結(jié)構(gòu)的輕量化與擬人化,并在此技術(shù)路徑上提出以下實(shí)踐:
1)硬件靈巧手:以“力”為核心,解決“用手難”問(wèn)題
靈巧智能繩驅(qū)靈巧手產(chǎn)品線涵蓋3款產(chǎn)品,分別面向不同客戶與場(chǎng)景:
通用版五指DexHand 021:首款量產(chǎn)繩驅(qū)五指靈巧手,面向科研、教育、數(shù)據(jù)采集、具身智能及生化等行業(yè)。通過(guò)130套模具實(shí)現(xiàn)741個(gè)零件的標(biāo)準(zhǔn)化生產(chǎn),確保產(chǎn)品公差一致性;配備主動(dòng)散熱系統(tǒng),支持長(zhǎng)時(shí)間使用;通過(guò)腱繩涂層與繩頭端子設(shè)計(jì),解決腱繩蠕變與干摩擦問(wèn)題。是目前唯一投入高頻數(shù)據(jù)采集應(yīng)用的高自由度繩驅(qū)靈巧手。
入門版三指DexHand 021S:視觸雙模、雙拇指構(gòu)型的三指靈巧手,適用于教育、具身智能、工業(yè)及農(nóng)業(yè)等場(chǎng)景。無(wú)需復(fù)雜模型驅(qū)動(dòng),通過(guò)雙拇指構(gòu)型(彎曲+旋轉(zhuǎn))實(shí)現(xiàn)約70%人手功能,結(jié)合掌心視覺(jué)與指尖觸覺(jué),擴(kuò)展多場(chǎng)景操作任務(wù),為入門用戶提供具身智能最優(yōu)選。
專業(yè)版腕手一體五指DexHand 021pro:具備雙繩雙向傳動(dòng)、全掌感知與端側(cè)算力的腕手一體五指靈巧手。通過(guò)“外力”觸覺(jué)感知與“內(nèi)力”傳動(dòng)控制,不僅具備端側(cè)抓取規(guī)劃的智能化能力,更實(shí)現(xiàn)抓取控制的力控能力。
2)高質(zhì)量數(shù)據(jù):以“力”為核心,破解“數(shù)據(jù)稀疏性”難題
機(jī)器人具備三大智能:運(yùn)動(dòng)智能、交互智能與操作智能。交互智能核心在于利用大語(yǔ)言模型實(shí)現(xiàn)人機(jī)情感交互;運(yùn)動(dòng)智能核心是“非接觸”,使機(jī)器人掌握平衡與協(xié)調(diào);而操作智能核心在于“接觸”,不僅關(guān)乎手部狀態(tài)與被操作物體,更與手-物接觸關(guān)系,尤其是“接觸力”信息密切相關(guān)。
基于此,靈巧智能開發(fā)兩款產(chǎn)品:
DexCap數(shù)據(jù)采集外骨骼:通過(guò)人類“遙操作”示教機(jī)器人,在靈巧手與物體接觸時(shí),結(jié)合觸覺(jué)傳感器與指尖振動(dòng)力反饋,實(shí)現(xiàn)沉浸式操作與數(shù)據(jù)采集。
桌面手部動(dòng)捕與觸覺(jué)手套:旨在捕獲人類操作數(shù)據(jù),包括主視角操作視頻、上肢(含手指)運(yùn)動(dòng)軌跡、被操作物體物理特性及手-物接觸力等多維度信息。今年9月底,靈巧智能重磅開源DexCanvas數(shù)據(jù)集。
3)操作模型:以小參數(shù)量模型,逐步解決“手的操作”難題
手是人類極為精妙的器官,既是感知外界的窗口,也是執(zhí)行動(dòng)作與實(shí)現(xiàn)交互的關(guān)鍵載體。從出生到十歲左右,人類通過(guò)持續(xù)的手部互動(dòng),構(gòu)建“手—感知—大腦”協(xié)調(diào)的發(fā)育閉環(huán)。將此映射至靈巧手發(fā)展,可見(jiàn)其運(yùn)動(dòng)能力已高度逼近人手,但“腦力”——即認(rèn)知與決策能力——仍處于類似人類三歲階段,目前僅能實(shí)現(xiàn)有限抓握功能。

古人云“隔行如隔山”,又道“紙上得來(lái)終覺(jué)淺,絕知此事要躬行”,皆揭示“行業(yè)操作數(shù)據(jù)”與“知行合一”的深刻價(jià)值。與參數(shù)動(dòng)輒超過(guò)300億的大規(guī)模視覺(jué)語(yǔ)言模型不同,靈巧智能更聚焦于“Action”本身:
一方面,通過(guò)多維數(shù)據(jù)采集與高保真物理仿真增強(qiáng),構(gòu)建參數(shù)量為30億級(jí)的靈巧操作基礎(chǔ)模型;另一方面,與場(chǎng)景需求方深度協(xié)同,共建真實(shí)環(huán)境中的數(shù)據(jù)采集工廠,在垂直場(chǎng)景中系統(tǒng)獲取操作數(shù)據(jù),訓(xùn)練高度適配的專用操作模型。
靈巧手正站在從“演示可行”到“應(yīng)用可用”的關(guān)鍵十字路口。破解困局之道,并非追求參數(shù)上的極致擬人,而在于回歸“有用”這一本質(zhì):通過(guò)硬件、數(shù)據(jù)與模型的深度融合,在真實(shí)的產(chǎn)業(yè)場(chǎng)景中,將無(wú)形的智能轉(zhuǎn)化為精準(zhǔn)可控的“操作力”。道雖遠(yuǎn),篤行可至;事雖巨,堅(jiān)為必成。我們堅(jiān)信,當(dāng)靈巧手能像人手一樣,在紛繁復(fù)雜的世界中可靠地完成一個(gè)又一個(gè)具體任務(wù)時(shí),它所觸及的,將不僅是冰冷的機(jī)器與零件,更是通用智能機(jī)器人與我們共同未來(lái)的大門。
【廣告】(免責(zé)聲明:本文為本網(wǎng)站出于傳播商業(yè)信息之目的進(jìn)行轉(zhuǎn)載發(fā)布,不代表本網(wǎng)站的觀點(diǎn)及立場(chǎng)。本文所涉文、圖、音視頻等資料的一切權(quán)利和法律責(zé)任歸材料提供方所有和承擔(dān)。本網(wǎng)站對(duì)此資訊文字、圖片等所有信息的真實(shí)性不作任何保證或承諾,亦不構(gòu)成任何購(gòu)買、投資等建議,據(jù)此操作者風(fēng)險(xiǎn)自擔(dān)。) 本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人,如有侵權(quán),請(qǐng)聯(lián)系本網(wǎng)進(jìn)行刪除。
責(zé)任編輯:彭羽佳
