每日經(jīng)濟新聞 2025-03-17 18:31:12
配天機器人CTO郭濤認為,行業(yè)發(fā)展需要“泡沫”,但最終要靠啃硬骨頭推動技術(shù)落地。具身智能發(fā)展存在“三角制約”,即任務(wù)自主性、任務(wù)復雜度、變化適應(yīng)性難以兼顧。此外,大語言模型與通用具身智能對變化適應(yīng)性的要求不同,且具身智能訓練數(shù)據(jù)少。在人形機器人賽道沸騰之際,郭濤將目光投向更現(xiàn)實的“戰(zhàn)場”,通過局部泛化實現(xiàn)商業(yè)化落地。
每經(jīng)記者 楊煜 每經(jīng)編輯 楊夏
在知名咨詢公司Gartner提出的技術(shù)成熟度曲線中,一項新技術(shù)或某種創(chuàng)新面世初期,常常會因過度渲染以致期望值不斷膨脹,直至泡沫破裂。2024年8月,人形工作機器人被Gartner評為處于技術(shù)成熟度曲線的萌芽期。但近日來,外界對人形機器人技術(shù)的期望值顯然在加速膨脹。
人形機器人產(chǎn)品密集發(fā)布,資本市場數(shù)次因相關(guān)概念而躁動,媒體對人形機器人的報道熱情尚未停歇??然而,在熱度之下,一個有些“冰冷”的問題始終存在——對于一個尚在持續(xù)發(fā)展的技術(shù)而言,這種熱情是否會帶來泡沫?而當泡沫破裂,人形機器人行業(yè)又當何去何從?
京城機電旗下配天機器人CTO郭濤在接受《每日經(jīng)濟新聞》記者專訪時直言,行業(yè)整體的發(fā)展需要“泡沫”,不然將永遠“無人知曉”,但行業(yè)發(fā)展最終所需要的是,通過一點點啃硬骨頭,推動技術(shù)發(fā)展達到落地應(yīng)用。從應(yīng)用角度出發(fā),郭濤認為,具身人工智能目前尚不具備完全泛化能力,在人形機器人賽道再度沸騰之際,他選擇將目光投向更現(xiàn)實的“戰(zhàn)場”。
人形機器人接近于人的外觀讓人們期待它們能夠真的像人類一樣解決通用泛化問題,但這一暢想的背后可能面臨一個“既要、又要、還要”的問題:一個通用具身智能意味著具備龐大的訓練數(shù)據(jù)、優(yōu)秀的模型性能以及足夠的泛化能力,才能真正自主應(yīng)對現(xiàn)實場景的復雜任務(wù)與各種變化。
但,這可能嗎?配天機器人認為具身智能發(fā)展中存在“三角制約”,即任務(wù)自主性、任務(wù)復雜度、變化適應(yīng)性等三大能力要求難以兼顧。
例如,傳統(tǒng)工業(yè)機器人無需人工介入,也可以處理復雜任務(wù),但需針對特定環(huán)境與特定任務(wù);自主移動機器人有較強的自主能力與變化適應(yīng)能力,但只能處理搬運、清掃、檢測等簡單任務(wù);遙操作類機器人能在多種復雜環(huán)境下執(zhí)行復雜任務(wù),但需要專業(yè)人員全程手動操作。
市場對人形機器人與通用具身智能的興奮,在很大程度上源于AI(人工智能)大模型所帶來的應(yīng)用想象,當人工智能與機器人技術(shù)結(jié)合,大模型將賦予機器人更高的智能水平與適應(yīng)能力,以及更流暢的交互體驗。然而,靠大語言模型足以擊破具身智能的“三角制約”嗎?
郭濤提醒道,大語言模型與通用具身智能對變化適應(yīng)性的要求截然不同。郭濤舉了個例子——讓人形機器人洗盤子,機體可能要應(yīng)對水溫變化、洗潔精不夠用等各種環(huán)境與任務(wù)的動態(tài)變化,但對大語言模型來說,在用戶發(fā)布任務(wù)后,模型響應(yīng)外部環(huán)境變化的能力變得非常薄弱。
此外,相比于大語言模型,通用具身智能的訓練數(shù)據(jù)也要少得多。
郭濤表示,大語言模型動輒便需要萬億級tokens(詞元)的數(shù)據(jù)進行訓練,而全世界的互聯(lián)網(wǎng)用戶通過聊天、發(fā)圖片或者視頻,都是在為大語言模型自發(fā)貢獻數(shù)據(jù)量,但沒有人自發(fā)貢獻機器人的行為數(shù)據(jù)。尤其在工業(yè)領(lǐng)域,數(shù)據(jù)是私有的而非公開的,要獲取這類數(shù)據(jù)首先要獲取工業(yè)用戶的信任。
如何解決泛化能力與商業(yè)價值的矛盾是具身人工智能從技術(shù)展示走向商業(yè)落地的關(guān)鍵。郭濤認為,在缺乏訓練數(shù)據(jù)還要追求模型高性能的前提下,“現(xiàn)階段不可能出現(xiàn)泛化的具身人工智能”,但這并不意味著具身智能不是正確的方向。在人形機器人賽道再度沸騰之際,郭濤將目光投向更現(xiàn)實的“戰(zhàn)場”,“完全的泛化沒戲,但我們可以通過局部泛化,現(xiàn)階段就能實現(xiàn)商業(yè)化落地”,而這也是配天機器人一直以來的思路。
如何實現(xiàn)局部泛化?配天機器人在這個領(lǐng)域已有業(yè)務(wù)實踐。
配天機器人是國內(nèi)最早從事工業(yè)機器人研發(fā)的企業(yè)之一,產(chǎn)品可應(yīng)用于焊接、打磨拋光、分揀、切割、裝配等多種工業(yè)場景。但隨著業(yè)務(wù)發(fā)展,工業(yè)機器人面對的應(yīng)用場景已從大規(guī)模工業(yè)生產(chǎn)轉(zhuǎn)向多品種小批量生產(chǎn),而后者的需求依靠傳統(tǒng)的工業(yè)機器人難以解決。
傳統(tǒng)的工業(yè)機器人采取預(yù)編程方式,大規(guī)模生產(chǎn)模式下,一次性完成設(shè)備安裝及算法編程后,工業(yè)機器人便可針對生產(chǎn)中的某些環(huán)節(jié)連續(xù)運行多年。但還有很多行業(yè)并非如此,例如造船業(yè),一些船舶的生產(chǎn)節(jié)奏以個位數(shù)計,但用到的部件與工藝十分復雜,傳統(tǒng)的工業(yè)機器人模式需針對條件的變化逐一編程,但這樣一來,用機器替代人工的性價比也就大大降低。
除此之外,復雜裝配以及柔性物體的操作也是傳統(tǒng)工業(yè)機器人的應(yīng)用“盲區(qū)”。郭濤總結(jié)道:“凡是預(yù)編程解決不了的問題,傳統(tǒng)的機器人都做不了。”這一業(yè)務(wù)痛點促使配天機器人必須向具身智能探索。
配天機器人在今年年初提出,加快具身智能項目落地。郭濤強調(diào),公司發(fā)展具身智能,現(xiàn)階段以實現(xiàn)單一任務(wù)泛化為目標,因為在工業(yè)領(lǐng)域,單一任務(wù)泛化即可為客戶提供巨大價值。而公司主打的項目落地方向是焊接,這也是目前機器人的第一大應(yīng)用場景。“不需要啥都能干,我們就專注焊接這一類工藝,但什么都能焊,把這個做起來市場巨大。”
在郭濤看來,發(fā)展具身智能是一個逐步蠶食的過程,從具體的場景、具體的工藝入手,一點一點鋪大應(yīng)用領(lǐng)域,“只要工具集建立起來,推進的速度會很快”。同時,也只有先通過具體場景的實踐證明,才能逐步獲取工業(yè)領(lǐng)域客戶的信任,進而獲得更多工業(yè)數(shù)據(jù),形成良性循環(huán)。
不過,在具身智能點燃的新一輪市場躁動中,除了郭濤主張的漸進式聚焦創(chuàng)新,押注“原生顛覆”的也不在少數(shù)。談及當前行業(yè)的熱度,郭濤坦言,任何行業(yè)都會經(jīng)歷從無人知曉到泡沫式增長、突然下跌再緩慢爬起來的過程。
郭濤指出,相比于大語言模型,具身智能目前不存在相對統(tǒng)一的模型底座和行業(yè)共識,因此業(yè)內(nèi)仍在各自領(lǐng)域里“各顯神通”。Transformer的出世成為大語言模型突破的奇點,那具身智能何時會迎來統(tǒng)一的理論體系?對此,郭濤搖了搖頭,但他仍然抱有信心:“因為這么多人都在努力,說不定哪天技術(shù)奇點就突破了。”
如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán),嚴禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟新聞APP