每日經(jīng)濟(jì)新聞 2024-03-14 09:08:23
每經(jīng)編輯 畢陸名
3月14日,美國明星機(jī)器人創(chuàng)業(yè)公司Figure發(fā)布了自己第一個(gè)OpenAI大模型加持的機(jī)器人demo。雖然只用到了一個(gè)神經(jīng)網(wǎng)絡(luò),但卻可以聽從人類的命令,遞給人類蘋果、將黑色塑料袋收拾進(jìn)框子里、將杯子和盤子歸置放在瀝水架上。Figure表示,結(jié)合OpenAI(的ChatGPT等語言模型),Figure 01現(xiàn)在可以與人類全面對話。
Figure創(chuàng)始人Brett Adcock表示,視頻中Figure 01展示了端到端神經(jīng)網(wǎng)絡(luò)框架下與人類的對話,沒有任何遠(yuǎn)程操作。并且,機(jī)器人的速度有了顯著的提升,開始接近人類的速度。
值得一提的是,F(xiàn)igure AI已經(jīng)成為馬斯克的“擎天柱”之外最受投資人關(guān)注的AI初創(chuàng)企業(yè)之一。英特爾的風(fēng)險(xiǎn)基金以及“木頭姐”Cathie Wood的Ark Invest、Align Ventures和現(xiàn)有投資者Parkway Venture Capital也參與了Figure AI的投資。
本周三,半個(gè)硅谷都在投的明星機(jī)器人創(chuàng)業(yè)公司Figure,發(fā)布了自己第一個(gè)OpenAI大模型加持的機(jī)器人demo。
這家公司不久前剛宣布獲得OpenAI等公司的投資,才十幾天就直接用上了OpenAI的多模態(tài)大模型。
如你所見,得到OpenAI大模型能力加持的Figure 01現(xiàn)在是這個(gè)樣子的。
圖片來源:視頻截圖
它可以為聽從人類的命令,遞給人類蘋果。
圖片來源:視頻截圖
將黑色塑料袋收拾進(jìn)框子里。
圖片來源:視頻截圖
將杯子和盤子歸置放在瀝水架上。
需要強(qiáng)調(diào)的是:你看到的這一切,只用到了一個(gè)神經(jīng)網(wǎng)絡(luò)。
有網(wǎng)友調(diào)侃道:“波士頓動(dòng)力:好的,伙計(jì)們,這是一場真正的競爭。讓我們回到實(shí)驗(yàn)室,設(shè)計(jì)更多舞蹈套路。”
Figure創(chuàng)始人Brett Adcock表示,視頻中Figure 01展示了端到端神經(jīng)網(wǎng)絡(luò)框架下與人類的對話,沒有任何遠(yuǎn)程操作。并且,機(jī)器人的速度有了顯著的提升,開始接近人類的速度。
Figure機(jī)器人操作高級(jí)AI工程師Corey Lynch介紹了此次Figure 01的技術(shù)原理。他表示,F(xiàn)igure 01現(xiàn)在可以做到以下這些:
描述其視覺體驗(yàn);
規(guī)劃未來的行動(dòng);
反思自己的記憶;
口頭解釋推理過程。
他接著解釋道,視頻中機(jī)器人的所有行為都是學(xué)到的(再次強(qiáng)調(diào)不是遠(yuǎn)程操作),并以正常速度(1.0x)運(yùn)行。
此外,該模型負(fù)責(zé)決定在機(jī)器人上運(yùn)行哪些學(xué)習(xí)到的閉環(huán)行為以完成給定的命令,從而將特定的神經(jīng)網(wǎng)絡(luò)權(quán)重加載到GPU上并執(zhí)行策略。
關(guān)于學(xué)到的低級(jí)雙手操作,所有行為均由神經(jīng)網(wǎng)絡(luò)視覺運(yùn)動(dòng)transformer策略驅(qū)動(dòng),將像素直接映射到動(dòng)作。這些網(wǎng)絡(luò)以10hz的頻率接收機(jī)載圖像,并以200hz的頻率生成24-DOF動(dòng)作(手腕姿勢和手指關(guān)節(jié)角度)。
最后他表示,即使在幾年前,自己還認(rèn)為人形機(jī)器人規(guī)劃和執(zhí)行自身完全學(xué)得行為的同時(shí)與人類進(jìn)行完整的對話是幾十年后才能看到的事情。顯然,現(xiàn)在已經(jīng)發(fā)生了太多變化。
據(jù)外媒報(bào)道,美國人形機(jī)器人初創(chuàng)公司Figure AI于2月29日宣布,該公司獲得了來自微軟、英偉達(dá)、OpenAI以及亞馬遜創(chuàng)始人貝佐斯等投資人約6.75億美元的新一輪融資。
這是該公司繼去年上半年獲得首輪7000萬美元外部融資之后宣布的最新融資動(dòng)態(tài),這也使得該公司的估值達(dá)到26億美元左右。Figure AI表示,將利用這筆新的融資資金加速其人形機(jī)器人的開發(fā),以投入商業(yè)用途。
Figure AI已經(jīng)成為馬斯克的“擎天柱”之外最受投資人關(guān)注的AI初創(chuàng)企業(yè)之一。英特爾的風(fēng)險(xiǎn)基金以及“木頭姐”Cathie Wood的Ark Invest、Align Ventures和現(xiàn)有投資者Parkway Venture Capital也參與了Figure AI的投資。
Figure AI成立于2022年,該公司已經(jīng)開發(fā)了一款名為Figure 01的通用機(jī)器人,其外觀和動(dòng)作與人類相似,目標(biāo)是能夠用來執(zhí)行替代人類的危險(xiǎn)或者無聊的工作,例如在制造、運(yùn)輸和物流、倉儲(chǔ)和零售等行業(yè)。這些領(lǐng)域被認(rèn)為是“勞動(dòng)力短缺最為嚴(yán)重的領(lǐng)域”。
Figure AI還表示,將與OpenAI合作,為人形機(jī)器人開發(fā)下一代人工智能模型,最終目標(biāo)是讓Figure 01能夠自主執(zhí)行“日常任務(wù)”。而要實(shí)現(xiàn)這一目標(biāo),需要開發(fā)更強(qiáng)大的人工智能系統(tǒng)。此外,F(xiàn)igure AI將使用微軟的Azure云服務(wù)進(jìn)行人工智能基礎(chǔ)設(shè)施、培訓(xùn)和存儲(chǔ)等方面的部署。
目前在人形機(jī)器人領(lǐng)域,最知名的是特斯拉CEO馬斯克的“擎天柱”。就在3月初,馬斯克在社交平臺(tái)X上發(fā)布了一個(gè)最新的“擎天柱”視頻,這款人形機(jī)器人的步態(tài)更加接近于人類,可以實(shí)現(xiàn)自然轉(zhuǎn)彎等能力。
“擎天柱”首席工程師Milan Kovac表示:“這是我們有史以來最快的步態(tài),速度約為0.6米/秒,與12月份發(fā)布的上一個(gè)視頻相比,速度提高了30%。”
據(jù)介紹,新版“擎天柱”的前庭系統(tǒng)、腳部軌跡,以及地面接觸邏輯得到了改進(jìn),運(yùn)動(dòng)規(guī)劃器得到升級(jí),整個(gè)機(jī)器人的環(huán)路延遲也大大縮短;另外,研究團(tuán)隊(duì)還為其添加了一些軀干和手臂的搖擺動(dòng)作,使行走看起來更加自然。
然而,人形機(jī)器人市場尚處于發(fā)展的萌芽階段。人形機(jī)器人的開發(fā)成本昂貴,包括執(zhí)行器、電機(jī)和傳感器等價(jià)格高昂的組件。高盛研究人員表示,這些成本預(yù)計(jì)在未來幾年會(huì)下降。高盛預(yù)計(jì),單個(gè)人形機(jī)器人的開發(fā)成本已經(jīng)從去年的5萬美元至25萬美元下降到目前的3美元至15萬美元之間。
每日經(jīng)濟(jì)新聞綜合Figure、公開消息
封面圖片來源:視頻截圖
如需轉(zhuǎn)載請與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP