四虎综合网,老子影院午夜伦不卡国语,色花影院,五月婷婷丁香六月,成人激情视频网,动漫av网站免费观看,国产午夜亚洲精品一级在线

每日經(jīng)濟(jì)新聞
要聞

每經(jīng)網(wǎng)首頁(yè) > 要聞 > 正文

OpenAI重磅發(fā)布首款A(yù)I代理工具Operator!能控制電腦,像人類一樣瀏覽網(wǎng)頁(yè),訂餐、網(wǎng)上購(gòu)物都可代勞

每日經(jīng)濟(jì)新聞 2025-01-24 07:34:10

1月23日,OpenAI通過(guò)直播發(fā)布了其首款A(yù)I代理工具Operator。這款工具能夠像人類一樣操作網(wǎng)頁(yè)瀏覽器,在有限監(jiān)督下完成用戶交代的任務(wù),被視為AI生產(chǎn)力的里程碑。作為OpenAI通往通用人工智能的第三步,Operator基于CUA模型,結(jié)合GPT-4的視覺能力和高級(jí)推理功能,可執(zhí)行如預(yù)訂餐廳、網(wǎng)購(gòu)等任務(wù)。

每經(jīng)編輯 杜宇

OpenAI首個(gè)智能體終于亮相了!

美國(guó)初創(chuàng)公司OpenAI1月23日突然舉行直播活動(dòng),發(fā)布市場(chǎng)期待已久的首款A(yù)I代理工具Operator(意為操作員),能夠代理用戶執(zhí)行基于網(wǎng)頁(yè)的操作。

圖片來(lái)源:直播視頻截圖

言簡(jiǎn)意賅的解釋,就是Operator能夠像人類一樣使用網(wǎng)頁(yè)瀏覽器。

與“問(wèn)一句、答一句”的聊天機(jī)器人不同,AI代理能夠在人類有限監(jiān)督的情況下按照設(shè)定完成任務(wù),也被普遍視為AI生產(chǎn)力的下一個(gè)里程碑。在OpenAI通往通用人工智能(AGI)的五個(gè)步驟中,AI代理是繼聊天機(jī)器人、推理機(jī)器人之后的第三步,也是全新的一步。

山姆·奧爾特曼介紹稱,從1月23日開始,美國(guó)的ChatGPT Pro用戶(一個(gè)月交200美元)將能使用“研究預(yù)覽版”的Operator。未來(lái)將拓展到更多區(qū)域的Pro用戶,幾個(gè)月后ChatGPT Plus用戶也能用上。同時(shí)在未來(lái)幾周、幾個(gè)月里,還會(huì)發(fā)布更多的AI代理。

目前,Operator尚處于研究預(yù)覽階段,僅向美國(guó)地區(qū)的Pro用戶開放。

Operator由一個(gè)名為CUA(計(jì)算機(jī)使用代理)的新模型驅(qū)動(dòng),結(jié)合了GPT-4o的視覺能力,以及通過(guò)強(qiáng)化學(xué)習(xí)實(shí)現(xiàn)的高級(jí)推理。Operator能夠“看見”網(wǎng)頁(yè)(截圖),并使用鼠標(biāo)和鍵盤允許的所有操作與網(wǎng)頁(yè)進(jìn)行互動(dòng)。在操作中如果碰到困難,模型會(huì)調(diào)用推理能力進(jìn)行自我糾正,若依然無(wú)法解決問(wèn)題則會(huì)把控制權(quán)交還給人類。

如何使用 Operator?用戶只需簡(jiǎn)單描述想要完成的任務(wù),Operator 即可自動(dòng)處理后續(xù)步驟。用戶可以隨時(shí)接管遠(yuǎn)程瀏覽器的控制權(quán)。考慮到安全性和隱私性,Operator 被訓(xùn)練為在需要登錄、輸入支付信息或解決 CAPTCHA 驗(yàn)證碼等任務(wù)時(shí),主動(dòng)請(qǐng)求用戶接管。

Operator的界面與聊天機(jī)器人ChatGPT類似,最大的區(qū)別是調(diào)用“AI代理”完成用戶吩咐的事情。

在演示案例中,Operator被要求預(yù)訂某家飯店。用戶只需要在對(duì)話框中輸入“給我訂一個(gè)XX飯店今晚19點(diǎn)的桌子”,然后AI代理就會(huì)自己打開網(wǎng)頁(yè)進(jìn)入預(yù)訂網(wǎng)站,搜索餐廳并完成預(yù)訂

Operator可以自動(dòng)填寫繁瑣的在線表單、上網(wǎng)購(gòu)物、創(chuàng)建表情包、處理重復(fù)性瀏覽器任務(wù)等等。

在另一個(gè)案例中,用戶上傳了一張寫有“雞蛋、菠菜、蘑菇”等雜貨的購(gòu)物清單,要求Operator去買菜網(wǎng)站上進(jìn)行操作。隨后AI就會(huì)打開瀏覽器,順著清單逐一搜索并加入購(gòu)物車。

完成任務(wù)后,Operator會(huì)告訴用戶總共需要多少錢,以及騎手送達(dá)的時(shí)間,然后將瀏覽器的控制權(quán)交還給人類。

與瀏覽器多標(biāo)簽頁(yè)功能類似,用戶可以通過(guò)創(chuàng)建新的對(duì)話,讓Operator同時(shí)運(yùn)行多個(gè)任務(wù),例如在Etsy上訂購(gòu)個(gè)性化琺瑯杯,同時(shí)在 Hipcamp 上預(yù)訂露營(yíng)地。

更令人印象深刻的是,Operator具備一定的自我糾錯(cuò)能力。當(dāng)遇到挑戰(zhàn)或犯錯(cuò)時(shí),它可以利用推理能力進(jìn)行自我調(diào)整。如果遇到無(wú)法解決的問(wèn)題,Operator會(huì)將控制權(quán)交還給用戶,實(shí)現(xiàn)人機(jī)協(xié)作的流暢體驗(yàn)。

雖然CUA模型仍處于早期階段,存在一些局限性,但在WebArena和WebVoyager這兩個(gè)關(guān)鍵的瀏覽器使用基準(zhǔn)測(cè)試中,它已經(jīng)取得了最新的領(lǐng)先水平。

Operator的發(fā)布標(biāo)志著AI從被動(dòng)工具轉(zhuǎn)變?yōu)閿?shù)字生態(tài)系統(tǒng)中的積極參與者。它不僅可以簡(jiǎn)化用戶任務(wù),還將為希望提供創(chuàng)新客戶體驗(yàn)和提高轉(zhuǎn)化率的企業(yè)帶來(lái)代理的優(yōu)勢(shì)。

OpenAI正在與DoorDash、Instacart、OpenTable、Priceline、StubHub、Thumbtack、Uber等公司合作,確保Operator能夠滿足真實(shí)世界的需求,并尊重既有規(guī)范。除了商業(yè)合作,OpenAI還看到了在公共部門應(yīng)用中提高效率和可訪問(wèn)性的巨大潛力。他們正與斯托克頓市等組織合作,簡(jiǎn)化市民注冊(cè)城市服務(wù)和計(jì)劃的流程。

每日經(jīng)濟(jì)新聞綜合公開資料

如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

Ai OpenAI

歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

每經(jīng)經(jīng)濟(jì)新聞官方APP

0

0