四虎综合网,老子影院午夜伦不卡国语,色花影院,五月婷婷丁香六月,成人激情视频网,动漫av网站免费观看,国产午夜亚洲精品一级在线

每日經(jīng)濟新聞
要聞

每經(jīng)網(wǎng)首頁 > 要聞 > 正文

OpenAI祭出AI文本檢測利器,ChatGPT即將上演“貓鼠游戲”?

每日經(jīng)濟新聞 2023-02-01 18:53:49

◎一些批評者認為,生成式AI工具的廣泛使用可能會帶來一些潛在的有害影響。

每經(jīng)記者 文巧    每經(jīng)編輯 高涵    

ChatGPT帶來的喧囂還未歸于平靜,北京時間2月1日,其背后的公司OpenAI又趁熱打鐵推出了一款檢測工具,試圖區(qū)分人工編寫的文本和AI生成的文本。

這款工具名為AI文本檢測器(AI Text Classifier),《每日經(jīng)濟新聞》記者親測了其檢測效果,發(fā)現(xiàn)其能成功區(qū)別單獨的人工或AI文本,但當人工和AI文本混淆時,檢測效果并不樂觀。不過,OpenAI認為,當這個檢測工具與其他方法結(jié)合使用時,可能有助于防止 AI文本生成器被濫用。

“它仍然有一些局限性——因此它應該被用作其他確定文本來源方法的補充,而不是作為主要的決策工具,”OpenAI在一份官方文件中表示,“我們正在提供這個初始檢測器,以獲取有關(guān)此類工具是否有用的反饋,并希望在未來分享改進的方法。”

隨著ChatGPT的大熱,市場圍繞生成式 AI的熱情不斷增長。但以北密歇根大學“論文作弊”為代表的事件也引發(fā)了對于學術(shù)、倫理等方面的諸多擔憂。一些批評者認為,生成式AI工具的廣泛使用可能會帶來一些潛在的有害影響。

直接的后果是,美國一些最大的學區(qū)已禁止在其網(wǎng)絡和設(shè)備上使用 ChatGPT。自然而然地,對類似AI文本檢測器的工具的需求也開始涌現(xiàn)。

親測OpenAI的AI檢測器效果:并不完美

《每日經(jīng)濟新聞》記者注意到,有趣的是,OpenAI新推出的這款檢測器在架構(gòu)上和ChatGPT一樣,它也是一種AI語言模型,并且也是根據(jù)來自網(wǎng)絡的許多公開文本示例進行訓練的。

但與ChatGPT不同的是,它經(jīng)過微調(diào)可以預測一段文本由AI生成的可能性——不僅來自ChatGPT,還來自任何文本生成AI模型。

具體來看,OpenAI在來自5個平臺(包括OpenAI本身)的34個文本生成系統(tǒng)的文本上訓練了這款AI文本檢測器,例如維基百科等。不過,這款AI文本檢測器至少需要1000個字符,即大約150 ~250 個單詞,才能進行檢測。

那么,這款檢測器的效果到底如何?是否真的能完美區(qū)別AI和人工生成的文本?每經(jīng)記者對此進行了一番測試。

我們先讓ChatGPT寫了一篇主題為AI未來的文章,并用檢測器對其進行檢測,結(jié)果顯示,“檢測器認為文本很可能是AI生成的”。

圖片來源:AI Text Classifier

隨后,我們用了一篇人工寫作的文本再次進行檢測,結(jié)果顯示,“檢測器認為文本非常不可能是AI生成的”。

圖片來源:AI Text Classifier

從上述結(jié)果來看,OpenAI的這款AI文本檢測器的確成功區(qū)分了人工和AI生成的文本。然而,我們將兩個文本結(jié)合后(AI文本占比超90%)再進行檢測,它并不能檢測出AI生成的文本。

圖片來源:AI Text Classifier


從每經(jīng)記者親身體驗來看,目前,要靠這個AI文本檢測器來抓作弊還有些困難。

據(jù)OpenAI的一份文件,該檢測器將文本標記為“非常不可能”由AI生成的可能性小于10%;“不太可能”由AI生成的可能性為10%~45%;“不清楚它是否是”AI生成的可能性為45%~90%;“可能”是AI生成的幾率為90%~98%。

在準確性上,OpenAI也承認,“鑒于AI生成的內(nèi)容在互聯(lián)網(wǎng)上的激增,它可能無意中將一些AI編寫的文本錯誤分類為人類編寫的文本。”

“AI槍手”引擔憂,“貓鼠游戲”就此開始?

1月中旬,北密歇根大學的論文作弊事件讓學術(shù)界著實震驚了一把。在這次事件之后,在美國,許多大學教授、系主任和管理人員都在對課堂進行大規(guī)模的調(diào)整,以應對ChatGPT對教學活動造成的巨大沖擊。很多教授在重新設(shè)計課程,更多地采用口試、小組合作和手寫文章作為評估方式。

紐約和西雅圖等最大的學區(qū)最近已禁止在其設(shè)備和網(wǎng)絡中使用 ChatGPT,許多大學也在考慮采取類似措施。

在更早之前,全球最大的編程技術(shù)問答網(wǎng)站Stack Overflow緊急宣布,ChatGPT在該站暫時封禁。Stack Overflow在官方通告中表示,做出這個規(guī)定的主要原因是,ChatGPT自動生成的答案質(zhì)量太低,錯誤太多,而且看上去還挺像那么回事,即使是完全不懂的人也能隨便生成答案。

在“AI槍手”帶來的擔憂之下,一些其他的AI文本檢測器也如雨后春筍般涌現(xiàn),以滿足當前的需求。

在OpenAI推出自己的檢測器之前,普林斯頓大學的一名學生Edward Tian開發(fā)了ChatZero,來檢測文本是否可能是AI生成。據(jù)報道,1月3日,該網(wǎng)站一經(jīng)上線,一周內(nèi)就有超過3萬人試用。

一名用戶展示GPTZero的檢測效果 圖片來源:推特

不過,一些用戶也報告了GPTZero檢測的錯誤結(jié)果。Edward Tian也承認,檢測并非百分之百準確,他仍在努力提高模型的準確性。

據(jù)此前報道,包括斯坦福大學在內(nèi)的一些機構(gòu)聯(lián)合提出一種名為DetectGPT的新方法,來區(qū)分AI生成的文章。

開源AI社區(qū)Hugging Face也推出了一種工具來檢測文本是否由 GPT-2 創(chuàng)建,GPT-2 是用于開發(fā) ChatGPT 的 AI 模型的早期版本。據(jù)悉,南卡羅來納州的一位哲學教授用這個工具抓獲了一名提交了 AI 編寫的作業(yè)的學生。

除此之外,谷歌搜索以及檢測學術(shù)抄襲的Turnitin也正在開發(fā)自己的AI生成文本檢測器,谷歌搜索據(jù)悉至少會推出6個應用程序來對AI和人工文本進行區(qū)分。

科技媒體Techcrunch對此評論稱,這很可能會成為一場貓捉老鼠的游戲。隨著文本生成AI的改進,檢測器也會改進——這是一種永無止境的來回交流,類似于網(wǎng)絡犯罪分子和安全研究人員之間的交流。

正如OpenAI 所寫,雖然檢測器在某些情況下可能有所幫助,但它們永遠不會成為確定文本是否由AI生成的可靠唯一證據(jù)。“也就是說,目前還沒有靈丹妙藥可以解決AI生成的文本所帶來的問題,”Techcrunch這樣寫道。

封面圖片來源:攝圖網(wǎng)-307064405

如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán),嚴禁轉(zhuǎn)載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

ChatGPT 人工智能

歡迎關(guān)注每日經(jīng)濟新聞APP

每經(jīng)經(jīng)濟新聞官方APP

0

0