每日經(jīng)濟(jì)新聞 2024-12-09 17:14:35
8月,第四范式與商務(wù)印書館旗下科技公司萬邦同和共同為商務(wù)印書館建設(shè)學(xué)術(shù)出版專業(yè)大模型,這也是國(guó)內(nèi)首個(gè)出版領(lǐng)域大語言模型。第四范式董事長(zhǎng)戴文淵在接受《每日經(jīng)濟(jì)新聞》記者采訪時(shí)表示,這個(gè)專業(yè)大模型恰恰代表了未來AI的工作模式:不再是簡(jiǎn)單的“客戶提供數(shù)據(jù)、公司輸出模型”的單一流程,而是一個(gè)持續(xù)迭代、不斷優(yōu)化的過程。
每經(jīng)記者 可楊 每經(jīng)編輯 楊夏
在如今的大模型時(shí)代,市場(chǎng)上已經(jīng)不乏具備翻譯功能的大模型,但對(duì)于出版業(yè)而言,真正的挑戰(zhàn)在于如何確保翻譯的質(zhì)量和精確度,以滿足出版社級(jí)別的高標(biāo)準(zhǔn)。“混合專家模型”通過對(duì)商務(wù)印書館出版的哲學(xué)、歷史、法學(xué)、經(jīng)濟(jì)等上百個(gè)專業(yè)領(lǐng)域書籍的翻譯術(shù)語庫(kù)的訓(xùn)練,確保譯文精準(zhǔn)度達(dá)到“出版級(jí)”,解決傳統(tǒng)機(jī)器翻譯準(zhǔn)確度差,原文上下文理解不足、譯文機(jī)翻痕跡重等核心問題。
面對(duì)AI技術(shù),大多數(shù)人的第一反應(yīng)往往是思考其可能帶來的顛覆性變革;而在看到AI能夠完成的工作后,人們的第二反應(yīng)可能是覺得它仍然顯得笨拙、無法勝任某些工作。
近日,在《每日經(jīng)濟(jì)新聞》創(chuàng)刊20周年之際,第四范式董事長(zhǎng)戴文淵接受《每日經(jīng)濟(jì)新聞》記者采訪時(shí)建議,把當(dāng)前的人工智能技術(shù)視為一名實(shí)習(xí)生。實(shí)習(xí)生的初期工作成果可能并不完美,但他們確實(shí)能夠分擔(dān)部分工作負(fù)擔(dān),學(xué)習(xí)到達(dá)一定階段后,這些“實(shí)習(xí)生”或許就能勝任更加復(fù)雜和重要的工作任務(wù)。
長(zhǎng)久以來,專業(yè)學(xué)術(shù)翻譯面臨人才稀缺、周期長(zhǎng)、成本高、效率低、難度大等痛點(diǎn),基于此,8月,第四范式與商務(wù)印書館旗下科技公司萬邦同和共同為商務(wù)印書館建設(shè)學(xué)術(shù)出版專業(yè)大模型,這也是國(guó)內(nèi)首個(gè)出版領(lǐng)域大語言模型。
第四范式的定位是用AI能力服務(wù)各個(gè)垂直領(lǐng)域。以第四范式與商務(wù)印書館的合作為例,戴文淵指出,雖然當(dāng)前市場(chǎng)上的許多大模型已經(jīng)具備了翻譯功能,但真正的挑戰(zhàn)在于如何確保翻譯的質(zhì)量和精確度。簡(jiǎn)單的機(jī)器翻譯早在十幾年前就已實(shí)現(xiàn),隨著大模型技術(shù)的興起,翻譯質(zhì)量雖然有所提升,但要達(dá)到更為嚴(yán)格和專業(yè)的水準(zhǔn),如出版社級(jí)別的翻譯——要求萬字之中只允許出現(xiàn)一個(gè)錯(cuò)誤,并且必須確保術(shù)語的專業(yè)性,那么,大多數(shù)的通用模型還無法滿足這一需求。
第四范式與商務(wù)印書館的合作,是基于商務(wù)印書館多年來在數(shù)據(jù)與專家資源層面的累積,共創(chuàng)一款能夠達(dá)到出版級(jí)別的專用大模型,這是第四范式在眾多垂直領(lǐng)域探索與實(shí)踐之一。
將大模型應(yīng)用于出版這樣的高度專業(yè)化領(lǐng)域,并非第四范式一己之力能夠做到,而是一個(gè)雙方深度合作的過程,即所謂的“混合專家模型”。戴文淵介紹,這背后的運(yùn)作邏輯在于,模型會(huì)持續(xù)分析并學(xué)習(xí)商務(wù)印書館的專業(yè)數(shù)據(jù),同時(shí)每天輸出翻譯成果。這些成果并非直接用于出版,而是需要經(jīng)過商務(wù)印書館專家的指導(dǎo)和反饋。例如,當(dāng)某句話的翻譯不夠準(zhǔn)確時(shí),專家會(huì)提出改進(jìn)意見,這些意見隨后被納入AI的學(xué)習(xí)過程中,從而實(shí)現(xiàn)模型的持續(xù)優(yōu)化和提升。
戴文淵認(rèn)為,這恰恰代表了未來AI的工作模式:不再是簡(jiǎn)單的“客戶提供數(shù)據(jù)、公司輸出模型”的單一流程,而是一個(gè)持續(xù)迭代、不斷優(yōu)化的過程。以商務(wù)印書館為例,假設(shè)其團(tuán)隊(duì)中原本有五位專家,現(xiàn)在加入了一名“機(jī)器人員工”。這名新員工與五位專家一起工作,每天在專家的指導(dǎo)下產(chǎn)出并改進(jìn)工作成果,隨著時(shí)間的推移,他能夠承擔(dān)的工作任務(wù)會(huì)越來越多,從而提升了商務(wù)印書館的出版效率。
在大模型技術(shù)的廣泛應(yīng)用中,戴文淵坦言,雖然某些低門檻、重復(fù)性的工作確實(shí)會(huì)受到一定影響,但至少在目前看來,人類工作并不會(huì)被完全取代。舉例而言,以往專家在翻譯英文文章時(shí),往往需要從零開始、逐字逐句進(jìn)行翻譯;而如今,他們可以在AI已完成的翻譯稿件基礎(chǔ)上進(jìn)行修改。并且,隨著技術(shù)的不斷進(jìn)步和優(yōu)化,需要人工修訂的比例將逐漸降低。他認(rèn)為,這是一個(gè)無限趨近于零的過程,但也許永遠(yuǎn)不會(huì)達(dá)到“零”。
面對(duì)AI技術(shù),大多數(shù)人的第一反應(yīng)往往是思考其可能帶來的顛覆性變革。然而,在看到AI能夠完成的工作后,人們的第二反應(yīng)往往是覺得它仍然顯得笨拙、無法勝任某些工作。戴文淵解釋說:“我們一開始就把當(dāng)前的人工智能技術(shù)視為一名實(shí)習(xí)生。”實(shí)習(xí)生的初期工作成果可能并不完美,但他們確實(shí)能夠分擔(dān)部分工作負(fù)擔(dān)。同時(shí),在與實(shí)習(xí)生的合作過程中,人們可以看到他們每天都在進(jìn)步和成長(zhǎng)。到達(dá)一定階段后,這些“實(shí)習(xí)生”或許就能勝任更加復(fù)雜和重要的工作任務(wù)。
具體到翻譯工作中,初期可能只是從通用的翻譯功能起步,無法達(dá)到出版標(biāo)準(zhǔn),但是通過與已經(jīng)出版的標(biāo)準(zhǔn)譯文進(jìn)行對(duì)比,大模型能夠自動(dòng)識(shí)別并改進(jìn)翻譯結(jié)果。這一階段的進(jìn)步主要依賴于對(duì)歷史數(shù)據(jù)的訓(xùn)練,而無需過多的人機(jī)交互;第二階段,涉及沒有既定標(biāo)準(zhǔn)答案的翻譯任務(wù)時(shí),翻譯的準(zhǔn)確性就需要依賴專家的反饋來不斷提升。在這一階段,模型會(huì)不斷地從專家的指導(dǎo)中學(xué)習(xí)和進(jìn)步。
隨著AI能力的不斷提升,它對(duì)于人類專家指導(dǎo)的依賴會(huì)逐漸減少,直到趨近于零。當(dāng)模型對(duì)行業(yè)專家的依賴越來越低,AI也將能夠賦能更多小型出版社,推動(dòng)整個(gè)出版行業(yè)的發(fā)展。
戴文淵認(rèn)為,對(duì)于出版行業(yè)來說,擁抱新技術(shù)已成為不可逆轉(zhuǎn)的趨勢(shì)。
他表示,回想三四十年前,電腦確實(shí)逐漸替代了人們當(dāng)時(shí)的大部分工作,然而,人類總能發(fā)掘出新的價(jià)值所在。如今,我們正身處另一個(gè)變革的時(shí)代,未來AI技術(shù)同樣有可能接管人類目前從事的眾多工作。但這并不預(yù)示著“人”被替代,相反,人類一定能探尋到新的、能夠發(fā)揮價(jià)值的領(lǐng)域。
從長(zhǎng)遠(yuǎn)的角度看,對(duì)于出版業(yè)等傳統(tǒng)行業(yè)而言,接納這些以大模型為代表的新興技術(shù),最先顯現(xiàn)的改變將是效率的顯著提升,與之相應(yīng)的,利潤(rùn)水平也會(huì)迎來增長(zhǎng),與此同時(shí),戴文淵認(rèn)為,如果效率能達(dá)到極致提升,商業(yè)模式也可能隨之改變。
他舉例稱,未來的傳播媒介可能不再局限于紙質(zhì),而是真正轉(zhuǎn)向電子書,這將大幅降低傳播成本,書籍的售價(jià)可能從現(xiàn)今的幾十元甚至上百元,低至一分、兩分,這一定需要技術(shù)的革新。他認(rèn)為,顛覆性的變革,不僅局限于出版業(yè),所有行業(yè)都需要做好準(zhǔn)備,迎接技術(shù)革新可能帶來的顛覆性影響。生產(chǎn)力的革新,勢(shì)必會(huì)引發(fā)生產(chǎn)關(guān)系和商業(yè)模式的重塑,因此,探尋新的商業(yè)模式顯得至關(guān)重要。
從第四范式的視角來解讀,戴文淵認(rèn)為,新質(zhì)生產(chǎn)力代表的是一種價(jià)值獲取模式的轉(zhuǎn)變。
他表示,過去的增長(zhǎng)模式,類似于不斷地建造新的房屋,從兩座到第三座、第四座,從而實(shí)現(xiàn)增長(zhǎng)。然而,在新的生產(chǎn)力模式下,我們或許無需再通過建造更多的房屋實(shí)現(xiàn)增長(zhǎng),而是對(duì)現(xiàn)有的兩座房屋進(jìn)行翻修和升級(jí)。改造后,這兩座房屋不僅能容納原先四座房屋的人數(shù),還能為他們提供更加優(yōu)越的居住體驗(yàn)。而這種模式的轉(zhuǎn)變,無疑會(huì)讓那些過去對(duì)數(shù)字化轉(zhuǎn)型或智能化不感興趣的企業(yè),開始重新?lián)肀н@種轉(zhuǎn)型。
戴文淵認(rèn)為,這是必然趨勢(shì),因?yàn)楫?dāng)前,已經(jīng)難以再依賴大規(guī)模的資源和投資來拉動(dòng)增長(zhǎng),而必須依靠效率的提升來驅(qū)動(dòng)價(jià)值的增長(zhǎng)。“在擁有充足空地的情況下,似乎只需增加房屋建設(shè)即可實(shí)現(xiàn)增長(zhǎng),那么技術(shù)進(jìn)步的重要性就顯得不那么關(guān)鍵了。但從當(dāng)前情況來看,必須朝著優(yōu)化現(xiàn)有土地使用的方向努力,因?yàn)闊o論是否愿意接受,現(xiàn)在已沒有更多的空地可供建設(shè)。”
“對(duì)于傳統(tǒng)行業(yè)而言,新質(zhì)生產(chǎn)力可能預(yù)示著他們的生產(chǎn)模式需要進(jìn)行變革”,戴文淵分析道,雖然目前的第一波增長(zhǎng)主要來源于傳統(tǒng)模式與新技術(shù)的結(jié)合,從而實(shí)現(xiàn)了效率的提升,但更大的想象空間并不局限于在傳統(tǒng)模式上獲得增量,而是當(dāng)掌握了更高效的技術(shù)時(shí),整個(gè)生產(chǎn)模式有可能發(fā)生翻天覆地的變化。他認(rèn)為,在下一階段,AI的角色將不再局限于對(duì)傳統(tǒng)模式的改進(jìn),“當(dāng)新技術(shù)出現(xiàn)時(shí),模式需要發(fā)生變化”。
對(duì)于AI產(chǎn)業(yè)而言,在推進(jìn)新質(zhì)生產(chǎn)力的過程中,戴文淵判斷,未來幾年內(nèi),AI公司可能會(huì)迎來一個(gè)時(shí)代性的轉(zhuǎn)折機(jī)會(huì),即AI技術(shù)將從后臺(tái)走向前臺(tái)?,F(xiàn)在,行業(yè)內(nèi)已經(jīng)能看到AI公司開始To C,十年前,如果要做一家AI技術(shù)公司,可能只能面向B端客戶,因?yàn)橄裢扑]引擎這樣的技術(shù)無法直接服務(wù)于C端。然而,現(xiàn)在人工智能技術(shù)已經(jīng)有機(jī)會(huì)直接觸達(dá)用戶。戴文淵認(rèn)為,也許在三至五年后,這一趨勢(shì)將更加明晰。“未來三到五年,AI面向C端與面向B端的體量會(huì)達(dá)到相當(dāng)水平,甚至To C可能成為一個(gè)更大的體量,這都是有可能的。”
對(duì)于那些還在等待或正在進(jìn)行新質(zhì)生產(chǎn)力改造的傳統(tǒng)企業(yè)而言,戴文淵建議,第一步需要認(rèn)知到AI技術(shù)的價(jià)值,當(dāng)認(rèn)知到AI后,就需要開始思考如何利用這種新的工具來改變他們的生產(chǎn)方式,以提高效率或開拓新的業(yè)務(wù)領(lǐng)域,“開始往這個(gè)方向想了,我覺得離成功就不遠(yuǎn)了”。
封面圖片來源:視覺中國(guó)-VCG41N1472123004
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP