每日經(jīng)濟新聞 2025-02-12 19:31:31
2月12日,Gartner高級總監(jiān)分析師方琦接受《每日經(jīng)濟新聞》記者采訪時表示,DeepSeek成功的關(guān)鍵因素在于偏研究型的導(dǎo)向,以及大量工程師持之以恒的創(chuàng)新。針對DeepSeek帶來的開源閉源之爭,方琦認(rèn)為,這可能要從商業(yè)路徑來探討。以Meta的Llma3為例,模型開源完善了其生態(tài)圈,增強了與蘋果等主要渠道的議價權(quán)。另外,方琦提到,在AI時代,會用AI的人淘汰不會用AI的人。
每經(jīng)記者 蔡鼎 每經(jīng)編輯 蘭素英
圖片來源:視覺中國
DeepSeek的橫空出世,在華爾街到硅谷的每一個角落都掀起了一股颶風(fēng)。自DeepSeek-R1發(fā)布后,DeepSeek的相關(guān)搜索指數(shù)飆升了230%,成為科技領(lǐng)域的焦點話題。
DeepSeek憑什么能夠逆襲,挑戰(zhàn)OpenAI的霸主地位?此前的報道都聚焦在該公司560萬美元的訓(xùn)練成本和創(chuàng)新“蒸餾”技術(shù)的運用。
美國IT研究與顧問咨詢公司Gartner高級總監(jiān)分析師方琦(Mike Fang)2月12日在接受《每日經(jīng)濟新聞》記者采訪時表示,DeepSeek在文化和業(yè)務(wù)模式上與其他大模型公司有比較大的差異,其成功的關(guān)鍵因素在于偏研究型的導(dǎo)向,以及大量工程師持之以恒的算法優(yōu)化創(chuàng)新。
他進(jìn)一步解釋稱,DeepSeek不是一個以盈利為短期目標(biāo)的公司,更多是從研究角度來鼓勵工程師,沒有特別多財務(wù)變現(xiàn)或者業(yè)務(wù)變現(xiàn)的壓力。
方琦主要負(fù)責(zé)Gartner數(shù)據(jù)分析小組的AI業(yè)務(wù),幫助高管更好地使用AI和數(shù)據(jù),進(jìn)而實現(xiàn)企業(yè)機構(gòu)的商業(yè)價值。他的主要研究領(lǐng)域是中國的AI市場和供應(yīng)商,以及AI數(shù)據(jù)。
NBD:在您看來,DeepSeek問世至今有如此大的影響力,靠的是什么?
方琦:我們觀察到,DeepSeek的競爭性優(yōu)勢主要體現(xiàn)在兩個方面:一方面,這家公司是一家偏研究導(dǎo)向,而不是一家以盈利為短期目標(biāo)的公司,所以它更多是從研究角度來鼓勵工程師,能夠更高效地運營,而沒有特別多財務(wù)變現(xiàn)或者業(yè)務(wù)變現(xiàn)的壓力。這就是在文化和業(yè)務(wù)模式上,該公司與其他大模型公司主要的區(qū)別。
另一方面,DeepSeek擁有大量工程師,在有限的硬件環(huán)境下(尤其是美國芯片管制后)進(jìn)行算法優(yōu)化。例如,V3模型就應(yīng)用了MLA(混合精度計算)等技術(shù)。這些都保證DeepSeek能夠在有限的資源當(dāng)中,能夠更好地提高模型的性能。
NBD:DeepSeek通過低成本+開源策略迅速崛起,您如何看待這一現(xiàn)象?這是否預(yù)示著AI行業(yè)格局正在發(fā)生一些深刻的變革?
方琦:DeepSeek的崛起其實還是歸功于公司的業(yè)務(wù)戰(zhàn)略。首先,它并是一個不以商業(yè)驅(qū)動的公司,而是以研究驅(qū)動的方式來進(jìn)行模型開發(fā)。
其次,DeepSeek一直在創(chuàng)新——從最早的模型到后來的V3和R1模型,DeepSeek是一步一個腳印走出來的。我們可以看到,DeepSeek在工程化方面一直在不斷突破算力的應(yīng)用,而不是單純依靠堆硬件進(jìn)行暴力破解。DeepSeek有蒸餾的能力,模型蒸餾能力能夠幫助建立一個更高效的,甚至是能夠本地部署模型。
DeepSeek能達(dá)到頂尖模型的能力,不光是靠低成本,還在App上融合了網(wǎng)絡(luò)搜索和深度思考的創(chuàng)新,讓人耳目一新,引起海外的廣泛關(guān)注。
圖片來源:每經(jīng)記者 蘭素英攝
NBD:您如何看待開源和閉源之間的爭論?開源AI技術(shù)是否會成為行業(yè)發(fā)展的主流趨勢?
方琦:開源和閉源現(xiàn)在確實還有很多爭論。
從我們現(xiàn)在看到的來講,如果一個閉源模型的性能達(dá)不到開源模型的水準(zhǔn),那這個閉源模型是否還有存在的必要?這要從商業(yè)路徑來探討。但是如果一個閉源模型性能強于開源模型的話,那從商業(yè)化角度或者收費模式看還是會有優(yōu)勢,也能適應(yīng)開源模型帶來的競爭環(huán)境。
從開源模型的角度看,以Meta的Llma3為例,將模型開源完善了其生態(tài)圈,增強了與蘋果等主要渠道的議價權(quán)。這也是為什么大公司會將大模型開源的一大主要原因。
DeepSeek的開源策略尚未考慮具體商業(yè)落地,未來如何演進(jìn)仍需觀察。開源模型如何商業(yè)化?這還是有很大的想象空間的。
NBD:DeepSeek用開源將AI入場券“平民化”,那么未來在AI成本迅速降低的基礎(chǔ)上,以前互聯(lián)網(wǎng)的哪些行業(yè)將獲得爆發(fā)機會?哪些又會被削弱?
方琦:我認(rèn)為,從成本(大幅)降低的角度來講,就是原來工程師能做十次實驗,現(xiàn)在可能可以做100次實驗。這降低了我們的試錯成本,會產(chǎn)生很多機會。我認(rèn)為,未來尤其是基于推理模型,會有很多新的嘗試,例如OpenAI的DeepResearch。未來,大家可以通過像DeepSeek-R1這樣的開源模型,做更多的研發(fā)和創(chuàng)新,為各行業(yè)帶來新的炒作曲線和嘗試機會。
Gartner高級總監(jiān)分析師方琦(圖片來源:受訪者供圖)
NBD:DeepSeek的橫空出世,對中國的AI產(chǎn)業(yè)和相關(guān)的企業(yè)意味著什么?
方琦:對于中國的整個AI產(chǎn)業(yè)來講,DeepSeek的MIT許可證(MIT License)為中國企業(yè)出海提供了機會,尤其是在開發(fā)、硬件推理和芯片領(lǐng)域。
對于中國企業(yè)來講,需要更加關(guān)注對AI的治理。如果將DeepSeek模型的能力比作一輛高速行駛的汽車,那么缺乏原生剎車系統(tǒng)或剎車系統(tǒng)不完善都將帶來風(fēng)險。企業(yè)需要自建或管控這些風(fēng)險規(guī)避機制,確保AI治理體系的健壯性,才能使企業(yè)的“車”開得更快。因此,關(guān)注AI倫理和負(fù)責(zé)任的AI治理是關(guān)鍵。
NBD:AI時代,創(chuàng)業(yè)者和普通人應(yīng)該如何用AI來打造新的行業(yè)?
方琦:我認(rèn)為每個從業(yè)者都會用一些新的工具,因為AI能夠更好地解鎖生產(chǎn)力。應(yīng)用AI的能力對我們來說也是比較重要的。未來,會用AI的人淘汰不會用AI的人。這是大家普遍能夠看到的一個趨勢。
NBD:隨著開源大模型的崛起,您認(rèn)為普通人是否應(yīng)該擔(dān)心一些職業(yè)或者行業(yè)會被AI替代?
方琦:從企業(yè)的角度來看,現(xiàn)在普遍存在的一個誤區(qū)是,大家認(rèn)為AI會像樂高積木一樣,拼湊在一塊,某一個人或企業(yè)未來會像樂高積木一樣被AI替代了,我認(rèn)為這個大概率不會發(fā)生。
如果一些行業(yè)能夠被快速替代,或者一個企業(yè)當(dāng)中的非核心業(yè)務(wù)被替代,那我覺得企業(yè)應(yīng)該更多地采取外包策略。
我認(rèn)為,未來可能像一個濕地系統(tǒng),里面有各種動物、植物,他們其實是一個共生的關(guān)系。我們應(yīng)該更多地考慮,如何將職業(yè)和AI互補,如何讓這個流程變得更好,而非是否可能被替代的問題。
如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟新聞APP