每日經(jīng)濟新聞 2025-01-27 17:43:41
近期,DeepSeek力壓ChatGPT登頂美區(qū)App Store免費榜;1月25日,AMD宣布全新的DeepSeek-V3模型已集成至AMD Instinct GPU上。受此影響,今日國內(nèi)DeepSeek概念股“刷屏”,AI智能體、AI語料等概念股領(lǐng)漲;算力硬件股持續(xù)走低。分析認為,DeepSeek的低成本意味著大模型對算力投入的需求可能會從訓練側(cè)向推理側(cè)傾斜,這可能會對英偉達等硬件商的市場地位和戰(zhàn)略布局產(chǎn)生影響。
每經(jīng)記者 楊建 每經(jīng)編輯 趙云
今日A股市場迎來龍年收官戰(zhàn),三大指數(shù)走勢分化明顯,收盤滬指跌0.06%,創(chuàng)業(yè)板指跌2.73%,收報2063.82點。滬深兩市成交額達到11179億元,較上周五縮量1041億。
值得注意的是,一邊是DeepSeek概念股“刷屏”,AI智能體、AI語料等概念股領(lǐng)漲。另一邊,算力板塊的銅高速連接、CPO等方向則紛紛領(lǐng)跌,仕佳光子跌超16%,兆龍互連、天孚通信等跌超10%。
這是為何?
據(jù)了解,上述反常現(xiàn)象背后,主要源于“國產(chǎn)AI之光”的大模型DeepSeek力壓ChatGPT,登頂美區(qū)App Store免費榜,在國內(nèi)App Store免費榜同樣位居第一。在美區(qū)App Store免費榜Top100中,DeepSeek和ChatGPT躋身前三。DeepSeek霸榜美國應(yīng)用商店,展現(xiàn)出中國應(yīng)用程序驚人的影響力。
據(jù)悉,DeepSeek推理大模型DeepSeek-R1發(fā)布已經(jīng)過去近一周時間,開源模型DeepSeek-V3也已經(jīng)發(fā)布了近一個月。DeepSeek-V3在僅使用2048塊H800 GPU的情況下,完成了6710億參數(shù)模型的訓練,成本僅為557.6萬美元,遠低于其他頂級模型如GPT-4的10億美元。
受此利好影響,國內(nèi)DeepSeek概念股“刷屏”,AI智能體、AI語料等概念股領(lǐng)漲,甚至連與DeepSeek關(guān)聯(lián)的股東、合作伙伴都被市場挖掘出來炒作一番。
對此,排排網(wǎng)財富研究部副總監(jiān)劉有華告訴《每日經(jīng)濟新聞》記者,AI大模型領(lǐng)域近年來吸引了大量資本投入,盡管大模型在性能上取得了突破,但仍面臨技術(shù)瓶頸與應(yīng)用落地方面的挑戰(zhàn)。大模型訓練需要巨額算力支持,而當前市場中算力資源的過剩使得成本問題凸顯。國際競爭與政策影響,這進一步加劇了AI產(chǎn)業(yè)鏈的不確定性。AI應(yīng)用后期的投資機會廣泛且多樣,從算力基礎(chǔ)設(shè)施到行業(yè)應(yīng)用,再到生成式AI和端側(cè)AI,均展現(xiàn)出強勁的增長潛力。
1月25日,英偉達的“競爭對手”AMD火速為DeepSeek“站臺”,宣布全新的DeepSeek-V3模型已集成至AMD InstinctGPU上。DeepSeek-V3模型的突破顯著降低了AI培訓成本,使AMD GPU成為比英偉達更具有成本效益的替代品。
國內(nèi)A股市場也迅速做出反應(yīng),今日算力硬件股持續(xù)走低,銅高速連接、CPO等方向領(lǐng)跌,仕佳光子跌超16%,兆龍互連、天孚通信等跌超10%。
OpenAI的成功是以規(guī)模作為大模型的制勝法寶,但是這種“軍備競賽”型的模式,帶來了驚人的訓練成本,不少公司難以為繼。甚至連臉書母公司Meta也來偷師學藝,據(jù)澎湃新聞報道,1月27日,臉書母公司Meta成立了四個專門研究小組來研究量化巨頭幻方量化旗下的國產(chǎn)大模型DeepSeek的工作原理,并基于此來改進旗下大模型Llama。
黑崎資本首席戰(zhàn)略官陳興文告訴記者,DeepSeek的低成本意味著大模型對算力投入的需求可能會從訓練側(cè)向推理側(cè)傾斜,即未來對推理算力的需求將成為主要驅(qū)動力。而英偉達等硬件商的傳統(tǒng)優(yōu)勢更多集中在訓練側(cè),這可能會對其市場地位和戰(zhàn)略布局產(chǎn)生影響。DeepSeek此次大規(guī)模開源行動引發(fā)的行業(yè)震動,本質(zhì)上是技術(shù)浪潮對傳統(tǒng)AI研發(fā)范式的結(jié)構(gòu)性沖擊。
陳興文指出,DeepSeek通過MIT協(xié)議開源8個核心模型并全鏈路公開訓練細節(jié),其以“技術(shù)裸奔”姿態(tài)重構(gòu)了行業(yè)競爭規(guī)則——開源生態(tài)的透明性不僅打破閉源體系的技術(shù)黑箱壟斷,更通過全球開發(fā)者社區(qū)的協(xié)同創(chuàng)新形成指數(shù)級迭代能力。這種開源策略直接顛覆硅谷“算力軍備競賽”邏輯,使得DeepSeek低成本大模型對算力投入的需求可能會從訓練側(cè)向推理側(cè)傾斜,即未來對推理算力的需求將成為主要驅(qū)動力。而英偉達等硬件商的傳統(tǒng)優(yōu)勢更多集中在訓練側(cè),這可能會對其市場地位和戰(zhàn)略布局產(chǎn)生影響。
模型在557萬美元超低成本下實現(xiàn)性能突破,證明算法創(chuàng)新可對沖硬件劣勢,為算力受限地區(qū)開辟新路徑。尤其在地緣技術(shù)博弈加劇的背景下,DeepSeek通過囤積高端芯片與優(yōu)化低性能芯片組合的雙軌策略,結(jié)合強化學習替代監(jiān)督微調(diào)的技術(shù)突破,成功將硬件約束轉(zhuǎn)化為算法創(chuàng)新驅(qū)動力,這種逆境突圍重新定義了全球AI競爭格局,這種技術(shù)范式的轉(zhuǎn)變正在催生產(chǎn)業(yè)鏈價值重構(gòu)。
在算力基建層面,模型訓練從粗放型算力堆砌轉(zhuǎn)向精細化能效管理,倒逼數(shù)據(jù)中心向綠色高效轉(zhuǎn)型。數(shù)據(jù)要素價值隨之凸顯,特定領(lǐng)域的行為數(shù)據(jù)、專業(yè)語料庫成為模型優(yōu)化的戰(zhàn)略資源,驅(qū)動數(shù)據(jù)采集、清洗、標注產(chǎn)業(yè)升級。更深遠的影響體現(xiàn)在AI應(yīng)用生態(tài):開源模型大幅降低技術(shù)準入門檻,使得中小企業(yè)能快速部署智能客服、自動化文檔處理等輕量化應(yīng)用,而模型輕量化與邊緣計算結(jié)合,正加速AI能力向物聯(lián)網(wǎng)終端滲透,為智能家居、工業(yè)物聯(lián)網(wǎng)等場景創(chuàng)造落地條件。
陳興文表示,當前全球算力市場正陷入“結(jié)構(gòu)性過剩與短缺并存”的困境。中國市場中,大量跨界資本涌入智算中心建設(shè),導致2024年全國建成超1.3萬個智算中心,但平均利用率不足30%,千卡集群年虧損達2700萬元。這種過剩本質(zhì)上是低端算力(如A100芯片集群)的盲目擴張與高端智能算力(H100/H800)短缺的疊加結(jié)果——實際需求端,大模型訓練所需的智能算力缺口達53%,更深層矛盾在于技術(shù)迭代速度遠超硬件建設(shè)周期,當企業(yè)耗時18個月建成智算中心時,市場主流芯片已從A100升級至H800,設(shè)備貶值率超40%。
這種粗放式擴張反襯出DeepSeek技術(shù)路線的顛覆性:其僅用2048塊H800顯卡、557萬美元成本便訓練出性能對標GPT-4o的模型,通過MLA架構(gòu)和強化學習飛輪機制,將訓練效率提升至Meta Llama3的11倍,百萬Token推理成本壓至0.55美元(僅為OpenAI的3.6%)。這種“算法優(yōu)化對沖硬件約束”的模式,不僅證明尖端AI發(fā)展無需依賴無限堆砌算力,更直接動搖了美國技術(shù)霸權(quán)的根基。
陳興文表示,DeepSeek的崛起之所以被稱為“美股最大威脅”,源于其對美國AI商業(yè)邏輯與芯片霸權(quán)的雙重解構(gòu)。技術(shù)層面,其開源策略(MIT協(xié)議開放8個模型權(quán)重及全鏈路訓練細節(jié))形成全球開發(fā)者協(xié)同創(chuàng)新的“開源飛輪”,相較OpenAI閉源模式展現(xiàn)出指數(shù)級迭代優(yōu)勢,吸引Meta、Google工程師反向研究其RL技術(shù)框架。
產(chǎn)業(yè)層面,其通過算法創(chuàng)新實現(xiàn)低算力依賴,削弱了英偉達高端GPU的不可替代性,導致市場重估英偉達估值邏輯,引發(fā)其股價單日暴跌5.8%,連帶日本芯片測試設(shè)備商Advantest市值蒸發(fā)8.6%。
地緣博弈層面,DeepSeek驗證了中國AI企業(yè)“用架構(gòu)創(chuàng)新壓縮技術(shù)代差”的可能性,紐約時報評價其“使美國芯片封鎖淪為戰(zhàn)略敗筆”,周鴻祎更直言這是“中國突破硅谷技術(shù)鐵幕的里程碑”。資本市場對此劇烈反應(yīng):納斯達克期貨下跌1.9%,反映投資者重新評估全球AI產(chǎn)業(yè)權(quán)力結(jié)構(gòu)。
陳興文表示,這場變革的本質(zhì)是AI競爭從“資本密集型”向“創(chuàng)新密集型”的范式遷移。短期算力過剩實則是低端產(chǎn)能出清的前奏,DeepSeek的技術(shù)路徑預示未來算力市場將兩極分化:通用算力加速淘汰,智能算力向算法優(yōu)勢企業(yè)集中。
如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán),嚴禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟新聞APP