每日經(jīng)濟新聞 2025-01-29 16:14:53
每經(jīng)AI快訊,華泰證券研報稱,DeepSeek發(fā)布R1模型及相關(guān)應(yīng)用,以較低的訓(xùn)練成本達到與現(xiàn)有前沿模型相當?shù)男Ч?,引發(fā)市場對算力投資的擔憂。華泰證券認為:1)DeepSeek主要創(chuàng)新是通過在預(yù)訓(xùn)練階段加入強化學(xué)習(xí),DeepSeek V3訓(xùn)練成本相當于Llama3系列的7%,對當前世代AI大模型的降本做出了重要貢獻,有望降低現(xiàn)有模型的訓(xùn)練和推理成本;2)目前北美四大AI公司主要通過擴大GPU集群規(guī)模的方式探索下一代大模型,DeepSeek的方式是否在下一代模型研發(fā)中有效還有待觀察。3)DeepSeek這次的成功顯示,在Scaling Law放緩的大背景下,中美在大模型技術(shù)上的差距有望縮小。
如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán),嚴禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟新聞APP