每日經(jīng)濟(jì)新聞 2025-02-14 10:09:59
在鄔賀銓看來,可信數(shù)據(jù)空間就是一個“有圍欄的數(shù)據(jù)沙箱”,數(shù)據(jù)使用方以數(shù)據(jù)“可用不可見”的方式互惠或有償使用數(shù)據(jù)。建設(shè)可信數(shù)據(jù)空間就是要解決7大難題,包括數(shù)據(jù)流通、共享和利用的問題,同時消除對數(shù)據(jù)泄露、網(wǎng)絡(luò)安全和個人隱私保護(hù)的擔(dān)憂,并且可以解決跨境數(shù)據(jù)流動中的合規(guī)性問題。
每經(jīng)記者 張蕊 每經(jīng)編輯 陳星
大企業(yè),想開發(fā)數(shù)據(jù)又擔(dān)心數(shù)據(jù)泄露?
小企業(yè),想用數(shù)據(jù)卻不會用,還沒有渠道?
別擔(dān)心,可信數(shù)據(jù)空間將有效解決這些問題。國家數(shù)據(jù)局發(fā)布《可信數(shù)據(jù)空間發(fā)展行動計劃(2024—2028年)》,這是國家層面首次針對可信數(shù)據(jù)空間這一新型數(shù)據(jù)基礎(chǔ)設(shè)施進(jìn)行系統(tǒng)布局,將實施可信數(shù)據(jù)空間能力建設(shè)行動,開展可信數(shù)據(jù)空間培育推廣行動。
為什么要加快發(fā)展可信數(shù)據(jù)空間?它可以解決哪些問題?跟我們普通人又有怎樣的關(guān)系?帶著這些問題,《每日經(jīng)濟(jì)新聞》(以下簡稱NBD)記者專訪了中國工程院院士、中國工程院原副院長鄔賀銓。
作為我國通信與信息系統(tǒng)領(lǐng)域的杰出專家,鄔賀銓是中國最早從事數(shù)字通信技術(shù)研究的骨干之一,多次參與了中國通信發(fā)展的決策。
在鄔賀銓看來,可信數(shù)據(jù)空間就是一個“有圍欄的數(shù)據(jù)沙箱”,數(shù)據(jù)使用方以數(shù)據(jù)“可用不可見”的方式互惠或有償使用數(shù)據(jù)。建設(shè)可信數(shù)據(jù)空間就是要解決7大難題,包括數(shù)據(jù)流通、共享和利用的問題,同時消除對數(shù)據(jù)泄露、網(wǎng)絡(luò)安全和個人隱私保護(hù)的擔(dān)憂,并且可以解決跨境數(shù)據(jù)流動中的合規(guī)性問題。
他表示,目前可信數(shù)據(jù)空間在國際上尚無體系化部署和應(yīng)用的經(jīng)驗,德國的汽車行業(yè)在做,但也尚未大規(guī)模推廣,中國也會先做一些試點??尚艛?shù)據(jù)空間建成后,對企業(yè)來說,有利于數(shù)字化轉(zhuǎn)型;對政府?dāng)?shù)據(jù)來說,可以更好地開放利用。
NBD:您提到,目前可信數(shù)據(jù)空間在國際上尚無體系化部署和應(yīng)用的經(jīng)驗,那我國提出來發(fā)展可信數(shù)據(jù)空間是出于什么考慮?它主要是為了解決什么問題?
鄔賀銓:近年來,人工智能發(fā)展迅速,其發(fā)展需要算力、數(shù)據(jù)、算法來共同支撐,人工智能的快速發(fā)展更進(jìn)一步凸顯了數(shù)據(jù)的重要性。中國高度重視數(shù)據(jù),并首先提出數(shù)據(jù)是生產(chǎn)要素。過去支撐經(jīng)濟(jì)增長的主要生產(chǎn)要素是土地、勞動力以及全要素生產(chǎn)率(即科技貢獻(xiàn))等,這幾年傳統(tǒng)的全要素生產(chǎn)率和勞動力的貢獻(xiàn)均有所下降。因此,我國提出了數(shù)據(jù)驅(qū)動的數(shù)字化轉(zhuǎn)型戰(zhàn)略,旨在發(fā)揮數(shù)據(jù)的作用。
中國擁有龐大的人口和全球最多的工業(yè)門類,從這個意義上說,我們生活和生產(chǎn)的數(shù)據(jù)量巨大。因此,發(fā)揮數(shù)據(jù)作為生產(chǎn)要素的作用是一個正確的方向,也是我國未來經(jīng)濟(jì)發(fā)展的希望所在。
然而,很多企業(yè)盡管有數(shù)據(jù),但在數(shù)據(jù)使用上存在幾個問題:首先是不敢用,由于擔(dān)心數(shù)據(jù)泄露,大企業(yè)認(rèn)為其數(shù)據(jù)與國民經(jīng)濟(jì)密切相關(guān),不能隨意使用。而且許多大型央企擁有大量數(shù)據(jù),但在數(shù)據(jù)挖掘能力上仍然不足。本來正確的方向是與具有這種能力的信息技術(shù)企業(yè)合作,但又擔(dān)心數(shù)據(jù)拿出來會泄密。
其次是不會用,特別是很多中小企業(yè),有一些數(shù)據(jù),但是不知道怎么用。即便政府開放了一些數(shù)據(jù),但開放的數(shù)據(jù)真正被利用的比例仍然很低,因為要充分利用好這些數(shù)據(jù),也有技術(shù)門檻。
第三,一些單位不一定不會用,也不一定不敢用,它擁有的數(shù)據(jù)本來應(yīng)該是可以開放的,但是它想壟斷,以不安全為借口不去共享,這是“不愿用”。
另外就是沒數(shù)據(jù)。很多企業(yè)的數(shù)字化改造尚未達(dá)到較高水平,沒有數(shù)據(jù)可用。當(dāng)然,沒數(shù)據(jù)不等于不想用行業(yè)的數(shù)據(jù)和社會的數(shù)據(jù),是缺乏獲取這些數(shù)據(jù)的途徑。因此,盡管中國表面上擁有全球最多的工業(yè)行業(yè)數(shù)據(jù),但實際上利用率很低。有資料表明,中國每年產(chǎn)生的數(shù)據(jù)只有不到3%被存儲,被利用的比例更低。
盡管語言數(shù)據(jù)很多,但存儲下來的不多,能夠被公開檢索的更是少之又少。中國的語言數(shù)據(jù)庫,一些高校和研究機(jī)構(gòu)中有,但并不開放,開源的很少。ChatGPT訓(xùn)練時需要全球各種語言的數(shù)據(jù),其中中文數(shù)據(jù)僅占千分之一,比例非常低。因此,很多國內(nèi)公司在開發(fā)大模型時使用的是美國開源數(shù)據(jù)庫的數(shù)據(jù),這其實存在價值觀對齊的風(fēng)險,他們的數(shù)據(jù)并不一定都是安全的。
所以,可信數(shù)據(jù)空間的提出就是要解決數(shù)據(jù)流通、共享和利用的問題,同時消除對數(shù)據(jù)泄露、網(wǎng)絡(luò)安全和個人隱私保護(hù)的擔(dān)憂。此外,在未來跨境數(shù)據(jù)流動中,還需確保合規(guī)性。這是可信數(shù)據(jù)空間提出的愿景。
NBD:文件中明確了可信數(shù)據(jù)空間的定義,如何通俗地理解可信數(shù)據(jù)空間?在這個空間里可以干什么?
鄔賀銓:可信數(shù)據(jù)空間實際上可以被視為一個“有圍欄的數(shù)據(jù)空間”,在這個空間內(nèi),可以放入加密和非加密的數(shù)據(jù),但訪問這些數(shù)據(jù)需要經(jīng)過接入認(rèn)證。在這個空間內(nèi),相關(guān)主體可以利用算力支持,引入大模型進(jìn)行計算,提取有用信息,計算結(jié)果可以帶走,但數(shù)據(jù)本身無法帶走。這是一個“有圍欄的數(shù)據(jù)沙箱”,數(shù)據(jù)不出域,相當(dāng)于一個貨物的保稅區(qū)或自貿(mào)區(qū),貨物放入其中,在這里可以有很多工人進(jìn)行生產(chǎn)加工,加工的最終成品可以拿出去,但最原始的東西是拿不走的。
可信數(shù)據(jù)空間有什么用處:第一種,比如大企業(yè)自己有數(shù)據(jù),但未能充分利用,那么大企業(yè)就可以和互聯(lián)網(wǎng)企業(yè)或者具有大模型能力的企業(yè)合作,與其簽訂合同,你可以進(jìn)入我的數(shù)據(jù)空間,用你的大模型按我的要求幫我分析這些數(shù)據(jù)。比如石油企業(yè)擁有大量地下探礦得到的地震測繪圖形和視頻數(shù)據(jù),要想知道哪里有油、有多少,人工分析效率很低,企業(yè)就希望使用大模型來分析數(shù)據(jù),并給出明確結(jié)論,比如這個井有沒有油、大概有多少油。
這些數(shù)據(jù)在空間內(nèi)無法帶走,企業(yè)不必?fù)?dān)心數(shù)據(jù)被泄露。同時,分析過程中的數(shù)據(jù)可以是加密的,企業(yè)可以與合作伙伴共享密鑰,但未經(jīng)允許,合作伙伴無法再次使用密鑰,下次密鑰又變了。比如采用同態(tài)加密技術(shù),合作企業(yè)可以進(jìn)來對加密數(shù)據(jù)進(jìn)行計算,其計算的結(jié)果與對不加密的原始數(shù)據(jù)進(jìn)行計算是一樣的,這種即使合作企業(yè)知道了加密密鑰,但是沒有大企業(yè)的密鑰配合也無法使用。所以這完全是一種可控的、可以放心地將數(shù)據(jù)與他人進(jìn)行合作計算的方式。
第二種,比如產(chǎn)業(yè)鏈的龍頭企業(yè)希望掌握上下游企業(yè)的生產(chǎn)和庫存數(shù)據(jù),“全線拉通”就可以實現(xiàn)整個供應(yīng)鏈的精準(zhǔn)生產(chǎn),我需要多少你生產(chǎn)多少,這樣就可以做到上下游企業(yè)零庫存、少庫存,也能更準(zhǔn)確地知道資金的需求量,進(jìn)而提高整個產(chǎn)業(yè)鏈的效率。但是對產(chǎn)業(yè)鏈上下游的企業(yè)來說,要把所有數(shù)據(jù)都告訴這個龍頭企業(yè),很多企業(yè)也很擔(dān)心,因為這一家企業(yè)可能同時是幾個不同龍頭企業(yè)的供應(yīng)鏈企業(yè),一家龍頭企業(yè)掌握了是不是其他家也會掌握?利用可信數(shù)據(jù)空間就可以解決這種問題,所有企業(yè)的數(shù)據(jù)都可以放入空間,我只是要得出一個優(yōu)化排產(chǎn)的方案,這對產(chǎn)業(yè)鏈上的企業(yè)都有利,而并不會泄露上下游企業(yè)的原始數(shù)據(jù)。
第三種,政府擁有大量高質(zhì)量數(shù)據(jù),比如戶口信息。這些數(shù)據(jù)非常重要,比如一個小區(qū)有多少老人、有多少適齡兒童,這對安排學(xué)校、養(yǎng)老院和醫(yī)療機(jī)構(gòu)非常有用。當(dāng)然,政府在公開數(shù)據(jù)時,需要進(jìn)行脫敏處理,以保護(hù)個人隱私。
盡管政府?dāng)?shù)據(jù)現(xiàn)在公開不少,但是能用的很少。要會用這些數(shù)據(jù),也有一定門檻。普通人即便看到這么多數(shù)據(jù)也不會用,所以將數(shù)據(jù)放到可信數(shù)據(jù)空間,不但要解決脫敏問題,還要提供很多附帶的開發(fā)數(shù)據(jù)的軟件。
例如政府公布了北京市某個區(qū)的相關(guān)數(shù)據(jù),我如果想要查看不同年齡段的人口比例,再跟全市不同區(qū)域老齡人口、學(xué)齡兒童、學(xué)齡前兒童的比例及相對應(yīng)的養(yǎng)老機(jī)構(gòu)、小學(xué)、托幼機(jī)構(gòu)分布等結(jié)合,靠人去算工作量很大,如果這里面有一些工具軟件,只要使用者提出需求,就可以自動生成相應(yīng)的圖表。比如我要買房子,位置選在哪里合適?最近各個片區(qū)房價怎樣?這些都可以分析,從而幫購房者作出決策。這也是可信數(shù)據(jù)空間的一個作用。
第四種,企業(yè)在進(jìn)行國際貿(mào)易時,需要跨境傳輸數(shù)據(jù)。國家對出境數(shù)據(jù)有管理要求,特別是涉及個人信息和隱私的數(shù)據(jù)。企業(yè)要跟境外通信,但是又擔(dān)心不合規(guī),因為目前對出境數(shù)據(jù)的要求是即便數(shù)據(jù)不包含機(jī)密信息,接收方經(jīng)過審查是合格的,但是出境以后的數(shù)據(jù)仍然要可控。接收方不能把數(shù)據(jù)再轉(zhuǎn)給別人,并且只能為其商業(yè)目的應(yīng)用,而不能用于其他目的。
通過可信數(shù)據(jù)空間就可以解決類似問題,數(shù)據(jù)可以加密傳輸,接收方可以解密使用。一旦違規(guī),企業(yè)可以遠(yuǎn)程更改數(shù)據(jù)密鑰,使接收方無法訪問。這樣,即使數(shù)據(jù)出境,也能實現(xiàn)“長臂管轄”,滿足跨境數(shù)據(jù)合規(guī)的要求。因此,可信數(shù)據(jù)空間既能促進(jìn)數(shù)據(jù)流通應(yīng)用,同時又能保證數(shù)據(jù)安全,避免泄露隱私,并符合跨境數(shù)據(jù)合規(guī)要求。
NBD:可信數(shù)據(jù)空間有哪些功能?
鄔賀銓:概括來講,可信數(shù)據(jù)空間有以下八個功能:
一是數(shù)據(jù)源和數(shù)據(jù)接入者的身份驗證。進(jìn)入這個空間要進(jìn)行審查,不是誰都能進(jìn)來。
二是數(shù)據(jù)目錄。這個空間里有哪些數(shù)據(jù)要有個目錄,方便查找。現(xiàn)在政府開放了很多數(shù)據(jù),實際上沒有給目錄,所以使用者是不好查找的。
三是數(shù)據(jù)脫敏處理。舉例來說就是只能讓大家知道這個小區(qū)的群體數(shù)據(jù),而不涉及具體的個人。
四是數(shù)據(jù)格式轉(zhuǎn)換。數(shù)據(jù)有文本、圖表、照片、視頻、PDF文件、Excel文件等不同類型和格式,空間里可以提供格式轉(zhuǎn)換工具,方便數(shù)據(jù)應(yīng)用。
五是提供數(shù)據(jù)開發(fā)工具。比如通過低代碼方法可實現(xiàn)僅用鼠標(biāo)拖拉軟件就可以生成一些簡單的分析,一般人是不具備這些工具的,空間里可以提供。
六是提供加密和解密計算。
七是提供數(shù)據(jù)安全軟件??尚艛?shù)據(jù)空間也要防止外部攻擊、竊取數(shù)據(jù)等。
八是有償應(yīng)用時要進(jìn)行一些結(jié)算、清算。
通過提供這些功能,可信數(shù)據(jù)空間就可以免除大企業(yè)的后顧之憂,同時能輻射到很多沒有數(shù)據(jù)的中小企業(yè),從而更好地激活數(shù)據(jù)。所以國家推動發(fā)展可信數(shù)據(jù)空間,就是要落實發(fā)揮數(shù)據(jù)作為生產(chǎn)要素的作用,真正驅(qū)動數(shù)字化轉(zhuǎn)型。
當(dāng)然,要實現(xiàn)這些目標(biāo),需要一些體制機(jī)制的配合,但可信數(shù)據(jù)空間提供了一種技術(shù)手段,可以讓大家免除不敢用、不會用和沒有數(shù)據(jù)的擔(dān)憂和難題。
NBD:剛才您提到并非任何人都能進(jìn)入可信數(shù)據(jù)空間,需要對數(shù)據(jù)進(jìn)行認(rèn)證,那是誰來對數(shù)據(jù)進(jìn)行驗證呢?
鄔賀銓:這個數(shù)據(jù)空間將來要有標(biāo)準(zhǔn),不是對數(shù)據(jù)進(jìn)行認(rèn)證,而是對數(shù)據(jù)的提供者和使用者進(jìn)行認(rèn)證,進(jìn)入空間需要登記。我們不核對數(shù)據(jù)是否準(zhǔn)確,因為沒有這個能力,比如工業(yè)上的數(shù)據(jù)怎么能核查里面哪個對哪個不對?數(shù)據(jù)源提供者需要對其提供的數(shù)據(jù)負(fù)責(zé),不能放入錯誤或虛假的數(shù)據(jù)。因此,放入的數(shù)據(jù)將有標(biāo)記,比如A公司提供的數(shù)據(jù),具體存在哪個位置會有標(biāo)記,如果使用A公司提供的數(shù)據(jù)計算結(jié)果總是錯誤,說明A公司有問題,最后可以追溯到A公司。另外,A公司提供的數(shù)據(jù),大企業(yè)要請互聯(lián)網(wǎng)企業(yè)進(jìn)來幫助計算,企業(yè)信任并與之簽訂合同的互聯(lián)網(wǎng)企業(yè)可以進(jìn)入,未簽訂合同的企業(yè)不能進(jìn)入,這是可以識別的。
NBD:所以并不是有一個專門的機(jī)構(gòu)(獨立的第三方)來進(jìn)行認(rèn)證?
鄔賀銓:不需要。企業(yè)之間的數(shù)據(jù)存在供方和需方,有協(xié)議、合約關(guān)系,沒有協(xié)議的第三方就不能進(jìn)來。當(dāng)然,政府的數(shù)據(jù)是開放給公眾的,那就不需要有接入認(rèn)證,只要登記即可使用。
NBD:可信數(shù)據(jù)空間是不是類似于一個“數(shù)據(jù)超市”,只要在超市內(nèi)的數(shù)據(jù)就是合法的、受保護(hù)的,只要花錢就能用?
鄔賀銓:不完全像超市,政府的數(shù)據(jù)面向社會公開,只要登記一下就可以用,這有點像超市,但是企業(yè)的數(shù)據(jù)不是超市,不是敞開的,誰進(jìn)來是要有協(xié)議的,必須得是跟我這個企業(yè)簽了合同的,你才能用我的數(shù)據(jù)。
NBD:以后是不是只要用這些數(shù)據(jù)就需要付費?
鄔賀銓:可能付費,也可能免費。比如一個垂直行業(yè)的企業(yè)請一個互聯(lián)網(wǎng)企業(yè)進(jìn)來,這個企業(yè)反而要給互聯(lián)網(wǎng)企業(yè)付費,因為互聯(lián)網(wǎng)企業(yè)要利用他的知識、大模型等幫垂直企業(yè)進(jìn)行計算。另一種情況,供應(yīng)鏈的上下游企業(yè),大家在一起,那是互利的,不存在付費問題。
但如果是行業(yè)內(nèi)的聯(lián)盟建設(shè)此類數(shù)據(jù)空間,把行業(yè)共性數(shù)據(jù)放進(jìn)去,則涉及收費問題。比如機(jī)械制造行業(yè)很多零部件是通用的,完全可以把相關(guān)數(shù)據(jù)都放在空間內(nèi),將來只需要對不同零部件進(jìn)行組合,相當(dāng)于“工業(yè)淘寶”,行業(yè)中的企業(yè)可以在該平臺上隨便選用。這種方式可能收費,也可能不收費。如果零部件公司愿意展示相關(guān)零部件信息,以供大家選擇,這樣可以擴(kuò)大市場,那零部件公司甚至要給平臺付費。另外,零部件公司也可能提供一些設(shè)計圖紙和軟件工具,如果行業(yè)中的其他企業(yè)要調(diào)用這些圖紙工具以簡化其設(shè)計工作量,那可能就需要付費。所以根據(jù)不同的應(yīng)用場景,收費也會有不同的模式。
NBD:《計劃》提出主要布局企業(yè)、行業(yè)、城市、個人、跨境五類可信數(shù)據(jù)空間建設(shè)和應(yīng)用推廣。這五類可信數(shù)據(jù)空間的建設(shè)有沒有優(yōu)先級?
鄔賀銓:政府應(yīng)當(dāng)帶頭。其次企業(yè)是主體,無論企業(yè)還是行業(yè),都更有利于推動經(jīng)濟(jì)發(fā)展。我不太贊同將“個人”作為一個獨立的類別,企業(yè)、行業(yè)和政府是可信數(shù)據(jù)空間的建設(shè)者,而個人不會建可信數(shù)據(jù)空間,此處提到的“個人”實際上是指專門提供個人數(shù)據(jù)的平臺,這類數(shù)據(jù)需要特別重視脫敏處理。實際上,政府的數(shù)據(jù)就包含個人數(shù)據(jù)了。
跨境數(shù)據(jù)有特殊場景,對于有跨境需求的企業(yè),他們需要進(jìn)行跨境數(shù)據(jù)處理,但需求量不會很大。很多時候,企業(yè)自建的數(shù)據(jù)平臺可能就已經(jīng)包含了跨境管理能力,因此是否有特定必要一定建立跨境可信數(shù)據(jù)空間也是值得商榷的。
NBD:政府在可信數(shù)據(jù)空間的建設(shè)中扮演什么樣的角色?
鄔賀銓:掌握公共數(shù)據(jù)資源的相關(guān)部委以及地方政府,按照國家規(guī)定,在確保國家機(jī)密、企業(yè)秘密、個人隱私的前提下,原則上能夠開放的數(shù)據(jù)都應(yīng)開放。從另一個角度,國家在政策上鼓勵和引導(dǎo)可信數(shù)據(jù)空間的建設(shè),并進(jìn)行規(guī)范管理。同時,還要督促建設(shè)可信數(shù)據(jù)空間的機(jī)構(gòu)承擔(dān)保障可信數(shù)據(jù)空間數(shù)據(jù)安全的責(zé)任。
NBD:企業(yè)參與可信數(shù)據(jù)空間建設(shè)的動力是什么?會不會增加它的成本?企業(yè)能否從建可信數(shù)據(jù)空間的過程中實現(xiàn)盈利?
鄔賀銓:我剛才提到,許多垂直行業(yè)的企業(yè)擁有數(shù)據(jù),但不會挖掘。他們現(xiàn)在需要建立可信數(shù)據(jù)空間,以吸引外部公司參與挖掘,而不是依賴可信數(shù)據(jù)空間來盈利,這是他們實現(xiàn)數(shù)字化轉(zhuǎn)型的一個重要環(huán)節(jié),數(shù)據(jù)盤活以后會直接提升企業(yè)的生產(chǎn)效率、降低成本,這些足以彌補(bǔ)企業(yè)的投資成本。至于在供應(yīng)鏈中,如果能夠在可信數(shù)據(jù)空間中實現(xiàn)零庫存或小庫存,所有參與者都能獲益,因此并不需要單純依賴可信數(shù)據(jù)空間來獲得直接的投資回報。政府建立可信數(shù)據(jù)空間是出于義務(wù),而不是直接追求回報。只有行業(yè)組織建立的可信數(shù)據(jù)空間,類似于“工業(yè)淘寶”,可以面向使用方或提供方收費,類似于阿里、京東這樣的平臺,也能運(yùn)營得很好。
NBD:所以對企業(yè)來說,并不是建可信數(shù)據(jù)空間就有一個明確的商業(yè)模式。
鄔賀銓:不是,絕大多數(shù)企業(yè)不是靠可信數(shù)據(jù)空間直接收回投資回報。除非行業(yè)的聯(lián)盟可能需要從中回本。
NBD:建設(shè)可信數(shù)據(jù)空間成本會很高嗎?
鄔賀銓:對于許多大企業(yè)來說,他們已經(jīng)擁有云,包括私有云、公有云等。實際上,可信數(shù)據(jù)空間主要涉及一些軟件、網(wǎng)絡(luò)安全能力的配套以及算力支持,在現(xiàn)有的基礎(chǔ)設(shè)施上并不需要過多的投入。小企業(yè)是建不起的,因為他們能夠投入的資源有限,并且缺乏影響力,作為供應(yīng)鏈上的小企業(yè),不可能讓所有大企業(yè)都參與到其發(fā)起的可信數(shù)據(jù)空間建設(shè)中。
NBD:有沒有一個大概可以量化的成本?
鄔賀銓:這取決于空間的規(guī)模,可信數(shù)據(jù)空間規(guī)模有大有小,如果只放入少量數(shù)據(jù)來計算,現(xiàn)有的云平臺算力就足夠了,剛起步時也沒必要非要建很大。比如垂直行業(yè)的大企業(yè)有私有云,在云平臺上就可以做,無需額外的投入。實際上很多大企業(yè)已經(jīng)自建了一些算力平臺,雖然最初不是為可信數(shù)據(jù)空間建的,但是可以支持做可信數(shù)據(jù)空間。
NBD:所以可信數(shù)據(jù)空間里面是要進(jìn)行大量的數(shù)據(jù)計算,其實是會消耗很多算力的,它消耗的算力跟大模型消耗的算力比如何?
鄔賀銓:它就是大模型。企業(yè)有這么多數(shù)據(jù),它可能會有大模型,也可能沒有,需要讓互聯(lián)網(wǎng)公司帶進(jìn)來,企業(yè)有的模型基本上是跟企業(yè)所在行業(yè)相關(guān)的模型,而互聯(lián)網(wǎng)企業(yè)帶進(jìn)來的是基礎(chǔ)大模型,比如語言大模型、視頻大模型等,這些模型企業(yè)是沒有的。帶進(jìn)來以后,用企業(yè)的數(shù)據(jù)來進(jìn)行優(yōu)化、微調(diào),所以可信數(shù)據(jù)空間就是一個大模型計算的過程,只不過吸引了外部公司來共同參與。如果企業(yè)什么都懂,那就不需要請互聯(lián)網(wǎng)公司進(jìn)來。
NBD:在行業(yè)可信數(shù)據(jù)空間方面,文件提到了科技創(chuàng)新、農(nóng)業(yè)農(nóng)村、工業(yè)、服務(wù)業(yè)等領(lǐng)域,這些領(lǐng)域可信數(shù)據(jù)空間的建設(shè)重點有哪些?
鄔賀銓:行業(yè)可信數(shù)據(jù)空間主要是由行業(yè)龍頭、行業(yè)聯(lián)盟或者行業(yè)中領(lǐng)先的研發(fā)機(jī)構(gòu)來發(fā)起建設(shè)的可信數(shù)據(jù)空間,它們能夠號召行業(yè)中供需雙方的參與。顯然現(xiàn)在有一些比較強(qiáng)勢的行業(yè)聯(lián)盟在這些領(lǐng)域中將發(fā)揮重要作用。像能源石化行業(yè),中石油、中石化等企業(yè)規(guī)模都很大,它們完全可以自行建設(shè),不需要聯(lián)合建設(shè)。而像機(jī)械制造行業(yè)通用性比較強(qiáng),制造行業(yè)本身比較分散,所以這種行業(yè)聯(lián)盟發(fā)揮作用可能更大。包括汽車行業(yè),以及目前比較熱的風(fēng)電、太陽能等產(chǎn)業(yè),這些產(chǎn)業(yè)的上下游供應(yīng)鏈很長,它們可能會率先行動。
NBD:剛才您也提到個人的可信數(shù)據(jù)空間,您怎么看個人數(shù)據(jù)在可信數(shù)據(jù)空間當(dāng)中的應(yīng)用前景?
鄔賀銓:單一個體的數(shù)據(jù)屬于隱私,但是無數(shù)個體的數(shù)據(jù)就構(gòu)成了社會數(shù)據(jù)、公共數(shù)據(jù),對國計民生具有重大影響。通過這些數(shù)據(jù),可以了解人們的需求、年齡段分布、日常消費品的消耗量等等,這些數(shù)據(jù)對市場分析等都十分有用。政府掌握的這些數(shù)據(jù),在脫敏處理后應(yīng)當(dāng)且必須公開。
我不認(rèn)為需要單獨建立一個個人數(shù)據(jù)的可信數(shù)據(jù)空間,但可以理解為它是政府建設(shè)的個人數(shù)據(jù)空間的一部分,專門提供個人數(shù)據(jù),為社會所用。
NBD:個人數(shù)據(jù)跟公共數(shù)據(jù)的關(guān)系是怎樣的?
鄔賀銓:個人數(shù)據(jù)就是公共數(shù)據(jù)。我剛才提到,脫敏后的數(shù)據(jù)不再涉及個人隱私,那就是社會數(shù)據(jù)、公共數(shù)據(jù)。個人數(shù)據(jù)是政府掌握的公共數(shù)據(jù),無數(shù)的個人數(shù)據(jù)的集合就是公共數(shù)據(jù)。
NBD:政府建這個空間對普通個人會有什么影響?
鄔賀銓:政府公開這些公共數(shù)據(jù)與城市居民的生活密切相關(guān)。比如你想買房子,不同區(qū)的房價差異如何、這個城市不同季節(jié)什么時間日出日落、不同樓層的采光情況、學(xué)區(qū)房的情況、小學(xué)教育質(zhì)量怎樣等等,這些信息過去很難查,未來網(wǎng)上一分析就有了,可以有效服務(wù)于個人決策。
NBD:普通人用這些數(shù)據(jù)是免費的嗎?
鄔賀銓:政府的公共數(shù)據(jù)都是免費的。即便個人不會直接利用這些信息來決策,公共服務(wù)機(jī)構(gòu)也總會充分利用這些信息。比如發(fā)現(xiàn)某個地區(qū)不能做到15分鐘生活供應(yīng),那就可以盡快建一個生活超市;分析某條城市公交線路什么時段乘客最多或最少,哪個站點上下站乘客多,交管部門就可以優(yōu)化公交線路等。
NBD:在建設(shè)可信數(shù)據(jù)空間的過程中,會帶動哪些產(chǎn)業(yè)的發(fā)展?
鄔賀銓:建設(shè)可信數(shù)據(jù)空間直接服務(wù)于整個經(jīng)濟(jì)社會,同時也會帶動算力、算法、網(wǎng)絡(luò)安全等相關(guān)產(chǎn)業(yè)的發(fā)展。
NBD:文件里面也提出要支持建設(shè)可信數(shù)據(jù)空間的共性服務(wù)體系,降低可信數(shù)據(jù)空間建設(shè)和使用門檻,這個應(yīng)該怎么理解?
鄔賀銓:數(shù)據(jù)格式轉(zhuǎn)換、數(shù)據(jù)開發(fā)軟件提供、數(shù)據(jù)安全技術(shù)、數(shù)據(jù)接入驗證等都是共性技術(shù),任何數(shù)據(jù)空間都需要這些技術(shù)。如果有第三方提供這些技術(shù),其他數(shù)據(jù)空間可以直接應(yīng)用。
NBD:可信數(shù)據(jù)空間跟現(xiàn)在社會上已經(jīng)有的數(shù)據(jù)交易所是怎樣的關(guān)系?
鄔賀銓:可信數(shù)據(jù)空間里可以提供數(shù)據(jù)交易功能,因為它也可以進(jìn)行結(jié)算、清算。但并不意味著可信數(shù)據(jù)空間一定要把交易功能加進(jìn)去。如果我是一個垂直行業(yè)企業(yè),我建立的可信數(shù)據(jù)空間僅供自己使用,就不需要交易功能。
另外,也并不意味著有了可信數(shù)據(jù)空間,數(shù)據(jù)交易所就沒用了。有些人只是單純進(jìn)行交易,不需要計算,他只需要購買別人的數(shù)據(jù),或者賣出自己的數(shù)據(jù),不需要對數(shù)據(jù)進(jìn)行開發(fā),他們自己有能力開發(fā),不需要到可信數(shù)據(jù)空間去開發(fā)。
NBD:文件提出,到2028年,基本建成廣泛互聯(lián)、資源集聚、生態(tài)繁榮、價值共創(chuàng)、治理有序的可信數(shù)據(jù)空間網(wǎng)絡(luò),能否請您設(shè)想一下可信數(shù)據(jù)空間網(wǎng)絡(luò)成熟后的圖景是怎樣的?
鄔賀銓:“網(wǎng)絡(luò)”這個詞在這里并不一定意味著要將所有可信數(shù)據(jù)空間連接起來,因為比如不同企業(yè)建的可信數(shù)據(jù)空間,它們各自管理,連接的必要性并不大。例如,中石油和中石化可以各自建立可信數(shù)據(jù)空間,在各自的空間內(nèi)跟互聯(lián)網(wǎng)企業(yè)合作,它們是競爭對手,沒有必要連接。不同行業(yè)的可信數(shù)據(jù)空間,如機(jī)械零件和生物醫(yī)藥,也沒有必要連接。因此,沒有必要強(qiáng)調(diào)它們之間的互聯(lián),而是形成一個國家的可信數(shù)據(jù)空間體系。
NBD:目前在很多領(lǐng)域中有大量數(shù)據(jù),但是并沒有得到很好的應(yīng)用,比如醫(yī)療健康領(lǐng)域、金融領(lǐng)域、電信領(lǐng)域等,想請您具體談?wù)勥@些領(lǐng)域,有了可信數(shù)據(jù)空間后,數(shù)據(jù)可以怎么用、會對行業(yè)以及普通人的生活帶來怎樣的改變?
鄔賀銓:在醫(yī)療健康領(lǐng)域,每個醫(yī)院掌握著大量病患的化驗數(shù)據(jù)、檢查數(shù)據(jù)等高度隱私數(shù)據(jù),所以很多醫(yī)院一是擔(dān)心隱私泄露,二是有些醫(yī)院也需要利用這些數(shù)據(jù)來檢查、診斷,這些數(shù)據(jù)一定意義上也是醫(yī)院的競爭力,所以他不愿意無償?shù)啬贸鰜砉蚕?。但是有了可信?shù)據(jù)空間,就為醫(yī)院之間數(shù)據(jù)的開放共享提供了安全保障。所以如果有必要,有些醫(yī)院雖然有數(shù)據(jù),但是跟別人共享,也可以提高自身的醫(yī)療診斷能力。從這個角度講,數(shù)據(jù)共享不但可以幫助醫(yī)院更好地從事醫(yī)學(xué)研究,還可以使患者得到跨醫(yī)療機(jī)構(gòu)的會診,減少病患的重復(fù)檢查,為病患帶來便利。比如傳染病的醫(yī)院數(shù)據(jù)能夠共享,那當(dāng)然對掌控全市甚至全國的醫(yī)療衛(wèi)生狀況都有好處,對疫苗研發(fā)等都有好處。
但是需要注意的是,并非有了可信數(shù)據(jù)空間,所有醫(yī)療機(jī)構(gòu)都會愿意把數(shù)據(jù)拿到可信數(shù)據(jù)空間來共享,因為畢竟這也是醫(yī)院的競爭力,不是靠行政命令就可以讓醫(yī)院之間來共享數(shù)據(jù)。所以從這個意義上說,可信數(shù)據(jù)空間只是一個技術(shù)手段,它不能解決體制機(jī)制方面的問題。
另外,金融機(jī)構(gòu)擁有大量客戶數(shù)據(jù),同一個客戶可能在不同銀行貸款,以往各銀行之間難以溝通客戶在其他銀行的還款能力、誠信記錄等信息,現(xiàn)在通過可信數(shù)據(jù)空間,金融機(jī)構(gòu)之間可以共享客戶的誠信記錄。這里并不是共享客戶在銀行存貸的具體金額等信息,而是共享銀行對該客戶誠信程度、風(fēng)險承受水平的判斷信息,這將有助于合法客戶更便捷地獲得貸款。
但是有幾點需要注意,不要對可信數(shù)據(jù)空間有一些誤解。
第一,可信數(shù)據(jù)空間自身并不擁有數(shù)據(jù),只是一個平臺,數(shù)據(jù)需由數(shù)據(jù)提供方提供。
第二,可信數(shù)據(jù)空間本身不具有判定數(shù)據(jù)來源合法性、數(shù)據(jù)使用者合法性以及數(shù)據(jù)確權(quán)的能力,同樣不具有數(shù)據(jù)定價能力,這些都不是技術(shù)本身所能定的。某個數(shù)據(jù)提供方把數(shù)據(jù)放到可信數(shù)據(jù)空間,可信數(shù)據(jù)空間并不因此而認(rèn)可你擁有這個權(quán)。
第三,可信數(shù)據(jù)空間雖然是個開放的平臺,但不是自由市場,數(shù)據(jù)提供方和使用方之間需要有合約關(guān)系,它并非一個簡單的“淘寶”,必須是一一協(xié)商,不能隨意使用數(shù)據(jù)??尚艛?shù)據(jù)空間中有來自A的數(shù)據(jù),要想使用,必須跟A事先協(xié)商;而且能使用A的數(shù)據(jù),不意味著能使用B的數(shù)據(jù),要使用B的數(shù)據(jù),還需要跟B協(xié)商。
第四,可信數(shù)據(jù)空間的數(shù)據(jù)提供方和使用方都需要遵守數(shù)據(jù)安全和隱私保護(hù)法規(guī)。雖然可信數(shù)據(jù)空間會提供一些技術(shù)手段來保障數(shù)據(jù)安全,但是首要責(zé)任仍在于數(shù)據(jù)提供方和使用方。
第五,一些企業(yè)和機(jī)構(gòu),比如醫(yī)療機(jī)構(gòu)、金融機(jī)構(gòu)、電信運(yùn)營商等掌握了大量個人數(shù)據(jù),即便他們采取了隱私保護(hù)技術(shù),這些數(shù)據(jù)原則上也不屬于這些機(jī)構(gòu)。但是他們收集了,就有保護(hù)的責(zé)任。所以理論上這些個人數(shù)據(jù)在隱私保護(hù)以后應(yīng)該可以開放,但并不強(qiáng)制開放。這些數(shù)據(jù)是否要放到可信數(shù)據(jù)空間,一方面由數(shù)據(jù)提供方來決定,數(shù)據(jù)提供方與使用方達(dá)成協(xié)議,另一方面還需要接受備案管理,向政府主管部門如數(shù)據(jù)局、網(wǎng)信辦等備案,不能隨意將數(shù)據(jù)放入可信數(shù)據(jù)空間。比如醫(yī)療數(shù)據(jù),除非兩個醫(yī)院之間達(dá)成協(xié)議,如果沒有跟哪個醫(yī)院商量好,你自己把數(shù)據(jù)拿到上面去,也不行,也要通過備案。
運(yùn)營商掌握了用戶手機(jī)定位、個人上網(wǎng)行為數(shù)據(jù)、社交關(guān)系數(shù)據(jù)等高度隱私數(shù)據(jù),這也是指運(yùn)營商的數(shù)據(jù)庫里有這些數(shù)據(jù),但是對運(yùn)營商內(nèi)部員工來說也是絕對保密的。即便是完成備案,也不能隨意使用,除非是出于國家安全、法院/檢察院查案等特殊需要。
可信數(shù)據(jù)空間并非顛覆性技術(shù),而是一種技術(shù)手段。它需要與制度、法規(guī)、政策等配套措施相結(jié)合,共同推動數(shù)據(jù)的合理利用。數(shù)據(jù)確權(quán)等基礎(chǔ)制度的確定需要實踐探索,不能急于求成,過早地確定也會妨礙數(shù)據(jù)的利用。
如需轉(zhuǎn)載請與《每日經(jīng)濟(jì)新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP