每日經(jīng)濟(jì)新聞 2022-09-23 18:52:51
在交大安泰EMBA20周年暨安泰視界年度峰會(huì)上,中國(guó)科學(xué)院院士、上海交通大學(xué)化學(xué)化工學(xué)院院長(zhǎng)樊春海給我們講述了一個(gè)關(guān)于用DNA存儲(chǔ)海量數(shù)據(jù)的神奇故事,描繪了一個(gè)生物技術(shù)與信息技術(shù)交融發(fā)展的美好未來(lái)。
每經(jīng)記者 梁宏亮 每經(jīng)編輯 冷雪婷
你還記得嗎?
1994年,比爾蓋茨坐在33萬(wàn)紙上,對(duì)全世界發(fā)布,我們現(xiàn)在有了“光盤”。一張光盤能夠記錄的內(nèi)容,也就33萬(wàn)張紙,這在當(dāng)時(shí)來(lái)講應(yīng)該是非常具有震撼性的廣告效應(yīng),也就是我們電子存儲(chǔ)是具有如此強(qiáng)大的能力。
你發(fā)現(xiàn)了嗎?
身處在信息爆炸的時(shí)代,人類每時(shí)每刻都在產(chǎn)生著海量數(shù)據(jù)信息。為了存儲(chǔ)它們,我們現(xiàn)在到處都在建設(shè)數(shù)據(jù)中心。這些數(shù)據(jù)中心要在靠近山邊、水邊的地方,占用了大量的土地和能源。
你會(huì)相信嗎?
未來(lái)有一天,我們有可能拿著一管DNA說(shuō):“看,我們這里面存儲(chǔ)著全世界的所有數(shù)據(jù)!”
交大安泰EMBA20周年之際,每日經(jīng)濟(jì)新聞聯(lián)合上海交通大學(xué)安泰經(jīng)濟(jì)與管理學(xué)院,聯(lián)合推出“我的商學(xué)之路·我的遠(yuǎn)見”系列策劃。
在交大安泰EMBA20周年暨安泰視界年度峰會(huì)上,中國(guó)科學(xué)院院士、上海交通大學(xué)化學(xué)化工學(xué)院院長(zhǎng)樊春海給我們講述了一個(gè)關(guān)于用DNA存儲(chǔ)海量數(shù)據(jù)的神奇故事,描繪了一個(gè)生物技術(shù)與信息技術(shù)交融發(fā)展的美好未來(lái)。
數(shù)據(jù)存儲(chǔ)需要一場(chǎng)“綠色革命”
從原始人的結(jié)繩記事,到造紙術(shù),再到電子信息時(shí)代的數(shù)據(jù)存儲(chǔ),信息存儲(chǔ)方式的變革,從一個(gè)角度反映了人類社會(huì)的文明發(fā)展史。
信息時(shí)代來(lái)臨時(shí),我們?cè)嘈牛弘娮有畔?lái)存儲(chǔ),似乎解決了所有存儲(chǔ)問(wèn)題。然而,當(dāng)我們真正進(jìn)入一個(gè)數(shù)據(jù)爆炸的時(shí)代,我們逐漸發(fā)現(xiàn):僅憑電子信息來(lái)存儲(chǔ)數(shù)據(jù),滿足不了我們的需求了。
樊春海院士告訴了我們一組數(shù)據(jù):2020年全世界的數(shù)據(jù)是44個(gè)ZB(440萬(wàn)億億字節(jié))。“把這些數(shù)據(jù)存下來(lái),光耗的電就是一個(gè)三峽大壩所產(chǎn)生的電。這個(gè)數(shù)據(jù)還在不斷增長(zhǎng),到2025年預(yù)計(jì)是175ZB,而且里面80%-90%是很少被調(diào)用的冷數(shù)據(jù)。”
這些所謂冷數(shù)據(jù),就是像圖書館的圖書一樣,我們需要把它存在那兒,不能讓它毀滅??墒?,日常工作生活中我們又很少去用它,一年可能都用不上一次。存儲(chǔ)它們不僅需要耗能、占地,而且由于數(shù)據(jù)電子存儲(chǔ)的壽命只有十年到幾十年,時(shí)間到了就需要重新更新迭代一次。
所以,在這種情境下,信息存儲(chǔ)越來(lái)越成為一個(gè)重大的國(guó)家戰(zhàn)略級(jí)的需求。不僅存儲(chǔ)消耗能源巨大,傳輸也越來(lái)越成為一個(gè)問(wèn)題。
“1969年阿波羅登月計(jì)劃的時(shí)候,當(dāng)時(shí)存儲(chǔ)介質(zhì)是紙,也就是1人高這么多的數(shù)據(jù),”樊春海院士舉例對(duì)比:“到2019年,我們可能都知道人類第一次觀察到了黑洞,把黑洞的圖片傳回來(lái),存儲(chǔ)這些數(shù)據(jù)的硬盤加起來(lái)有半噸重,沒(méi)有辦法通過(guò)網(wǎng)絡(luò)來(lái)傳輸,只能通過(guò)飛機(jī)來(lái)運(yùn)輸。”
也正因如此,現(xiàn)有基于硅的存儲(chǔ)方式,不僅存在高成本、高能耗、壽命短的問(wèn)題,相對(duì)來(lái)說(shuō)遷移起來(lái)也很麻煩?,F(xiàn)有的數(shù)據(jù)存儲(chǔ)架構(gòu),越來(lái)越難以滿足數(shù)據(jù)日益爆發(fā)性增長(zhǎng)的趨勢(shì)。這時(shí)候,迫切需要一場(chǎng)“綠色革命”。
基因測(cè)序從理想變?yōu)楝F(xiàn)實(shí)
在人類不斷生產(chǎn)出海量信息的同時(shí),我們對(duì)于生命的理解也更加深刻。在過(guò)往幾十年里,人類探索生命奧秘最重要突破之一,就是對(duì)DNA的更深入理解。
“DNA就是我們生命的密碼。我們知道DNA由4種堿基組成,遵循非常簡(jiǎn)單的配對(duì)規(guī)則,我們有時(shí)候會(huì)稱為叫華生-克里克配對(duì)原則。就是4個(gè)堿基分成兩組,A一定是跟T配對(duì),G一定是跟C配對(duì)。”
樊春海院士這樣科普到:“在我們細(xì)胞里,每時(shí)每刻都有這樣一個(gè)的過(guò)程:DNA雙列進(jìn)入到聚合酶的蛋白質(zhì)的孔洞里,就像一個(gè)復(fù)印機(jī)一樣,可以說(shuō)是一個(gè)最精確的自然界產(chǎn)生的納米復(fù)印機(jī)。當(dāng)DNA復(fù)制達(dá)到一定量后,細(xì)胞開始分裂,一個(gè)細(xì)胞分成兩個(gè)細(xì)胞,兩個(gè)細(xì)胞分成四個(gè)細(xì)胞,逐漸變成組織、器官,到植物、動(dòng)物、人……這就是我們所說(shuō)的生物學(xué)遺傳分子機(jī)制。”
大家對(duì)上世紀(jì)末的人類基因組計(jì)劃耳熟能詳。人類基因組計(jì)劃的目的,是把我們的遺傳物質(zhì)DNA序列測(cè)定下來(lái)。什么叫測(cè)定序列?就是把ATGC4個(gè)字母排列組合給確定下來(lái)。
經(jīng)過(guò)幾代全世界科學(xué)家的努力,這終于變成了一個(gè)現(xiàn)實(shí)。更重要的是,當(dāng)時(shí)測(cè)一個(gè)人的基因,要花幾十億美元。而現(xiàn)在對(duì)于全世界最強(qiáng)的測(cè)序公司來(lái)說(shuō),只要一天時(shí)間,花費(fèi)一兩千塊錢的成本,就可以把一個(gè)人的基因檢測(cè)出來(lái)?,F(xiàn)在,全世界基因測(cè)序的市場(chǎng)規(guī)模已經(jīng)達(dá)到100多億美元。
不僅如此,我們還可以把古人類、古生物的基因組序列測(cè)出來(lái)。比如我們通過(guò)檢測(cè)70萬(wàn)年前野馬化石的基因組信息,了解70萬(wàn)年前的野馬有哪些生物學(xué)特性。
DNA如何存儲(chǔ)數(shù)據(jù)信息?
虛擬世界、計(jì)算世界或者說(shuō)現(xiàn)在的元宇宙,它的背后是兩個(gè)數(shù)字——1和0在跳動(dòng)。而在我們生物學(xué)生命的世界里,實(shí)際上背后是ATGC這4個(gè)字母在跳動(dòng)。人類基因組計(jì)劃所測(cè)出來(lái)的一本“天書”,實(shí)際上就是4個(gè)字母的排列。
從這個(gè)意義上講,或者說(shuō)我們從信息論的角度來(lái)看,實(shí)際上生命世界跟虛擬世界,可以說(shuō)是等價(jià)的,無(wú)非一個(gè)是二進(jìn)制,一個(gè)是四進(jìn)制。也就是說(shuō),DNA分子就是這樣一些由ATGC4個(gè)字母組成的,可以編碼的分子信息材料。
既然DNA里面的ATGC是四進(jìn)制,計(jì)算機(jī)里面就是二進(jìn)制1和0,兩者在信息上等價(jià)的。那么,是不是可以用DNA來(lái)存儲(chǔ)計(jì)算機(jī)的信息呢?
樊春海院士介紹到,DNA存儲(chǔ)無(wú)非就是把數(shù)據(jù)1和0的二進(jìn)制變成ATGC四進(jìn)制的編碼過(guò)程。通過(guò)一系列的生化反應(yīng),把數(shù)據(jù)給存下來(lái)、讀出來(lái),再通過(guò)數(shù)據(jù)解碼,變成1和0,跟計(jì)算機(jī)系統(tǒng)對(duì)接起來(lái)。
“1988年,有科學(xué)家證明DNA可以用來(lái)存儲(chǔ)信息,但是在當(dāng)時(shí)并沒(méi)有引起很多人的關(guān)注,后面有一系列的進(jìn)展,包括哈佛大學(xué)的研究表明DNA可以用來(lái)存儲(chǔ)一本書,在科學(xué)界都有一定的影響,但是沒(méi)有引起社會(huì)上的震動(dòng)。”
樊春海院士談到,因?yàn)樵诋?dāng)時(shí),電子存儲(chǔ)是足夠用的,大家并不需要這樣一個(gè)聽起來(lái)很突破性、很怪異的方法來(lái)存儲(chǔ)。但隨著信息爆炸時(shí)代的來(lái)臨,電子存儲(chǔ)的瓶頸越來(lái)越明顯。“于是,用DNA來(lái)存儲(chǔ),這件聽起來(lái)比較怪的事情,實(shí)際上已經(jīng)受到了國(guó)內(nèi)外的普遍重視。”
據(jù)樊春海院士介紹,在科學(xué)雜志《Science》提到的未來(lái)人類的125個(gè)科學(xué)問(wèn)題中,關(guān)于信息科學(xué)里面4個(gè)問(wèn)題其中之一,就是DNA能否用作信息存儲(chǔ)的介質(zhì)。而在我們國(guó)家的“十四五”科技規(guī)劃,就已經(jīng)把它列入需要加快布局的幾個(gè)前沿技術(shù)之一。
IT與BT交融的世紀(jì)來(lái)臨
那么,用DNA來(lái)存儲(chǔ)數(shù)據(jù),將生物材料用到信息技術(shù)里,究竟會(huì)帶來(lái)怎樣的變革?
“推算一下可以知道,通過(guò)50克DNA,可以存下1千萬(wàn)盤硬盤的信息??梢酝ㄟ^(guò)DNA存儲(chǔ),把數(shù)據(jù)存儲(chǔ)的容量極限提升7個(gè)數(shù)量級(jí),”樊春海院士列了一組數(shù)據(jù):“這樣推算下來(lái),全世界440萬(wàn)億的字節(jié),只要200公斤DNA就可以存下來(lái),這就解決了大問(wèn)題。”
也就是說(shuō),DNA存儲(chǔ)帶來(lái)了一種密度高、能耗非常低、壽命非常長(zhǎng)的存儲(chǔ)模式。壽命能夠長(zhǎng)到什么程度?“類似于剛才所說(shuō)的70萬(wàn)年前的野馬化石DNA信息,不僅可以存百年、萬(wàn)年,甚至有可能存到幾十萬(wàn)年、百萬(wàn)年。相對(duì)于硅基電子存儲(chǔ)只能存幾十年來(lái)說(shuō),有著巨大的進(jìn)步。”他說(shuō)。
“2019年我們國(guó)家信息存儲(chǔ)的市值將近5000億元,預(yù)計(jì)到2025年,我們國(guó)家將成為全世界最大的數(shù)據(jù)城。”在樊春海院士看來(lái),來(lái)自醫(yī)療、金融、互聯(lián)網(wǎng)等等各行各業(yè)大量的數(shù)據(jù),都有可能成為供DNA來(lái)存儲(chǔ)的一些需求。
“DNA信息存儲(chǔ)應(yīng)該說(shuō)目前還在起步階段。”據(jù)他預(yù)測(cè),預(yù)期到2024年,將有30%的數(shù)字業(yè)務(wù)有可能是用DNA存儲(chǔ)來(lái)實(shí)現(xiàn),從而解決現(xiàn)在指數(shù)級(jí)增長(zhǎng)的數(shù)據(jù)存儲(chǔ)問(wèn)題。“我們上海交通大學(xué)成立了DNA存儲(chǔ)研究中心,希望在這個(gè)過(guò)程當(dāng)中,能夠發(fā)揮獨(dú)特的作用。”
據(jù)樊春海院士介紹,DNA數(shù)據(jù)存儲(chǔ)是典型的信息技術(shù)和生物技術(shù)交融的產(chǎn)業(yè),其中不僅包含有信息、大數(shù)據(jù)和人工智能技術(shù),也包括合成生物學(xué)、基因測(cè)序等生物學(xué)技術(shù)。只有技術(shù)的交融,才有可能產(chǎn)生這樣一個(gè)偉大的事情。
“在上個(gè)世紀(jì),我們經(jīng)常會(huì)聽到這樣的爭(zhēng)論——21世紀(jì)到底是IT(信息技術(shù))的世紀(jì)還是BT(生物技術(shù))的世紀(jì)?現(xiàn)在的證據(jù)越來(lái)越多證明,21世紀(jì)可能是生物技術(shù)和信息技術(shù)交叉融合的世紀(jì)。”樊春海院士說(shuō)。
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP