們聽說過超級計算機、量子計算機,但是,有一種特殊的計算機同樣是未來計算機發展的一大方向,那就是DNA計算機。
DNA計算機是一種生物形式的計算機。在DNA計算機內,計算不再是物理性質的符號變換,而是化學性質的符號變換,傳統意義上的“加”、“減”操作也變成了化學性質的切割和粘貼、插入和刪除。
許多年來,有一家科技巨頭一直對DNA分子計算機的前景表現出濃厚的興趣,那就是微軟。
就在 2016 年,微軟的研究者們就創下 DNA 數據存儲量的記錄(該記錄今年被哈佛團隊打破)。如今,微軟又把研究目標轉向 DNA 分子計算機的另一個重要分支——數據運算。
微軟與華盛頓大學的研究小組聯手找到了大幅提升 DNA 分子運算的方法,這將加快人們利用DNA計算機對體內基因突變或癌癥檢測和監控的腳步。經過實驗證明,新型的 DNA 計算機僅用了七分鐘就完成運行包含3個輸入鏈的與門,而之前的設備需要四個小時完成同樣的工作量。
研究成果發布在 7 月 24 日的《自然-納米技術》(Nature Nanotechnology)上。
圖丨本次論文標題
實際上,DNA 計算機由 DNA 分子電路組成,“輸入”的是細胞質中的RNA、蛋白質以及其他化學物質,“輸出”的則是很容易辨別的分子信號。與傳統的計算機相同,DNA分子電路上也有“與”“或”“非”邏輯門(邏輯門是集成電路的基本組件)。
圖丨計算機中的各種邏輯門
該組研究人員在論文中稱,他們利用 DNA 折紙術形成 DNA 發卡結構(hairpin)的空間排列組織,以構建排列DNA分子邏輯門和信號傳輸線。所謂發卡結構,就是如果非子鏈和母鏈的兩條DNA鏈堿基互補配對,就會出現有部分區域無法配對而突起的部位,也就是我們所說的發卡結構。它讓DNA分子間的排列更加有序,更加模塊化,同時每個DNA分子也相對“固定”了下來,就像固定的分子電路板一樣。
圖丨DNA多米諾電路設計過程
與平日里的計算機不同,這些納米層面上的計算機電路是由人造 DNA 構成的,被稱為“DNA 多米諾電路”——由不同的 DNA 鏈組成。這種 DNA 分子電路在工作過程中,電路上相鄰的 DNA 鏈通過鏈上的發卡結構部位連接起來,并且一個一個接著相互反應作用下去,就像多米諾骨牌倒塌一樣,直到反應完成,得到目標DNA鏈。
圖丨信息在發卡DNA鏈間的傳輸
其結果顯示,無論是在不同長度還是不同方向的傳輸線上,這種結構的DNA分子電路都具備良好的信號傳播能力。另外,邏輯門通過模塊化的方式可以組合成常規的電路模式,同樣也大大提高了DNA分子間的信息傳輸速度和穩定性。
圖丨微軟公司生物計算組組長Andrew Phillips
微軟公司生物計算組組長 Andrew Phillips 在采訪中對研究細節進行了進一步解釋,“在一個設備中,組成分子在空間上被緊密的排列在一起,而對于我們的研究來說,作為組成分子的DNA分子鏈通過折紙技術被相對固定在整個系統的空間結構上,看起來就像分子電路板。”
這次的研究成果與過去的DNA計算機有很大的不同。之前的大多數DNA計算機是把DNA鏈溶解于化學溶液中——這么做的缺點是,DNA分子可以在化學液中隨意游走,容易產生連接或者發生反應,因此影響工作效率。
Phillips 介紹了新型 DNA 分子計算機的改進:“而對于我們來說,構成設備的 DNA 分子被緊密的排列在一起,同時,它們的位置也被 DNA 分子電路板所固定——這樣一來,它們會首先與相鄰的 DNA 分子反應,而不是隨意游走到其他地方與其他位置的 DNA 分子接觸。”
“這種方法有效的減少了 DNA 分子間的相互影響。盡管我們的設備還依賴擴散原理來運作,但由于大部分分子都在 DNA 空間結構上被固定,四處游走的是傳遞信息的燃料鏈,運行速度還是比原來大大提高。”
如此一來,這些設備會有很高的伸縮性,因為新型的 DNA 分子計算機可以進行自組裝,也就是說分子可以自我組織排布。對此,Phillips表示, “DNA分子鏈會在DNA分子電路板上結為一個整體,而我們會利用它的自組裝能力來校準DNA分子的位置。”
對研究者們來說,下一步的研究是如何擴展DNA分子電路板的大小,但這需要更先進的DNA折紙技術。
圖 | DNA之所以可以按需求被折疊、粘貼,還是要歸功于它獨特的雙螺旋結構:兩條平行、反向的單鏈之間按照精密的堿基互補原則相連接,A與T,G與C,就像一把鑰匙配一把鎖,具有唯一性和高度特異性(A為腺嘌呤,T為胸腺嘧啶,G為鳥嘌呤,C為胞嘧啶)。這些堿基的化學組成使得設計好ATGC排序的兩條DNA單鏈,能在茫茫鏈海中找到彼此,緊緊結合,最終組成研究人員想要的形狀。
Phillips還表示,“我們還準備把新型設備與疾病的標志物(如RNA)等生物標記聯系起來,這樣一來,計算機邏輯可以被用于精確診斷人體內的病毒性疾病和癌癥。起初是從血液中檢測,但隨著科技的發展,我們將實現從任意活細胞中檢測疾病的設想。”
以編碼的DNA序列為運算對象建立的DNA計算機,具有實時探測和監控基因突變等細胞內一切活動的特征信息,確定癌細胞等病變細胞等功能 。未來,科學家更是希望,利用DNA計算邏輯的運算判斷能力開發出“能檢測”、“會思考”的智能DNA計算機設備,使得開發個性化的“智能藥物”將成為現實。
對此,基因編輯領域學者、斯坦福大學生物工程系和化學與系統生物學系助理教授亓磊近期也表示,基因編輯有望讓人體成為一臺基因可被讀取、預測和改寫的“DNA計算機”,它不僅能夠充當監控設備,發現潛在的致病變化,還可以在人體內合成所需的藥物,治療癌癥、心臟病、動脈硬化等各種疑難病癥,甚至在恢復盲人視覺方面也將大顯身手。
盡管微軟的此次成果為DNA 計算機邁出了很大一步,但目前 DNA 計算機仍然處于非常早期的研究階段。由于受目前生物技術水平的限制,DNA計算過程中,前期DNA分子鏈的創造和后期DNA分子鏈的挑選,要耗費相當大的工作量。
比如,阿德勒曼的“試管電腦”在幾秒鐘內就得出結果,但是他卻花掉數周的時間去挑選正確的結果。另外,在數學領域中著名的旅行推銷員問題(TSP問題)中,如果實驗中城市數目增加到200個,那么計算所需的DNA重量將會超過地球的重量。而且數以億計的DNA分子非常復雜,在反應過程中很容易發生變質和損傷,甚至試管壁吸附殘留都可能發生致命錯誤。
因此,DNA計算機真正進入現實生活尚需時日,我們距離建造一臺成熟的DNA計算機也還有很長的路要走。
來程序員拿試管“寫”代碼?
如今,無論在生活還是在工作中,我們都離不開計算機的幫忙。然而,隨著大數據時代的到來,目前電子計算的并行運算速度和存儲能力面臨發展瓶頸,科學家開始尋找新的計算媒介。
近日,加州理工學院的科學家研發出可廣泛編程的DNA計算機,其有望完成多重計算任務,相關成果刊登在《自然》雜志上。
那么,DNA計算機的原理是什么?與傳統的電子計算機相比它有哪些優勢?科技日報記者帶著這些問題,采訪了相關專家。
電子芯片發展遭遇物理極限
在介紹“大神”DNA計算機前,我們要先講講它的“前輩”——電子計算機。
別看電子計算機能為我們解決很多難題,但對于一些難度較大的數學問題,它也束手無策。例如,哈密爾敦路徑問題,即假定存在多座城市,計算機要規劃出一條經每座城市且不重復的最短路線。當城市數量少時,電子計算機或許能在短時間內給出答案,但當城市數量多至100個時,電子計算機就會“忙不過來”,要找出這條路線或許需要數百年。
在生活中,我們或許很少會遇到這類“燒腦”難題,但在大數據時代,由于數據存儲量的激增,大體量計算任務也會隨之增多。
“如今,傳統電子計算機的算力逐漸接近‘天花板’,未來可能無法滿足巨大的計算需求。” 廈門大學信息科學與技術學院教授劉向榮介紹道,為了提高計算機的運算速度,其內部電路的集成度會越來越高,芯片上的晶體管也會愈發密集。目前管道之間的距離約為10納米,該距離一旦小于1納米,就會出現問題。比如,電子在運動過程中將穿過晶體管壁,“亂成一鍋粥”,無法再形成穩定有序的電路,致使計算無法正常進行。
“按照摩爾定律的說法,集成電路上可容納的元器件的數目每隔約18到24個月便會增加一倍。”劉向榮說。
不過隨著芯片技術的不斷發展,摩爾定律也逐漸遇到了物理法則的限制。目前,晶體管的體積已達到納米級別,繼續縮小的可能性正在變小,摩爾定律所預言的發展軌跡似乎已再難延續。
于是,部分科學家開始尋找能力更強大的、可突破目前電子計算機瓶頸的下一代計算機。
利用生化反應在液體里進行計算
科學家將目光投向了生物領域,在那里尋找“后補選手”。
1994年,圖靈獎獲得者、美國科學家阿德拉曼提出基于生物化學反應機理的DNA計算模型,推開了DNA計算的大門。
DNA,即脫氧核糖核酸,是具有雙螺旋結構的有機化合物。那么,染色體中的DNA是怎么完成計算任務的?
“DNA計算是以DNA和相關生物酶為基本材料,利用某些生化反應進行計算的一種新型的分子生物計算方法。”北京大學信息科學技術學院副研究員張成在接受科技日報記者采訪時表示,它主要是利用DNA分子特有的雙螺旋結構和堿基互補配對原則進行計算。
其具體的計算步驟為,首先工作人員對待解決的問題進行編碼,即將運算對象編碼成DNA分子鏈(單鏈或雙鏈);其次是將編碼后的DNA分子鏈混入生物酶溶液中,生成各種數據池;然后在生物酶的作用下,按照一定規則將解決問題的過程映射成DNA分子鏈的可控生化反應的過程;最后,利用分子生物技術,如聚合酶鏈式反應等,得到最終的運算結果。
“與電子計算的操作不同,DNA計算屬于‘濕實驗’,即大部分運算都在液體里進行。”張成告訴科技日報記者,在DNA計算環境下,要想讀取數據,可不像電子計算機這么方便,看一眼電子屏幕就成了,而是需要通過凝膠電泳、熒光成像、原子力顯微鏡、透射電鏡等生物分子檢測技術獲得計算結果。
存儲力和算力遠超傳統方式
張成介紹道,DNA計算的最大優勢在于其高并行性,即DNA的每條單鏈都可被看成是一臺計算設備,其內部海量的鏈條則可被看成一個“機房”,這就相當于成百上千臺計算機在同時進行運算。
這種高并行性極大地提升了運算速度。舉例來說,若想從億萬人中找出一個手拿釘子的人,傳統的電子計算機往往要一個一個篩,直到檢索出目標;而DNA計算模式,則可并行對1018個人同時進行檢測,其計算速度相當可觀。“高并行性讓DNA計算具備了進行大規模計算的能力,可用于專用計算。”劉向榮表示。
北京大學信息科學技術學院教授許進曾撰文表示,一臺DNA計算機在一周的運算量或相當于所有電子計算機問世以來的總運算量。
“除具有高并行性外,DNA分子還具有海量存儲能力,這也是DNA計算的另一優勢。”張成指出,信息時代的數據量呈指數級增長,電子計算機芯片等元器件的集成能力愈發接近瓶頸,亟待開發新的存儲媒介。
DNA作為信息的載體,其貯存容量巨大。1立方米的DNA溶液可存儲1萬億億個二進制數據,遠超當前全球所有電子計算機的總儲存量。
近年來,不僅很多科學家熱衷于研究DNA存儲,一些企業也將目光投向這一領域。微軟研究院計劃于2020年前將DNA存儲系統投入到數據中心中使用,華為戰略研究院也將DNA存儲納入未來研發計劃中。
此外,許進還提到,DNA計算機所消耗的能量只占一臺電子計算機完成同樣計算任務所消耗能量的十億分之一。
DNA計算技術落地或需20年
“高大上”的DNA計算,能被用在哪兒呢?
“在信息技術領域中,基于DNA計算的強大運算能力,其有望被應用于密碼破譯或超大規模信息處理等業務中。”劉向榮表示,現有的密碼體系之所以安全、可靠,并非在于其無法被破譯,而是因為破譯時間過長,可能需要上百年。而DNA計算則有望將同一密碼的破譯時間縮短至幾天、甚至更短,屆時現有密碼體系可能會“潰不成軍”。
在北京理工大學計算機學院副教授閆懷志看來,生物醫藥也將是DNA計算主要的應用場景之一。“DNA計算由于其融合應用了電子技術和生物技術,使得電腦與人腦相結合的‘人機合一’成為可能。可以設想,采用DNA計算技術,甚至能在人體或細胞內直接植入人造生物芯片、運行計算機程序。”閆懷志說。
“利用DNA計算技術,科學家可在細胞內植入DNA納米機器人和分子電路,完成細胞功能調控。例如,北京大學相關團隊構建的多種DNA分子電路,可對某種腫瘤標志物進行特異性識別,進而實現快速診斷。”張成說。
“此外,得益于DNA分子鏈本身的微小性、可折疊性及高度穩定性,DNA分子存儲技術近年來受到廣泛關注。”張成指出,科學家已經把莎士比亞的詩、馬丁?路德金的演講等信息通過分子編碼,成功以DNA形式進行存儲。DNA硬盤或將于不久后問世。
與此同時,專家也表示,目前來看,DNA計算技術落地仍面臨諸多挑戰。
“目前學界還未找到實時、高靈敏度的檢測DNA單分子的技術手段。DNA運算結果信號往往為微小、微量的DNA單分子,如何增強這種納米級別的信號或提升單分子檢測技術的能力,需要我們進一步努力。”劉向榮指出。
新技術只有走出實驗室,才能體現其價值,造福大眾。張成坦言,目前由于DNA計算技術相關研究仍屬于前沿基礎研究范疇,市場資金介入度不夠。“因此,我們亟須加強相關的應用研究,吸引市場的關注。”張成說。
“目前來看,DNA計算技術距離真正落地,還有很長的路要走,或許需要20年。”劉向榮推測道。
究人員手里拿著一個小瓶,你能猜到這里面其實裝著DNA狀態的惡意計算機程序嗎?
這似乎是科學家們第一次用DNA成功地攻擊了計算機軟件程序。研究人員稱將惡意軟件編碼到DNA里面,計算機分析DNA時就會被控制。
這些生物惡意軟件是由西雅圖華盛頓大學的科學家開發出來的,科學家們稱之為第一個“基于DNA的計算機系統入侵”。
為了實現侵入,以Tadayoshi Kohno和Luiz Ceze領頭的研究團隊將惡意軟件編碼在一小段他們在線購買的DNA里。當DNA測序機讀取基因數據后,他們用它“完全控制”了用來處理基因數據的計算機。
研究人員警告說,有一天,黑客可能會用偽造的血液或唾液樣本侵入大學電腦,竊取警方法醫實驗室的信息,或者感染科學家共享的基因組文件。
目前,DNA惡意軟件并沒有造成太大的安全風險。研究人員承認,為了確保能夠實現入侵,他們禁用了電腦安全設置,甚至在一個不太常見的生物信息程序中專門添加了一個漏洞。
遺傳學家兼程序員Yaniv Erlich同時也是族譜網站myhertige.com的首席科學官,他認為“他們的侵入基本上是不現實的”。
Kohno曾率先通過汽車診斷接口來入侵汽車系統,之后還通過藍牙連接實現了遠程入侵汽車。
新的DNA惡意軟件將在下周的溫哥華Usenix安全討論會上展示。在Kohno的安全隱私研究實驗室的一名研究生Peter Ney說:“我們關注新興技術,考慮它們是否會帶來新的安全威脅。所以,我們需要先人一步。”
為了制造惡意軟件,Kohno研究團隊把一個簡單的計算機指令分成一個由176個DNA字母組成的小片段,記為A,G,C和T。他們花了89美元從供應商訂購了DNA復制品后,將這些分子鏈放入基因測序儀,讓它讀取基因字母,然后存儲為二進制數字0和1。
據Erlich解釋,計算機攻擊其實是利用了溢出效應,溢出緩沖區的數據就可以被解讀為計算機指令,然后指令會聯系Kohno團隊控制的一臺服務器。這樣,實驗室里用來分析DNA的計算機就被控制了。”
為科學家們提供合成DNA鏈的公司已經在警惕生物恐怖主義的襲擊了。研究人員建議,今后他們可能也需要開始檢查DNA序列,以防里面“暗藏病毒”。
華盛頓大學的研究小組還警告說,黑客可以使用更多的常規手段來獲取目標人物的基因數據,正是因為越來越多的基因數據被放在了網上,甚至可以通過應用程序商店訪問。
桑格研究所的英國生物信息學專家James Bonfield說,“在某些情況下,用來整理和解釋DNA數據的程序并沒有好好維護,可能帶來新的風險”。