操屁眼的视频在线免费看,日本在线综合一区二区,久久在线观看免费视频,欧美日韩精品久久综

新聞資訊

    么是COVID-19?

    2019冠狀病毒病簡稱COVID-19,是由一種稱為SARS-CoV-2的病毒導致的感染。這種病毒2019年末于中國武漢首次發(fā)現(xiàn),感染可導致發(fā)熱、咳嗽和呼吸不暢,累及肺部可導致呼吸問題甚至肺炎。



    專家們?nèi)栽诶^續(xù)研究此病毒。


    COVID-19如何傳播?

    COVID-19主要是人傳人,與流感病毒相似。通常發(fā)生于接觸打噴嚏或咳嗽的病人時。觸摸有病毒滯留的物體,然后再觸碰嘴唇、鼻子或眼睛,也可能生病。

    COVID-19始于中國?還是美國?目前不知道



    COVID-19的癥狀有哪些?

    通常感染病毒數(shù)日后開始出現(xiàn)癥狀,但部分患者可能更長時間才有表現(xiàn)。

    包括:

    ●發(fā)熱

    ●咳嗽

    ●乏力

    ●呼吸不暢

    ●肌痛



    大多數(shù)人癥狀輕微,部分人甚至完全沒有癥狀。但也有人病情嚴重,比如發(fā)生肺炎、缺氧,甚至死亡,更常見于合并其他健康問題的患者。

    兒童感染COVID-19時,很少有嚴重癥狀。


    應該就診嗎?

    如果您有可能暴露于COVID-19,有發(fā)熱和咳嗽或呼吸不暢,請就診。如果14天內(nèi)有如下情況,可能有暴露:

    與感染者或攜帶者密切接觸–密切接觸是指范圍在6英尺內(nèi)。


    居住在疫區(qū)或到疫區(qū)旅行


    參加過已知有COVID-19病例的事件或到過有病例的地方–例如,聚會后或工作地發(fā)現(xiàn)多例病例。


    如果病情不嚴重,就診前最好打電話給醫(yī)護人員或診所,他們將告知您需要注意什么以及是否需要就診。如果需要去診所或醫(yī)院,請佩戴口罩。醫(yī)護人員也可能讓您在某地等候并遠離其他人。

    如果病情嚴重,立即就診,并盡快聯(lián)系醫(yī)護人員。醫(yī)護人員會告知您盡量避免他人感染的方法。

    醫(yī)護人員會詢問您癥狀并進行體格檢查,還會詢問旅行史、接觸史等。



    需要進行檢查嗎?

    如果醫(yī)護人員懷疑您感染COVID-19,將從鼻部和口腔取液體進行檢查。也可能檢測痰液,以及尿液和糞便。這些檢查可顯示COVID-19感染或其他感染。

    還可能需要進行胸部X線檢查。


    如何治療COVID-19?

    患者大多病情輕微,居家觀察即可。如果病情嚴重,需要住院治療,甚至可能需要入住ICU。如果住院治療,您將住在隔離病房,僅穿戴專門隔離服、手套、口罩和護目鏡的醫(yī)護人員可以進入。目前尚無特效治療,密切監(jiān)測呼吸和其他身體功能,并給予支持治療,

    盡可能讓您感覺舒適。如果有呼吸困難,可能需要吸氧。如果呼吸困難嚴重,可能需要呼吸機幫助呼吸。



    COVID-19可以預防嗎?

    有一些預防措施可減少感染COVID-19的機會。這對每個人都很重要,但對老年人或有其他健康問題的人尤其重要。

    ●用肥皂和清水勤洗手。這在公共場所和觸碰他人或物體后尤其重要。按照附表的說明洗手,可有效預防傳播性疾病。

    ●避免用手觸碰臉部,尤其是嘴唇、鼻子或眼睛。

    ●盡量遠離有感染癥狀的人。

    ●盡量避免到人多的地方。如果您居住在有COVID-19病例報道的地方,盡量呆在家。

    ●一些專家推薦避免到COVID-19疫區(qū)旅行,


    如果家人感染COVID-19,您可采取以下措施保護自己:

    ●隔離患者–讓患者使用單獨的房間及衛(wèi)生間。

    ●佩戴口罩–患者和/或其他人應佩戴口罩。如果您負責照顧患者,進入隔離房間時佩戴口罩,如果患者不能佩戴口罩,這對您尤其重要。

    ●謹慎接觸患者體液–接觸患者的血液、黏液或其他體液時,穿戴一次性的口罩、防護服和手套。如果皮膚沾染上這些液體,立即用肥皂洗手。

    ●頻繁清潔常用物品,包括家具、床頭柜、門把手、電腦、手機和衛(wèi)生間等。一些清潔產(chǎn)品可殺死細菌,但對病毒無效,使用前請檢查說明。

    ●勤洗手–經(jīng)常用肥皂和清水洗手。

    還沒有可預防COVID-19的疫苗。(新聞報道,僅供參考,很多是不靠譜的)



    我應該做些什么來應對可能的COVID-19暴發(fā)?

    很難預測哪些地方將來會發(fā)生暴發(fā)。保持健康最可行的方法:勤洗手,避免與生病的人密切接觸,以及患病后呆在家。

    如有暴發(fā),學校和公司可能暫時關閉。如果發(fā)生這樣的事,或者您家中有人感染COVID-19,請呆在家中一段時間。有一些準備措施:例如,要求員工在家遠程辦公或者休假;確保與親戚、鄰居和其他人保持密切聯(lián)系,也方便共享信息。

    如果政府號召大家待在家,盡量減少外出。即使您并不屬于感染COVID-19后會發(fā)生嚴重病情的高危人群,您也可能將病毒傳播給他人。與他人保持距離是控制病毒傳播的最好方式之一。

    如果您或者家人擔憂COVID-19,請記住,大部分感染者并不會病情嚴重或死亡。盡管需要做一些準備措施,以降低風險,但不要恐慌。



    我可以在哪里了解更多信息?

    ●WHO:www.who.int

    ?

    參考來源:Patient education: Coronavirus disease 2019 (COVID-19) (The Basics),Uptodate,2020

    文篇幅較長,共4部分,分別解答了4個很多人可能關心的問題。這四個問題間的上下文關聯(lián)不大,可選擇性閱讀。 1.Folding@home究竟是個什么樣的項目? 2.新冠病毒研究,為什么需要算力?算力能為新冠病毒研究提供什么幫助? 3.Folding@home的架構是否真的能夠有效利用起全球范圍的計算機或更多設備的算力? 4.英偉達為什么重點呼吁PC游戲玩家?

    前一陣英偉達官方發(fā)推,呼吁PC游戲玩家聯(lián)合起來對抗2019-nCoV新冠病毒,方法是把自己閑置的GPU算力都捐出來,幫助科學家們做病毒研究[1]。通過采用名為Folding@home(在家折疊?)的軟件,就能讓每個在家用電腦的人把算力捐出來:每個人一點,就能以全球組合成網(wǎng)絡的方式,構建起一個龐大的超級計算機。

    微博人民對于英偉達的此次呼吁似乎多有質(zhì)疑之聲,不少人認為這個所謂的Folding@home只是在為他人做嫁衣,無端捐獻算力也不知道是拿來做了什么。實際上大規(guī)模分布式計算,讓Folding@home這樣的計劃具有十分的可行性,只不過通過并不算可靠的互聯(lián)網(wǎng)結(jié)成這樣的分布式結(jié)構做計算,帶寬之類的問題究竟該怎么解決?以及如果新冠病毒研究真的需求海量算力,為什么不直接采用超算?

    這是我們期望通過本文去大致了解的問題。本文篇幅較長,共4部分,分別解答了4個很多人可能關心的問題。這四個問題間的上下文關聯(lián)不大,可選擇性閱讀。

    1.Folding@home究竟是個什么樣的項目?

    2.新冠病毒研究,為什么需要算力?算力能為新冠病毒研究提供什么幫助?

    3.Folding@home的架構是否真的能夠有效利用起全球范圍的計算機或更多設備的算力?

    4.英偉達為什么重點呼吁PC游戲玩家?

    Folding@home是個什么樣的項目?

    雖然我們沒辦法做到完整細致地回答這幾個問題,畢竟其中可能還涉及到相應的生物、醫(yī)學或病毒學知識,不過勾勒一個框架應該還是可以的。而且理解Folding@home,對于我們參考理解大型項目網(wǎng)絡構建也有價值。

    針對第一個問題,F(xiàn)olding@home項目的存在歷史還是比較久的,其最初發(fā)起時間是2000年10月,由斯坦福大學(Stanfor University)的Pande Lab實驗室發(fā)起。目前參與Folding@home各部分開發(fā)的除了Pande實驗室以外,還包括了索尼、英偉達、ATI、Cauldron Development等。[2]

    Folding@home就是一個分布式計算項目,它主要做的就是蛋白質(zhì)的分子動力學模擬。最初Folding@home著眼的就是蛋白質(zhì)折疊(protein folding),現(xiàn)在轉(zhuǎn)向更多的生物醫(yī)療研究,包括阿茲海默癥、癌癥、埃博拉病毒、2019-nCoV等。所以2019-nCoV實際上只是Folding@home研究的一個最新組成部分(于今年3月加入)。

    其中的所有大型計算項目,都是由知名研究院校運營或者直接輔助執(zhí)行的。其實有關2019-nCoV即新冠病毒在Folding@home上的項目具體由誰在推動,這一點我們并沒有查到詳實的資料。僅知在Folding@home發(fā)起呼吁的這位Greg Bowman,目前就是Folding@home的負責人(2019年的新任負責人,也是上一任負責人Pande博士的學生)。Bowman是圣路易斯華盛頓大學的副教授。看起來,2019-nCoV病毒研究項目的發(fā)起者就是Folding@home官方。

    那么針對這些研究,F(xiàn)olding@home究竟是怎么提供算力的呢?其核心理念就是期望能夠利用全球個人計算機的閑置計算資源——當然這些PC需要安裝來自Folding@home的客戶端軟件,至于由誰來安裝,那當然就是愿意貢獻算力的志愿者了。如此一來,集合全球CPU、GPU各路硬件的算力,就能為科學研究做貢獻了。

    整個分布式系統(tǒng)實際上比我們闡述得要復雜很多,這在后文還會提到,比如志愿者可以在Folding@home官網(wǎng)上追蹤自己的貢獻,甚至以貢獻算力多少,及積分制的方式相互比較排名;還能組隊刷分——Folding@home官網(wǎng)常年更新團隊積分排名[3]。讓算力貢獻在呈現(xiàn)上更加生動和有趣。實際在2009年,F(xiàn)olding@home發(fā)布的paper中就提到,為志愿者開發(fā)的客戶端程序集成了OpenGL,主要是以圖形化的方式向志愿者展示蛋白質(zhì)模擬的情況[4]。Folding@home的團隊認為,這種呈現(xiàn)對于科學研究雖然沒有多大價值,但是對志愿者去了解正在自家PC上發(fā)生什么,幫助Folding@home在人群中擴散是很有幫助的。

    這是Folding@home項目一個很小的例子,其整體復雜性都還是比較大的。

    從某種意義上來講,在這些年的發(fā)展中,F(xiàn)olding@home已經(jīng)成為全球性能最彪悍的超算系統(tǒng)——尤其是3月初Folding@home開啟了針對新冠病毒的研究項目,為Folding@home整體算力推升到一個新的小高潮。不嚴謹?shù)卣f,如今其算力已經(jīng)達到了768 petaFLOPs。截至3月25日,F(xiàn)olding@home算力達到1.5 x86 exaFLOPs[5],數(shù)倍于目前全球最快的超算。

    (注:Folding@home給定的算力單位包括native FLOPs,x86 FLOPs等。某一類硬件的每秒浮點運算數(shù)即為native FLOPs;x86 FLOPs是指如果將所有算力統(tǒng)統(tǒng)劃歸為x86 CPU,則有多少FLOPs——GPU的1 native GPU FLOP通常就相當于好多native x86 FLOPs。[6])

    很多人對這個算力數(shù)字大概沒有概念:2007年9月,由于Folding@home加強對PS3的性能利用,以及大量PS3游戲機玩家加入進來,F(xiàn)olding@home算力就推到了1 petaFLOPs。當時Folding@home就成為全球首個跨入到petaFLOPs級別的計算系統(tǒng),那會兒全球Top 500中最快的超算是BlueGene/L,其算力是0.280 petaFLOPs。

    性能在后續(xù)還有幾波小高潮,比如2009年其算力達到5 petaFLOPs,那時IBM超算Roadrunner的性能是1.105 petaFLOPs;2016年年中,F(xiàn)olding@home超過100 x86 petaFLOPs。實際在今年3月這一個月,F(xiàn)olding@home的等效算力提升是真正飛快的。3月20日,F(xiàn)olding@home在推特上表示其算力達到470 petaFLOPs(958 x86 petaFLOPs),而到了3月25日,這個數(shù)字就飛奔到了768 petaFLOPs(1.5 x86 exaFLOPs)。

    就科學研究來說,這些數(shù)字當然不能代表什么,但Pande Lab實驗室已經(jīng)因此產(chǎn)出了223篇科學研究paper。

    這里有個問題可能是很多人更加關注的,即Folding@home產(chǎn)生的研究數(shù)據(jù)是否公開的問題。因為我們并非科研人員,所以很難理解數(shù)據(jù)集的透明性如何。這里面實際上涉及到兩個問題,其一是志愿者貢獻的算力,獲得的研究數(shù)據(jù)或研究結(jié)果是否公開;以及Folding@home這套系統(tǒng)本身的軟件、硬件是否開源(或足夠開源)?

    Folding@home曾經(jīng)提到過來自Folding@home的大型數(shù)據(jù)集對其他人是公開的,并且隨時間推移會有更多數(shù)據(jù)給出。“我們期望通過對數(shù)據(jù)的公開,讓其他科研人員利用這些數(shù)據(jù),也能用于其他的研究。”[7]最早領銜這個項目的Vijay Pande曾在論壇上說過:“根據(jù)NIH(美國國立衛(wèi)生研究院)的規(guī)則,所有paper必須免費,但是在發(fā)布一年以后。這是科學工作的常規(guī),至于同行評議期刊怎么做是我無法控制的。”(期刊可能會出售這些paper)有關原始數(shù)據(jù)的問題,“一般我們按需提供,有人需求數(shù)據(jù)時,我們就會將其公開在網(wǎng)站上。由于數(shù)據(jù)量非常大,這種按需提供的方法比較合理,我們也無法單獨個別處理所有需求。”

    而在Folding@home這套系統(tǒng)本身的軟件、硬件的開源程度問題,整體我們也很難在短時間內(nèi)全盤把控。就我們掌握的信息,F(xiàn)olding@home系統(tǒng)本身的打造就離不開很多開源工具,比如Gromacs、TINKER、AMBER、MPICH等[8]。所以它也在為開源社區(qū)做貢獻,很多組成部分也的確是開源的。比如說后文還會提到,F(xiàn)olding@home的core是基于分子動力學軟件包Gromacs,F(xiàn)olding@home自己對其GPU加速開發(fā)起到了相當?shù)淖饔茫会槍PU的庫OpenMM,為應用開發(fā)者和GPU供應商提供相對統(tǒng)一的API等等。

    2011年,F(xiàn)olding@home就發(fā)布過一個開源的Copernicus軟件,基于其MSM(Markov state model,馬爾科夫狀態(tài)模型)以及其他并行方法。主要價值就是針對大型計算機集群和超算,提升分子模擬的效率和規(guī)模。這對于其他科學領域的研究也是相當有價值的。

    有關數(shù)據(jù)實際在國際間共享的透明性,以及這些研究數(shù)據(jù)和開源軟件本身可能還涉及到的政治問題,這就是另外一個話題了,這里不再做深入討論。

    算力對新冠病毒研究有什么用?

    這是個相關生物學研究的問題,理論上應該是生物學媒體更關注的問題,我們簡略地談一談。研究人員期望搞清楚的是對于2019-nCoV潛在藥物靶點(potential drug targets)結(jié)構,這樣就能設計新的治療方法。2019-nCoV可以認為是SARS病毒的近親,行為方式類似。兩者的第一步感染就是在肺部發(fā)生的,病毒表面的蛋白質(zhì)會“綁定”到肺細胞的受體蛋白質(zhì),這里的受體被稱作ACE2。

    這里的病毒蛋白被稱作纖突蛋白(spike protein),也就是上圖中的紅色部分。科學家追逐的治療性抗體,實際上是蛋白質(zhì)的一種,它的目標就是阻斷病毒蛋白與受體綁定,起到阻止病毒感染肺細胞的作用。SARS-CoV的治療性抗體已經(jīng)開發(fā)出來了。但如果要開發(fā)2019-nCoV也就是這次新冠病毒的治療性抗體,科學家就需要去更好地理解病毒纖突蛋白的結(jié)構,以及它究竟是怎樣與ACE2受體結(jié)合的。

    蛋白質(zhì)會擺動、折疊、展開,形成各種形狀。科學家需要研究的,不光是病毒纖突蛋白的一種形狀,而是其擺動、折疊成各種形狀的方式,這樣才能更好地理解它與ACE2受體是如何交互的,如此一來抗體就可以設計出來的。[9]

    Folding@home在官網(wǎng)上提到,SARS-CoV病毒的“低分辨率”結(jié)構已經(jīng)有了,外加SARS-CoV和2019-nCoV的已知差別,F(xiàn)olding@home的這個項目就是要幫助構建起2019-nCoV纖突蛋白的結(jié)構,并識別抗體的靶點。而構建計算模型是需要海量算力的,這是Folding@home介入的原因。

    前文已經(jīng)提到,F(xiàn)olding@home本身就是致力于理解蛋白質(zhì)折疊問題的項目。這對于理解蛋白質(zhì)做什么、如何工作是很有幫助的。這個模擬和理解的過程,也就是computational biology(計算生物學)。蛋白質(zhì)另外也可能發(fā)生錯誤折疊(misfold),錯誤折疊會導致各種疾病,比如阿茲海默癥。利用計算模型,外加補充實驗,理解蛋白質(zhì)折疊、錯誤折疊等的完整過程,就非常重要。

    由于蛋白質(zhì)構造,及其可能變化的形狀,本身就非常復雜,這個過程對算力需求便非常之高。通用超級計算機也曾一度用于模擬蛋白質(zhì)折疊過程,不過成本非常高;另外,由于動力學模型計算是連續(xù)的,傳統(tǒng)分子模擬的規(guī)模化執(zhí)行會非常困難;而且蛋白質(zhì)折疊是一個隨機的過程,隨時間推移各種變化。這些對于模擬計算都提出了很大的挑戰(zhàn)。

    在Folding@home各種模擬軌跡以及新構造發(fā)現(xiàn)的過程中,逐漸建立起自適應抽樣的馬爾科夫狀態(tài)模型(MSMs)。這種模型法極大地提升了模擬的效率,而且它很適用于分布式計算。一個馬爾科夫狀態(tài)模型構建的時間,與并行模擬數(shù)量(比如處理器的數(shù)量)成反比。也就是說,并行數(shù)越多,模擬效率就越高。

    Folding@home利用馬爾科夫狀態(tài)模型,來給蛋白質(zhì)可能的形狀和折疊路徑建模

    一個完整的馬爾科夫狀態(tài)模型可能包含了數(shù)萬個蛋白質(zhì)相空間(phase space,蛋白質(zhì)可形成的所有構造)的樣本狀態(tài),以及不同狀態(tài)間的轉(zhuǎn)變過程。這樣一個模型表征到了折疊事件、路徑等。研究人員利用這些模型,可了解蛋白質(zhì)如何折疊,并結(jié)合試驗,與模擬做對比。

    雖然我們并不清楚這次新冠病毒纖突蛋白研究需要投入多少算力,以及需要多久。不過就其原理看來,投入算力也是聚少成多的過程,或者說,其效力大約很難在短期內(nèi)體現(xiàn)出來——所以即便越來越多的人由于本次新冠病毒而參與Folding@home項目,它也無法立刻顯現(xiàn)出成效,并讓計算生物學即刻顯現(xiàn)出多大的威力,這畢竟是個長久的項目。

    Folding@home的系統(tǒng)架構如何?

    采用互聯(lián)網(wǎng)構成一個分布式計算網(wǎng)絡,其帶寬和存儲問題怎么解決,應該是我們更關心的一個問題;畢竟互聯(lián)網(wǎng)和超算中的本地網(wǎng)絡比起來實在是太慢了。理解了這個問題,也就可以回答,F(xiàn)olding@home架構對于科學研究是否真的有價值,或者Folding@home對于全球算力利用是否真的有效了。

    我們能夠找到的Folding@home發(fā)布相對詳細的解釋,實際是2009年的一篇paper[4],在這10多年內(nèi),其整體架構應該又有了變化,所以下面的闡述大概會相對落后。但我們相信,其大框架應該是不變的。

    客戶端界面

    首先有必要談一談志愿者一側(cè),也就是用戶的軟件組成。用戶端的軟件主要包括了work units、core、client(客戶端)。

    (1)每一個work unit,就是客戶端要求處理的一部分蛋白質(zhì)數(shù)據(jù)。work unit實際上就是馬爾科夫狀態(tài)模型不同狀態(tài)間模擬的一小部分。客戶端會自動下載work unit,然后進行計算,再返回給Folding@home的服務器,服務器就會給予一定的積分獎勵。

    為了保證計算的效率,所有的work unit都有個計算的截止時間,如果超過截止時間還沒有計算結(jié)束,則這個work unit就會自動移交給其他人。前文就已經(jīng)提到了,蛋白質(zhì)折疊是一個連續(xù)的過程,許多work unit的生成,都依賴于上一個work unit,所以設立這樣的截止時間是非常有必要的。針對更高性能的客戶端,會有更短的截止時間設定。

    (2)一個特定的分子動力學程序,就是一個core。針對這些core,work unit作為后臺進程去執(zhí)行計算。Folding@home的絕大部分core都基于前文就提到的Gromacs,也就是一個開源的軟件包,其中主要包括了手動優(yōu)化過的匯編語言代碼和硬件優(yōu)化方案。core是獨立于client客戶端的,這樣一來,在不需要更新客戶端的情況下就能更新科學方法。另外,core還周期性地創(chuàng)建計算檢查點(checkpoint),在計算被打斷的情況下,后續(xù)可以從這個點上再開始。

    (3)Client自然就是指運行在PC(或者其他用戶終端)的客戶端程序了,用戶和客戶端進行交互。Client與Folding@home服務器聯(lián)系:獲取和上傳work unit;根據(jù)用戶設置、操作系統(tǒng)、底層硬件架構下載相應的core。

    在client上,用戶可以暫停折疊進程,查看事件日志,檢查進度,或者查看個人數(shù)據(jù)-比如積分之類。Client以很低的優(yōu)先級持續(xù)跑在后臺,僅使用閑置算力,確保設備的日常使用不會受到影響(用戶可以自行設置Folding@home如何使用自己設備的資源)。Client部分的軟件開發(fā)團隊,包括來自英偉達、ATI、索尼、Cauldron Development的程序員。程序本體似乎已經(jīng)經(jīng)過了多次迭代,據(jù)說最早的客戶端是個屏幕保護程序,僅在計算機不使用的時候才會運行。

    擴展到整個分布式網(wǎng)絡部署,則會更復雜一些。很容易想見,F(xiàn)olding@home就是個客戶端-服務器這樣一個CS結(jié)構。首先志愿者在自己的設備上安裝客戶端,會有一臺分配服務器(assignment server)為客戶端分配一臺工作服務器(work server)。隨后客戶端與工作服務器通訊,獲取work unit——work unit具體就是一組文件;根據(jù)分配到的work unit,客戶端可能還需要從web服務器下載core。

    在計算工作結(jié)束后,客戶端將結(jié)果發(fā)回給相同的工作服務器;工作服務器再收集日志文件和積分數(shù)據(jù),并交給數(shù)據(jù)服務器(statistics server),并顯示給志愿者們看。

    如果我們再細致的剖析一下,整個架構在任務調(diào)度、指派、執(zhí)行等各方各面,都很像是一個放大版的CPU或超算網(wǎng)絡。工作服務器(work server)會生成work unit,并且分析接下來需要完成什么工作:前一個計算得到的結(jié)果需要用于生成后續(xù)任務。每臺工作服務器都承載了很多的項目,且由不同的研究人員管理。

    分配服務器(assignment server)是一個全局調(diào)度機(scheduler),還要確保整個系統(tǒng)負載均衡。客戶端首先聯(lián)系的實際上就是分配服務器。項目優(yōu)先級本身就受很多因素影響,另外還要結(jié)合客戶端的各種參數(shù)(比如客戶端的硬件配置、系統(tǒng)版本、網(wǎng)絡帶寬、可靠性等)做出工作分配決策。Collection服務器則是一種冗余方案,在客戶端無法將結(jié)果上傳給work服務器時,就會啟用。

    除此之外,當然還需要有一個專門給用戶看的數(shù)據(jù)網(wǎng)站——志愿者們可以在網(wǎng)站上看到他們自己貢獻的成果。這就是數(shù)據(jù)服務器(statistics server)的工作了,其上還包括分配給志愿者或者團隊的積分。數(shù)據(jù)服務器需要從工作服務器周期性地獲取日志文件,以給用戶呈現(xiàn)數(shù)據(jù)。另外網(wǎng)站上面還有社區(qū)論壇,這些論壇通常也是志愿者在維護的,交流和提供技術支持,還有用戶反饋等。

    這就是Folding@home的基本運作方式了。不難發(fā)現(xiàn),這并不是一個對實時性要求很高的系統(tǒng):其重點還在于大規(guī)模并行運算能力,它對整個系統(tǒng)的帶寬、延遲并沒有那么敏感。另外,上面的描述僅是個梗概,而且這個框架是10年前的,當年Folding@home還提到過系統(tǒng)后端可能存在的瓶頸,所以那會兒就提出了分布式存儲Storage@home,以提升運算結(jié)果處理的效果。不過這個項目很快擱淺,原因未知[9]。

    為什么特別呼吁PC玩家參與?

    在耗費最低成本的前提下,隨加入Folding@home的設備越來越多,實現(xiàn)摩爾定律增長——這也是一個很有意思的說法,就類似于處理器的執(zhí)行單元可以無限增加一樣。而回答“為什么特別呼吁PC玩家參與”,拍腦袋就知道是因為PC玩家的設備性能強,捐的算力就多。

    給出算力的第一選擇,在Folding@home誕生之時必然是CPU。其完整形式的個人電腦,自然成為捐獻算力的一個完美載體。不過在Folding@home經(jīng)歷的這20年歷史上,參與到算力捐獻的設備并不只有PC,還包括了PS3游戲機、索尼Android手機。甚至2014年,借由谷歌Chrome瀏覽器的NaCl特性,還能讓Folding@home跑在一個沙盒里,這樣一來Chrome瀏覽器就能直接跑Folding@home。但去年6月NaCl已經(jīng)不在,F(xiàn)olding@home的web客戶端也就沒有了。

    這其中比較令人在意的是PS3游戲機:PS3在Folding@home項目上的服役時間還不短。PS3游戲機的流處理器對于某些計算而言,提供超過PC多達20倍的速度,讓PS3成為Folding@home算力上的一支超強戰(zhàn)力。Folding@home的PS3客戶端,是由索尼和Pande Lab合作開發(fā)的,發(fā)布時間是2007年3月。當時這個客戶端的介紹中提到,它同時利用了CPU的彈性和GPU的速度。

    事實上,那個年代GPGPU還不流行。不過PS3是一個固定的環(huán)境,做技術支持和開發(fā)也就比較容易。那會兒Folding@home的PS3客戶端有個比較尷尬的問題,即PS3用戶在跑客戶端的時候,就不能做別的事情。可是即便如此,在2012年,索尼正式結(jié)束對Folding@home PS客戶端支持之際,依然有1500萬PS3用戶,貢獻了超過1億小時的算力。

    像蛋白質(zhì)折疊相關的計算,要求高度并行的計算能力,是Folding@home早就注意到的。所以Folding@home很早就實現(xiàn)了對CPU多核心的充分利用,多核并行能夠在相同的時間內(nèi)實現(xiàn)更長的模擬路徑,也就沒有必要再把模擬分派給不同的處理器。2006年11月,F(xiàn)olding@home的SMP(對稱多處理)客戶端進入開放beta測試階段。這個客戶端采用MPI通訊協(xié)議進行并行處理,這也是歷史上分布式計算項目首次使用MPI。

    隨后Folding@home也隨硬件本身的發(fā)展,實現(xiàn)更多算力的獲取。比如在SMP2客戶端發(fā)布之后,某一類名為bigadv的work unit就要求至少8個CPU核心來計算,而且還對內(nèi)存和互聯(lián)網(wǎng)帶寬資源提出了要求。當然,如果志愿者能夠跑得了這樣的work unit,就能獲得多加20%的額外積分。比較有趣的是,后來SMP2客戶端將bigadv的硬件要求提升到至少16個核心,而那些8核CPU用戶就只能跑常規(guī)的work unit了。據(jù)說這事兒傷害到了很多用戶,因為他們?yōu)榱薋olding@home在硬件上也花了很多錢,于是在很多人的反饋之下,Pande終止了bigadv。

    Folding@home團隊

    事實上,在談到高度并行計算的時候,GPU已經(jīng)成為當代的首選——看看AI training發(fā)展如火如荼就知道了。不過早年的GPU編程還是相當有難度的,尤其GPU市場還有不同架構和選擇。Folding@home采用開源的OpenMM庫——這個庫采用一種橋接設計模式,有兩個API層級,連接分子模擬軟件和底層的硬件架構。加上額外的硬件優(yōu)化,基于OpenMM的GPU模擬,程序并不需要多大改動就能獲得據(jù)說是接近于手動調(diào)整的GPU代碼性能,當然也遠超CPU的算力。

    Folding@home的第一代GPU支持客戶端,是在2006年10月發(fā)布的。這也是史上頭一次GPU應用到分布式計算中。研究人員也是從這個時候開始積累起GPGPU軟件開發(fā)的經(jīng)驗。二代GPU客戶端開始對英偉達的CUDA,以及ATI的GPU做出更到位的支持,支持更高級的算法更大型的蛋白質(zhì),而且還能做模擬的實時視覺呈現(xiàn)。

    很多年前,GPU就已經(jīng)是Folding@home貢獻算力最大的組成部分。2012年11月,GPU客戶端占到整個項目算力吞吐的87%。

    現(xiàn)在GPU通用計算發(fā)展得這么風生水起,我們?nèi)ツ陞⒓佑ミ_的GTC大會,英偉達宣傳的就是自家GPU已經(jīng)應用到了多少不同的領域,而早就不限于圖形計算[10]。去年英偉達平臺應用就開始支持全基因組測序(NVIDIA PARABRICKS基因組分析工具包),3月20日英偉達發(fā)布的新聞稿就提到開始向研究人員免費提供PARABRICKS軟件,主要用于新型冠狀病毒和COVID-19確診者的基因組測序。

    這就已經(jīng)完美解答英偉達為何呼吁PC游戲玩家參與Folding@home了,因為游戲玩家的GPU一般都更出色。

    一些花絮與下載地址

    以上我們就基本把Folding@home這個項目大致說清楚了。事實上項目面臨的挑戰(zhàn)也遠沒有我們想象得那么簡單,在查閱資料的過程中還是發(fā)現(xiàn)了一些項目組有趣的吐槽。比如說Folding@home曾提到,數(shù)據(jù)系統(tǒng)遭遇的一個挑戰(zhàn)是,有一小撮志愿者為了提高他們的積分,會作弊。有一些人甚至采用種植木馬的方式,把客戶端裝到別人的電腦上,然后用別人電腦的算力給自己賺積分——聽起來就跟挖礦木馬一樣。

    而Folding@home在客戶端層面面臨的最大挑戰(zhàn)還在于,現(xiàn)有硬件平臺的多樣化。“存在幾近無數(shù)種硬件、軟件、驅(qū)動的組合方式,也就是說在進行客戶端開發(fā)時,要花海量的時間去處理不兼容的問題。”而在硬件架構變化時,又要進行core的移植和測試工作,并對客戶端進行重新編譯,“畢竟計算機總是要隨時間做各種升級。”早年蘋果從PPC遷往x86,就得做很多工作。

    最后提供一下Folding@home客戶端的下載地址,當前macOS、Windows、Android、Linux都支持,具體的使用方法有興趣的各位可以自行體驗嘗試:https://foldingathome.org/iamoneinamillion/

    要你有一臺能上網(wǎng)的電腦,你也可以為抗擊疫情提供幫助。


    下面這個動圖,模擬了新冠病毒的刺突糖蛋白在真實世界中不斷變化的樣子。這個蛋白非常重要,是病毒入侵細胞的關鍵。這一成果,將為抗病毒藥物的開發(fā)提供指導。


    (新冠病毒刺突糖蛋白的動態(tài)模擬。新冠病毒通過刺突糖蛋白與人體細胞上的ACE2受體蛋白結(jié)合,從而進入人體細胞 | Twitter:@Greg Bowman)


    你也許會認為,這是科學家們用龐大而昂貴的科學儀器生成的;但實際上,這個結(jié)果來自數(shù)十萬普通人的個人電腦。這個項目叫做 Folding@home(直接翻譯過來是“在家進行蛋白折疊”,官網(wǎng)鏈接可戳文末“閱讀原文”),你也可以參與其中。


    故事要從20年前說起


    20 世紀 60 年代,科學家們開始嘗試用射電望遠鏡偵聽來自太空的無線電信號,尋找外星智慧生命的痕跡。分析這些數(shù)據(jù)需要巨大的運算能力,隨著項目規(guī)模的擴大,分析所需的計算資源成了瓶頸。于是在千禧年來臨前夕,當互聯(lián)網(wǎng)正向世界的各個角落擴張的時候,他們產(chǎn)生了一個想法——集合各家各戶的電腦,共同完成計算任務。


    SETI創(chuàng)立人法蘭克·德雷克(Frank Drake)正在瀏覽射電望遠鏡收集到的數(shù)據(jù) | Lou Dematteis / Reuters


    1999 年 5 月 17 日,SETI@home(Search for ExtraTerrestrial Intelligence at Home,“在家搜尋外星智慧”)正式上線。這個項目由加州大學伯克利分校的程序員和天文學家共同運行,是最早的“志愿分布式計算項目”之一。參與這個項目的人,不必把電腦郵寄給大學,只需要下載客戶端。配置完畢后,電腦進入屏幕保護狀態(tài)時,就會自動從服務器下載地外無線信號記錄,并從中尋覓來自外星生命的問候。


    現(xiàn)在個人電腦的速度比當時快了超過100倍,即便隨時進行這些計算任務,也不會拖慢電腦的運行速度。因而,現(xiàn)在的項目也不像最初 SETI@Home 那樣僅局限于屏幕保護時才運行,而是將何時運行的選擇權交給了用戶。用戶可以選擇在其他應用不那么活躍時才運行這個項目,或者設置成一邊做其他事情一邊運行。


    “志愿分布式計算”可以滿足大規(guī)模科學計算的需求,它通過互聯(lián)網(wǎng),將個人計算機的運算能力集合起來。龐大的計算任務在服務器端被分割成許多小份的數(shù)據(jù)包,通過互聯(lián)網(wǎng)分發(fā)給個人電腦;個人電腦分別計算完畢,再回傳給服務器進行整合。你可以將“分布式計算”理解成一臺特殊的超級計算機——傳統(tǒng)的超級計算機是在一個巨大的機房中,將大量處理器通過線纜連接起來,共同完成計算任務;而志愿分布式計算則是通過互聯(lián)網(wǎng),將世界各地的處理器連接起來進行計算。


    (SETI@home項目已于今年3月31日無限期休止,不過官方仍然鼓勵大家加入其他的分布式計算項目,例如COVID-19的研究 | setiathome.berkeley.edu)


    在 SETI@home 開始后的二十年中,這一思路在各個領域得到應用。如今,在伯克利大學網(wǎng)絡計算開放平臺(BOINC)上,可以找到用于分析大型強子對撞機數(shù)據(jù)的 LHC@home、搜索脈沖星引力波的 Einstein@home、尋找大質(zhì)數(shù)的 PrimeGrid 等各個學科的項目。而獨立平臺也有許多,例如用于檢測地震的捕震網(wǎng)(Quake-Catcher Network),以及文章開頭提到的專注于蛋白質(zhì)折疊與動態(tài)的 Folding@Home。


    當初開發(fā) SETI@home 的科學家大約沒想到,20 年后,這項技術將被用于對抗一場全球瘟疫。在你閱讀這篇文章的時候,F(xiàn)olding@home 正在將大量新冠病毒的分析任務,拆解分配給世界各地的計算機,為抗擊疫情提供幫助。


    解析蛋白的動態(tài)形象


    SETI@home 上線一年半后,當上百萬志愿者的電腦正在聆聽星空的聲音、尋找地外生命時,Folding@home 發(fā)布了。科學家們希望借助分布式計算的力量,模擬蛋白質(zhì)折疊,進而了解它們在疾病中的作用,為尋找新的藥物提供信息。過去的二十年中,這個項目為解析乳腺癌相關的異常激酶、尋找埃博拉病毒的潛在藥物靶點、預測阿爾茨海默癥中異常蛋白結(jié)構等一系列工作提供了幫助。


    在項目運行的第 7100 天、多災多難的 2020 年的 2 月即將結(jié)束的時候,作為團隊的領導,生物物理學家格雷格·鮑曼(Greg Bowman)在項目官網(wǎng)宣布,他們已經(jīng)開始將 Folding@home 投入新冠病毒蛋白相關的工作,隨后還提高了新冠病毒蛋白相關計算任務的優(yōu)先級。


    Folding@home團隊 | foldingathome.org


    蛋白質(zhì)的基本單位是氨基酸,但氨基酸排列成長鏈之后,還需要通過折疊形成三維結(jié)構,才會發(fā)揮作用。折疊的過程、最終的結(jié)構以及折疊后蛋白的動態(tài),都影響著蛋白質(zhì)的功能,進而影響生命活動。


    科學家們有許多方法解析蛋白質(zhì)的靜態(tài)結(jié)構,例如冷凍電鏡技術已經(jīng)展示了新冠病毒的刺突糖蛋白結(jié)構。然而,這些方法只能顯示蛋白質(zhì)在特定瞬間的形象。鮑曼比喻道:“實驗方法捕捉的蛋白結(jié)構就像橄欖球員們蓄勢待發(fā)時的照片,能讓我們看到陣型安排,但是沒法看到整場比賽。”


    蛋白質(zhì)的靜態(tài)結(jié)構就像球賽照片,能看到陣型安排,卻看不到正常比賽 | foldingathome.org


    不過,以這些靜態(tài)形象為起點、展開計算機模擬,則可以預測蛋白質(zhì)中每個原子的運動,展示出可以改變形態(tài)的區(qū)域,讓科學家們看到整場比賽,進而針對性地制定攻防策略。以埃博拉病毒為例,過去人們認為其中的 VP35 蛋白沒有可供藥物作用的位點,但不久前計算機模擬發(fā)現(xiàn),動態(tài)變化中產(chǎn)生的新結(jié)構是可以接受藥物作用的[1],這為尋找療法提示了新方向。


    類似地,開發(fā)對抗新冠病毒的藥物時,或許也能這樣的研究里找到思路。唯一的問題是,這樣的模擬需要巨大而昂貴的計算資源,生物學家辦公室里的計算機,可能要不眠不休地工作上百年甚至上萬年,才能模擬一個蛋白的動態(tài)。


    全球加入,你也可以


    好在全球有數(shù)十億臺個人電腦,熱心地加入分布式計算網(wǎng)絡的普通人,讓模擬蛋白質(zhì)動態(tài)所需的時間變得可以接受。


    時間進入 3 月,F(xiàn)olding@home 項目組在社交媒體上發(fā)出號召后,許多人加入了這個分布式計算網(wǎng)絡。參與的用戶數(shù)量從 2 月份的約 3 萬人,增加至如今超過百萬。“也許大家注意到安裝時的卡頓了,”鮑曼在社交網(wǎng)絡上說,“有太多人在下載客戶端了,服務器有點跟不上。我們正在努力讓新服務器上線。”


    許多PC硬件、電子游戲相關的廠商和媒體也呼吁用戶加入其中 | Twitter:@PC MASTER RACE


    雖然每臺個人設備的運算能力微不足道,但是巨大的數(shù)量相加,使得可以利用的空閑算力超過了所有人的預期。目前世界上性能最強的超級計算機是 IBM 公司“頂點”(Summit),每秒可以計算 20 億億次(每秒 2x10^17 次)。3 月 21 日,鮑曼在社交媒體上宣布,F(xiàn)olding@home 的總計算速度達到了“頂點”超級計算機的兩倍。僅僅5天后,他們驚訝地宣布,計算速度已經(jīng)超過了每秒 100 億億次(每秒10^18次),比起最尖端的一批超級計算機,它的運算速度高了一個數(shù)量級。這些運算能力被源源不斷地投入到新冠病毒蛋白的相關研究中,尖刺蛋白-ACE2 蛋白結(jié)合體、新冠病毒蛋白酶、抗體蛋白等模擬項目,正在不斷地拆分發(fā)送給世界各地的參與者。


    計算資源永遠不嫌多。除了勤洗手、戴口罩、盡量待在家里之外,只要有一臺能上網(wǎng)的電腦,任何人都可以為抗擊疫情做出進一步的貢獻。前往 Folding@home 項目的官網(wǎng),下載客戶端,安裝,啟動程序——此時,你的電腦便準備好接收任務,為特效藥的研發(fā)提供基礎信息了。


    Folding@home的運行界面。可以在官網(wǎng)上查詢到,此時運行的任務(PRCG:13851)是一個與SARS-CoV和SARS-CoV-


    除此之外,在伯克利大學網(wǎng)絡計算開放平臺(BOINC)上,生物醫(yī)學項目 Rosetta@home也在將重心調(diào)整到新冠病毒相關計算上,你甚至可以在智能手機上運行它。


    新冠疫情可能是 1918 年大流感以來最嚴重的瘟疫。這次,人類的手中握著與病魔抗爭的嶄新武器,它曾被用來凝視無盡的星空,如今它將幫助我們,拯救仰望同一片星空的生命。


    更重要的是,即便是完全不懂醫(yī)學和生物學的普通人,也可以為揮舞這把利刃貢獻一點點力量。而我們畢竟是數(shù)十億人,相信這力量足以披荊斬棘。


    參考文獻

    [1] Cruz MA, Frederick TE, Singh S, Vithani N, Zimmerman MI, Porter JR, Moeder KE, Amarasinghe GK, Bowman GR. 2020. Discovery of a cryptic allosteric site in Ebola’s ‘undruggable’ VP35 protein using simulations and experiments. bioRxiv:2020.02.09.940510.

    [2] https://setiathome.berkeley.edu/

    [3]https://www.theatlantic.com/science/archive/2017/05/aliens-on-your-packard-bell/527445/

    [4] https://foldingathome.org/2020/02/27/foldinghome-takes-up-the-fight-against-covid-19-2019-ncov/

    [5] https://foldingathome.org/2020/03/15/coronavirus-what-were-doing-and-how-you-can-help-in-simple-terms/

    [6] https://www.dezeen.com/2020/03/25/coronavirus-cure-folding-at-home-software/

    [7] https://medicine.wustl.edu/news/crowdsourced-supercomputing-project-sets-sights-on-coronavirus/

    [8] http://boinc.bakerlab.org/rosetta/rah/rah_about.php


    作者:核桃苗

    編輯:麥麥


    一個AI

    既然打開電腦,就順便把論文寫了吧。

    本文來自果殼,未經(jīng)授權不得轉(zhuǎn)載.

    如有需要請聯(lián)系sns@guokr.com

網(wǎng)站首頁   |    關于我們   |    公司新聞   |    產(chǎn)品方案   |    用戶案例   |    售后服務   |    合作伙伴   |    人才招聘   |   

友情鏈接: 餐飲加盟

地址:北京市海淀區(qū)    電話:010-     郵箱:@126.com

備案號:冀ICP備2024067069號-3 北京科技有限公司版權所有