器之心報道
機器之心編輯部
他曾說過:未來的計算架構(gòu)會是 CPU 和 GPU 的結(jié)合。
守了一天,終于揭曉!
剛剛,2021 圖靈獎公布。ACM 官方宣布 2021 年的圖靈獎授予美國田納西大學電氣工程和計算機科學杰出教授,現(xiàn)年 71 歲的 Jack Dongarra,以表彰他對數(shù)值算法和工具庫的開創(chuàng)性貢獻,其使得高性能計算軟件能夠跟上四十多年來的指數(shù)級硬件改進。
Dongarra 的算法和軟件推動了高性能計算(HPC)的發(fā)展,并在從人工智能到計算機圖形學的許多計算科學領域產(chǎn)生了重大影響。由于他的軟件被用做超級計算機性能測評標準,并且由此誕生了超級計算機 TOP500 排行榜。
圖靈獎是計算機協(xié)會(ACM)于 1966 年設立的獎項,專門獎勵對計算機事業(yè)作出重要貢獻的個人,有著「計算機界諾貝爾獎」之稱。圖靈獎的獎金為 100 萬美元,由谷歌公司贊助。圖靈獎的 mingcheng 取自英國數(shù)學家艾倫 · 圖靈(Alan M. Turing),他奠定了計算機的數(shù)學基礎和局限性。
Dongarra 通過對線性代數(shù)運算的高效數(shù)值算法、并行計算編程機制和性能評估工具的貢獻引領了高性能計算領域。近四十年來,摩爾定律使硬件性能呈指數(shù)級增長。與此同時,雖然大多數(shù)軟件未能跟上這些硬件進步的步伐,但高性能數(shù)值軟件卻做到了——這在很大程度上歸功于 Dongarra 的算法、優(yōu)化技術和高質(zhì)量的軟件實施。
這些貢獻奠定了一個框架,科學家和工程師由此在大數(shù)據(jù)分析、醫(yī)療、可再生能源、天氣預測、基因組學和經(jīng)濟學等領域取得了重要發(fā)現(xiàn),取得了改變游戲規(guī)則的創(chuàng)新。Dongarra 的工作還幫助促進了計算機體系結(jié)構(gòu)的跨越式發(fā)展,支持了計算機圖形學和深度學習的革命。
Dongarra 創(chuàng)建了一系列開源軟件庫和標準,這些工具采用線性代數(shù)作為中間語言,可以被各種應用程序使用。這些庫可為單處理器、并行計算機、多核節(jié)點和多 GPU 使用。Dongarra 的工具還引入了許多重要的創(chuàng)新,包括自動調(diào)整、混合精度計算和批處理計算。
作為高性能計算的先驅(qū),Dongarra 帶領該領域的研究者促使硬件供應商去優(yōu)化計算方法,并帶領軟件開發(fā)人員在工作中使用他的開源庫。
從筆記本電腦到超級計算機,這些努力使得基于線性代數(shù)的軟件庫被普遍用于高性能科學與工程計算。這些庫對于高性能計算領域的發(fā)展至關重要,促使功能越來越強大的計算機能夠解決具有挑戰(zhàn)性的計算問題。
ACM 主席 Gabriele Kotsis 表示:「今天最快的超級計算機在媒體上成為頭條新聞,并通過在一秒鐘內(nèi)完成萬億次計算的驚人壯舉,引發(fā)了公眾的興趣。但除了對打破新紀錄的興趣之外,高性能計算一直是科學發(fā)現(xiàn)的主要工具。HPC 創(chuàng)新也延伸到許多不同的計算領域,推動了整個領域的發(fā)展。Jack Dongarra 在引領這一領域的成功發(fā)展中發(fā)揮了核心作用。他的開創(chuàng)性工作可以追溯到 1979 年,他仍然是 HPC 社區(qū)中最重要且積極參與的領導者之一。他的職業(yè)生涯無疑體現(xiàn)了圖靈獎對『具有持久重要性的重大貢獻』的認可。」
谷歌高級研究員、谷歌研究 & 谷歌健康高級副總裁 Jeff Dean 表示:「Jack Dongarra 的工作從根本上改變并推動了科學計算的發(fā)展。他在世界上各個科學計算領域使用最頻繁的數(shù)值軟件庫上的核心工作,幫助推進了從藥物發(fā)現(xiàn)、天氣預報到航空航天工程等十幾個領域。他專注于表征廣泛的計算機帶來了適配數(shù)值計算的計算機體系結(jié)構(gòu)的重大進步。」
Dongarra 將于今年 6 月 11 日在舊金山正式出席圖靈獎頒獎晚宴。
重要技術貢獻
過去的四十多年里,Dongarra 一直是 LINPACK、BLAS、LAPACK、ScaLAPACK、PLASMA、MAGMA 和 SLATE 等庫的主要參與者或首席研究員。這些庫為單處理器、并行計算機、多核節(jié)點及每節(jié)點多 GPU 而編寫。他的軟件庫廣泛應用于高性能科學和工程計算,從筆記本電腦到世界最快的超級計算機都有涉及。
這些庫體現(xiàn)了深刻的技術創(chuàng)新,比如:
Dongarra 與國際上許多人在上述方面進行了合作,他始終扮演著創(chuàng)新驅(qū)動力的角色,通過不斷開發(fā)新技術來最大限度地提高性能和便攜性,同時使用最先進的技術保持可靠的數(shù)值結(jié)果。此外,他還領導了 MPI(Message Passing Interface)和 PAPI(Performance API)的開發(fā)。MPI 是并行計算架構(gòu)上可移植消息傳遞的事實標準,PAPI 提供了一個允許從異構(gòu)系統(tǒng)的組件收集和綜合性能的接口。他幫助創(chuàng)建的標準,如 MPI、LINPACK 基準和超級計算機 Top500 名單,支撐了天氣預測、氣候變化、大規(guī)模物理實驗數(shù)據(jù)的分析等計算任務。
評價全球現(xiàn)役超級計算機的著名榜單 TOP 500 榜單始于 1993 年。每年會在 6 月的國際超算大會(ISC)和 11 月的全球超級計算大會(SC)上更新排名。這一榜單就是由 Jack Dongarra 和勞倫斯伯克利國家實驗室的 Erich Strohmaier、Horst Simon 等人共同構(gòu)建的。
最新一期 Top500 榜單,更新于 2021 年 11 月。
人物簡歷
Jack J. Dongarra 在芝加哥州立大學獲得數(shù)學學士學位,在伊利諾伊理工大學獲得計算機科學碩士學位,在新墨西哥大學獲得應用數(shù)學博士學位。
自 1989 年以來,他一直是田納西大學杰出教授(Distinguished Professor)和橡樹嶺國家實驗室的杰出研究人員。自 2007 年以來,他一直擔任英國曼徹斯特大學的圖靈 Fellow。
Dongarra 曾獲得多項榮譽,包括 IEEE 計算機先驅(qū)獎,SIAM/ACM 計算科學與工程獎和 ACM/IEEE Ken Kennedy 獎等。他是 ACM、電氣電子工程師協(xié)會 (IEEE)、工業(yè)和應用數(shù)學學會 (SIAM)、美國科學促進會 (AAAS)、國際超級計算會議 (ISC) 和 國際工程技術協(xié)會(IETI)Fellow。此外,他還是美國國家工程院院士和英國皇家學會的外籍會員。
原文鏈接:https://amturing.acm.org/
計算機領域,圖靈測試可是大名鼎鼎,但如果用在AI上,就沒那么簡單了。本文進行了一次測試,抽取了真實產(chǎn)品的部分場景進行方便理解的再包裝,目的主要用于說明圖靈測試2.0這概念。
圖靈測試本身是一個定性的、概念性的測試,理論上隨便哪個程序都可以通過縮窄測試范圍、限定測試集然后通過所謂的圖靈測試。
換成產(chǎn)品視角,情況則有所不同,這時候能否通過圖靈測試就會限定在產(chǎn)品的邊界以內(nèi),并且拳拳到肉,一旦不靈,AI驅(qū)動的產(chǎn)品就不成立了。本次測試就是抽取了真實產(chǎn)品的部分場景進行方便理解的再包裝,目的主要用于說明圖靈測試2.0這概念。
考慮潛在的誤讀,預先做如下聲明:
1. 本測試不權威也不全面,但可復現(xiàn),過程數(shù)據(jù)有留存。可復現(xiàn)是指按照步驟每個人都可以測試。
2. 本測試不代表各個模型優(yōu)劣,只代表和設定場景的匹配度。
3. 本測試選擇模型有主觀性,在用的起和好用上做了權衡。
角色中心式計算是相對功能中心式計算說的。
到現(xiàn)在為止差不多所有我們用的APP是以功能來劃分的,職能相對單一,比如IM、搜索、外賣、打車等等。
一個角色職責的完成往往需要組合很多的功能,比如那怕一個招聘的角色它背后都必須組合十幾個工具(從IM到招聘APP等)才能完成招聘某個人的工作。
現(xiàn)在AI可以承擔這個居中調(diào)度的角色,所以應用的下一步必然是角色中心式計算。
而角色中心式計算是否成立,核心則在于AI的智商程度是否能夠處理角色邊界內(nèi)的一切事情,比如招聘的時候要能判斷當前的JD的描述是否匹配需求方的需求也要判斷一個候選人是否初步匹配對應的招聘需求等。
如果角色的每一個這種關鍵步驟的都可以用AI來完成,那對這個角色而言就不單通過對話無法區(qū)分出這是真人還是AI,從現(xiàn)實的反饋也無法區(qū)分。
這就算通過了圖靈測試2.0。
這點之前展開比較多,這里不過多重復了。
在過去的文章里一直缺一個往下一步,怎么設計和實現(xiàn)圖靈測試2.0的例子,這篇文章重點在這里。
我們抽取一個真實場景的核心步驟,從易懂的角度包裝成一個極簡的例子,來說明圖靈測試2.0的概念怎么分解,和一個具體的角色怎么融合。
假如我們打造這么一個簡單角色。
它是你的代理,可以幫助你按照你的設定在特定UGC平臺上發(fā)布你生成的內(nèi)容。(OpenAI發(fā)布會上Greg Brockman演示過類似的例子)
我們略去大量細節(jié)來描述這個角色。
這樣一來這個角色就有4個關鍵內(nèi)涵:
1. 完成你對自己做的人設。
2. 針對特定話題或者問題生成內(nèi)容。
3. 確保內(nèi)容的質(zhì)量。
4. 發(fā)布等執(zhí)行步驟。
第四步的發(fā)布等是傳統(tǒng)的RPA等技術,其實并不關鍵,后面就都略過了。
在這三個關鍵步驟里面,除了內(nèi)容生成,還需要AI做的判斷是:
1. 生成的內(nèi)容是不是真的匹配對應的話題或者問題?(內(nèi)容生成是一次性的,在多個平臺發(fā)布是多次性的,所以要經(jīng)常做匹配的判斷)
2. 內(nèi)容的基礎質(zhì)量到底怎么樣?
這兩項工作別看簡單,但在沒有AI大模型前還真的很難做好。在過去你就沒辦法針對特定問題、話題實時生成內(nèi)容,也很難實時大批量的判斷匹配度。
有點像無機物到單細胞生物。
為了縮減文章篇幅,我們進一步降低目標。
完成第一項工作就變成生成一個內(nèi)容的概要,然后大模型判斷內(nèi)容概要和問題的匹配度。這里其實可以直接用模型,也可以用Embedding算法。
兩者各有利弊,但這里只關注用模型的判斷結(jié)果。
這步驟做完之后,比如你生成的內(nèi)容是:青玉案元夕相關,那就可以匹配到古詩詞的標簽或者特定問題下面。
都測試完了之后,還需要用人來標注下最終測試結(jié)果,這樣就提供個絕對的尺度,知道AI大模型算法能進行到什么程度了。
第二項的評測簡化成使用BLEU算法來評測生成內(nèi)容的相似度。
這是避免內(nèi)容生成的重復。
為什么做這個呢?因為最終不希望反復發(fā)表一樣的內(nèi)容。即使輸入相對一致,比如人設、話題等有相似性,也不希望內(nèi)容一致。
至于是不是內(nèi)容生成的足夠優(yōu)美,就先不管了,那十分麻煩。
為了完成這個測試,需要一些真實數(shù)據(jù),這可以手動編輯或者抓取。這部分和具體你輻射的領域有關系,文藝青年、斜杠青年等需要的數(shù)據(jù)不怎么一樣。但這和RPA一樣是個傳統(tǒng)的活,大部分程序員都會做。這里為了避免不必要的麻煩,數(shù)據(jù)先不公開了。
完成了上面的工作,其實就完成了從一個角色到圖靈2.0測試集的基礎映射:關鍵是要分解角色內(nèi)涵,為關鍵判斷建立測試集。
在準備的1000條測試數(shù)據(jù)上,第一項測試最終結(jié)果是下面這樣:
這里面檢出率是指在1000條測試項目里,有多少模型判斷為匹配的,準確率是指在認為匹配的項目里面和人的標注比,準確率什么樣。
這個測試結(jié)果最終怎么用會和你的傾向性相關,顯然的數(shù)量優(yōu)先和質(zhì)量優(yōu)先結(jié)果是不一樣的。
結(jié)果里面最有意思的點是:至少在這一個判斷項上,AI還不如人。所以如果判斷項比較多,整體精度的控制會是很有挑戰(zhàn)的問題。
然后我們測試的是內(nèi)容生成部分的質(zhì)量,這部分我們不測文辭是否優(yōu)美這些,就測生成內(nèi)容的最簡單的BLEU值,其中參數(shù)都用缺省參數(shù),temperature這些就不改了。如果做的很細,這部分可以反復試多組值。但我們是為了說明圖靈測試2.0概念,就不做這部分了。
最終測試結(jié)果中得分前三的是:
全部模型的測試結(jié)果是:
這里面和原文對比是指創(chuàng)作內(nèi)容和原始種子做比較,然后統(tǒng)計BLEU值小于0.75的比例,0.85就意味著85%的內(nèi)容差異度大于0.75。(原文可以看成是內(nèi)容的種子,基于原文和提示詞生成對應內(nèi)容。)
和改寫結(jié)果比是指,同樣的方法會生成3次內(nèi)容,然后看BLEU值,把小于0.75的除以3就是上面的結(jié)果。當然提示詞中會包含加大差異度的部分。
內(nèi)容生成會比較耗費token,所以同步要記錄下token數(shù)目和費用。最終出了個價格離譜的,說明模型初選的時候選錯了。
當這種測試可以通過,那就意味著最終從技術視角看,對應的角色可以通過圖靈測試2.0。如果精度達不到一定程度,那你設定的角色在當前AI的智商下就不成立。不管多酷炫、別人多么吹捧但對解決你設想的問題都沒意義。
其次是要理解,任何一個角色的成立要涵蓋對應角色的N多方面。
用AI來做亮眼的Demo,和用AI做真正能用的產(chǎn)品,兩者的難度不在一個數(shù)量級,雖然看著都是差不多的東西。這就是一般鏡頭和哈勃望遠鏡的鏡頭的區(qū)別。
這種測試結(jié)果也可以標識從產(chǎn)品角度看到的AI的真實進展。往往和某些媒體上來的認知有很大偏差。
落地時里面的項目和復雜度當然需要進一步增加。
但如果真想用AI,那現(xiàn)在開始就需要建立你自己的測試集,并且在模型還不穩(wěn)定的時候定期測試。
假設這個測試集里面的數(shù)據(jù)采樣足夠豐富,再加上一個對接到各個大模型的測試框架,那在你的領域你會比任何人都權威,不用聽任何人的。
這就是之前說的一手體驗。
這里面對一般人有點挑戰(zhàn)的倒不是提示詞怎么寫,這部分資料比較多,反復測試可以找到解決方案,最不濟還可以問AI。
麻煩一點的是怎么組合各種算法。
不是所有的時候都只用大模型一種算法就行的。
這部分只能陸續(xù)探討,沒有唯一解決方法。
限制
上述方法現(xiàn)在可以用于支持一些比較簡單的角色。
但因為角色自身的行為模式還是基于規(guī)則,只能在限定的流程框架里面完成任務。
如果角色過于復雜,可能還需要進一步的AI進步,暫時可以先別整。
但這已經(jīng)能夠打造一些和過去不一樣的應用了。
最終再總結(jié)下圖靈測試2.0的全過程:先定義你認為有商業(yè)價值的角色,然后依據(jù)角色挖掘它的內(nèi)涵,具體成相應的圖靈測試2.0的測試集,然后就反復測試各種模型。如果能通過,那從技術角度角色也成立,產(chǎn)品可以啟動。否則就得等等。回到現(xiàn)場的一手體驗,是AI產(chǎn)品的最最關鍵的起點。
專欄作家
琢磨事,微信公眾號:琢磨事,人人都是產(chǎn)品經(jīng)理專欄作家。聲智科技副總裁。著有《終極復制:人工智能將如何推動社會巨變》、《完美軟件開發(fā):方法與邏輯》、《互聯(lián)網(wǎng)+時代的7個引爆點》等書。
本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 Unsplash,基于 CC0 協(xié)議
該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務。
因:齊默爾曼電報事件;后果:諾曼底登陸。
一戰(zhàn)期間,德國與墨西哥結(jié)盟進攻美國的絕密電報文的泄漏,這封電報就是英國破譯的,戰(zhàn)后,英國還是保持著對德國通訊的監(jiān)聽。
1943年3月,圖靈成功破解德軍難度最高的密碼系統(tǒng),最快幾分鐘,最慢一小時就可以完全譯碼。破譯出來的情報協(xié)助英軍打擊德軍的U-潛艇,并帶來了諾曼底登陸的勝利。
而在這一年之前,英軍在二戰(zhàn)中打得頗為辛苦。
在亞洲戰(zhàn)場和海洋上,日本摧毀了英軍的海軍和空軍優(yōu)勢,騎著自行車打敗英軍,讓英軍輸?shù)靡凰俊?/p>
北非戰(zhàn)場上,德國和意大利的聯(lián)合進軍,憑借機械迅速推進,威脅蘇伊士運河補給線。在德軍的迅猛攻擊中,英軍龜縮在阿拉曼地區(qū),最后英國壓上了眾多資源才反敗為勝。
而蘇聯(lián)那邊已經(jīng)取得了斯大林格勒戰(zhàn)役的勝利,影響力進一步擴大。
為了盡快取得勝利,也為了自己增加戰(zhàn)后籌碼,英國加大了破解德軍情報的力度,一戰(zhàn)時他們就利用過情報打敗德軍。
但是今時不同往日,德國在二戰(zhàn)中使用的恩尼格碼密碼機,被稱為是“不可被破解的密碼機”。
恩尼格密碼機
這是一種有三個小齒輪,小盒子一樣的機器,由發(fā)送方和接收方都有一部。它通過復雜的加密運算自動產(chǎn)生密鑰和密文,而且加密機制會頻繁更新,加密方案總共有一億億多種。
于是英國軍情六處召集了一批天才和專家,專門破譯德軍情報密碼,其中就有劍橋大學的數(shù)學天才阿蘭·圖靈。
但英國正式宣戰(zhàn)前,24歲的圖靈還在劍橋大學讀書,1937年,他首次提出一種輔助數(shù)學研究的機器,后來被人稱為“圖靈機”。
第二年,他進一步將這些計算機理論嚴格化,在數(shù)學邏輯理論上有很多成就。圖靈機的算法,還有很多基礎邏輯被認為是現(xiàn)代計算機科學的基礎,因此圖靈被稱為計算機科學之父。
正因為他在數(shù)學和計算機領域的突破性成就,英國軍情六處注意到了這位天才。
阿蘭·圖靈他主要在邏輯理論上對計算機有重要貢獻,馮·諾依曼則在計算機技術和數(shù)值分析的開拓性工作。
圖靈來到情報中心后,震驚的發(fā)現(xiàn)當時大概有10000個人,都在廢寢忘食破譯密碼,而方法就是一個字:猜,偶爾運氣好才對幾個詞。
人怎么能和機器比呢?
靠人力行不通,圖靈認為要用機器打敗機器。而且,眼下正是驗證圖靈機運算理論的好機會!
在此之前,法國人和波蘭人也曾試圖解密但都沒有成功,于是他們把研究成果和情報統(tǒng)統(tǒng)交給了盟友英國。
圖靈認真研究了情報資料,發(fā)現(xiàn)德軍用的是“換字母”這種基本的加密方法,于是他利用密碼機的一些弱點,鎖死了“換字母”的功能。不能換字母后,密碼機加密的可能性就降低為10萬種了。
10萬的數(shù)字雖然還是很大,但跟一億億的運算比起來容易了很多。
為了運算這10萬種可能性,圖靈運用他在運算方面的理論,帶領200多位同事制造了一臺大型機器,起了個名字叫作“炸彈”。
龐大的炸彈機
這個機器有上百個齒輪,模擬人們進行數(shù)學運算,運算比人快很多,每秒可以讀2000個字符,炸彈機越多,計算量就越大。
有了炸彈機,解密還差一步,突破口是一些不起眼的天氣預報。
德軍司令部有個習慣,是每天早上都會發(fā)布天氣預報。圖靈發(fā)現(xiàn)了這個容易被常人忽視的細節(jié),他通過德文“天氣”這個詞匯來猜測對應的密文字母,然后再調(diào)整機器齒輪的擺放沒日沒夜地運轉(zhuǎn),看看哪些齒輪的機器是正確的就繼續(xù)運轉(zhuǎn)下去。
有意思的是,德軍一些操作人員也“幫了大忙”。按規(guī)定,密鑰是三個字母的隨機組合,但是操作人員偷懶,一般會選擇鍵盤上連續(xù)的三個字母發(fā)出去,這給圖靈他們破譯密碼降低了難度。
圖靈破解密碼機讓二戰(zhàn)提早了起碼兩年結(jié)束,至少拯救了 2000 萬人的生命。
不幸的是,他因為同性戀身份遭到審判,加上當時有英國外交部密碼員叛逃蘇聯(lián),在二戰(zhàn)后的特殊冷戰(zhàn)環(huán)境里,特勤局開始系統(tǒng)調(diào)查這些掌握英國機密的人員,圖靈自然也在審查之列。
30年,蘇聯(lián)對外偵察局最大成就:招募了五名來自劍橋的英國間諜,簡稱“劍橋五杰”。
戰(zhàn)后,英國判處他“嚴重猥褻罪”并接受“化學閹割”,圖靈最后服毒自殺,年僅四十一歲。
后果:諾曼底登陸
1944年6月6日,盟軍憑借破譯的情報,抓緊時機登陸諾曼底,進入法國成功開辟了歐洲大陸的第二戰(zhàn)場。
結(jié)論:圖靈在二戰(zhàn)中為和平解密,在計算機領域也做出了許多理論貢獻,現(xiàn)在人類計算機界的最高獎,就被命名為“圖靈獎”。