年6月18日,美國金融圈,發生了一件大事,英偉達的股價一天內上漲了3.6%,市值飆升至了3.34萬億美元,一舉超過了微軟和蘋果,成為全球市值最高的上市公司。
雖然幾天后,股價又出現了回調,但無疑的一件事是在AI當道的今天,英偉達絕對是全球科技企業中最風光的一個。
以至于英偉達CEO黃仁勛在采訪中可以毫不避諱地說道「我們就是AI世界的發動機」。
黃仁勛這話也絕對不是在吹牛皮。生成式AI、自動駕駛、加密貨幣、元宇宙,這些風口上的科技,背后都離不開英偉達所生產的顯卡的支持。
出生于臺南的黃仁勛,今年6月訪臺時,在科技圈掀起了一陣現象級的追星熱潮。16年前,黃仁勛對顯卡行業做出的大膽預言現已精準實現。
如今他又說了哪些預言,給了年輕人怎樣的忠告呢?為什么他會說臺灣站在這場新的工業革命、AI革命的中心呢?今天我們來聊聊這位AI教父的故事。
點擊此處觀看完整視頻
1963年,黃仁勛出生于臺南。9歲時,他和哥哥被送往美國親戚家,由于親戚家的居住條件有限,初到美國的日子,他和哥哥是在肯塔基州的一所寄宿學校里度過的。
這所學校的優點是學費便宜,缺點是生源混雜,有不少問題少年,黃仁勛后來回憶道:「我是學校里唯一沒有折疊刀的男孩。」
幾年后,黃仁勛的父母終于獲準來到美國,定居在俄勒岡州,兄弟倆與父母團聚。
高中期間,黃仁勛表現出了華人小孩的兩大特點:成績優異;有運動才能。
他參加了學校的數學、計算機和科學俱樂部,跳了兩級,16歲就高中畢業了,15歲還拿到了乒乓球比賽全美雙打第三名。
后來,黃仁勛進入俄勒岡州立大學(OSU),攻讀電子工程專業。1984年,又進入斯坦福大學讀碩士。
在大學實驗室里,黃仁勛遇到了未來的妻子洛瑞·米爾斯Lori Mills。
據黃仁勛回憶,當時電子工程專業有250個學生,但只有三個女生,男生們爭相吸引洛瑞Lori的注意,但黃仁勛卻憑借一句「你要看我作業嗎?」成功俘獲了女神的芳心。
靠著教Lori功課的名義,黃仁勛順利與其交往并結婚,相伴至今,兩人還育有兩個孩子。交往時,Lori曾問黃仁勛,你將來想做什么?
黃仁勛說道「30歲時,我將會是一家公司的CEO」。
所以有人開玩笑說,英偉達的誕生就是黃仁勛為了兌現當年在女友面前吹下的牛。
大學畢業后,黃仁勛曾先后在芯片公司AMD和LSI Logic工作過,獲得了豐富的技術經驗。
1993年,30歲的黃仁勛與另外兩名志同道合的工程師好友克里斯·馬拉科夫斯基Chris Malachowsky和柯蒂斯·普里姆Curtis Priem共同創立了英偉達公司。
三人最初是在黃仁勛家附近的一家叫做Denny’s的連鎖餐廳里,討論創業方向的,那里有可以免費續杯的咖啡,他們一坐就是四五個鐘頭。
有意思的是,80年代時,上大學的黃仁勛曾在這家店里打工,他刷了無數的盤子和杯子。后來,他常常自我調侃說,我應該是Denny’s最棒的洗碗工了。
不過,羅馬不是一天建成的,英偉達走向巔峰的路上也曾九死一生。
創立之初,黃仁勛在前東家的幫助下,拿到了紅杉資本和薩特·希爾資本各100萬美金的投資。
當時正處于PC革命爆發之前,Windows 95 還沒上市,但黃仁勛已經看到了3D游戲市場的巨大潛力
他預想PC時代到來后,全球各地的游戲玩家們,人手一臺游戲機,聯機打怪,在虛擬世界中,體驗3D游戲帶來的超強視覺沖擊。英偉達決定將產品聚焦于圖像處理領域。
1995年5月,英偉達推出了他們的第一款產品---顯示芯片NV1,當時還沒有顯卡的概念
這款產品又被稱作「多媒體加速器」,在技術上整合了2D和3D圖形處理,并具備視頻處理、聲卡、游戲端口等功能,算是市面上比較先進的產品。
但由于其不菲的定價,NV1的銷量一直低迷,唯一的好消息是,NV1集成了聲卡的功能引起了日本游戲巨頭世嘉的注意
世嘉希望英偉達為他們的新款游戲機研發顯示芯片NV2,并甩出了一張700萬美金的訂單,英偉達一時間干勁十足。然而,NV2的研發很快慘遭碰壁。
當時3D圖形處理技術方興未艾,業內并沒有統一的標準,大家走的技術路線都不一樣,英偉達選擇的是「四邊形紋理貼圖」。
但1995年底時,業內已有風聲傳出,微軟將發布與Windows 95兼容的Direct 3D標準,該標準將只支持「三角形紋理貼圖」。
可英偉達并未在第一時間意識到外部環境的變化,依然執著于「四邊形紋理貼圖」的路線。
這就等于自動舍棄了Windows電腦的市場,要知道90年代Windows操作系統在PC市場上擁有超過90%的市場份額,這意味著NV2就算研發出來了也無法投入使用。
等黃仁勛意識到問題的嚴重性時,公司賬上的錢只夠維持30天了,人員也從100多人裁到了只剩三分之一。
萬般無奈之下,黃仁勛硬著頭皮找到了世嘉社長入交昭一郎,坦白地承認了英偉達的研發方向錯了,讓世嘉抓緊時間更換合作伙伴
但同時說道英偉達還是希望世嘉能夠支付700萬美金的定金,因為如果沒有這筆錢,英偉達就要破產了。
可天下哪有這樣的好事:你東西沒給我研發出來,耽誤了我的時間不說,還要我給你付錢?
說出來大家可能都不信,入交昭一郎還真就答應了黃仁勛的請求。
后來,據入交昭一郎所說,他對黃仁勛的印象很好,覺得黃仁勛是個真誠又充滿激情的年輕人,相信他未來一定能成功,并愿意在他困難時,拉他一把。
也許這就是所謂的「人格魅力」吧。
拿到700萬美金的英偉達逃過了「30日生死劫」,黃仁勛迅速調整研發方向,采用微軟的Direct 3D標準,并從游戲設計公司「晶體動力」挖來了大衛·柯克David Kirk博士擔任首席科學家。
1997年4月,英偉達第三代產品NV3即Riva 128正式推出,憑借著其100M/秒的像素填充率成為了當時市面上唯一真正具有3D加速能力的顯示芯片。
不到一年,Riva 128的出貨量就突破100萬片。英偉達終于脫離險地,活了下來。 此后,黃仁勛偶爾還會將30 days掛在嘴邊。
NV2的研發失敗給黃仁勛好好上了一課,讓他明白,想要在競爭中生存下來就要向市場學習,要足夠謙遜,而且要懂得及時糾錯,絕不把時間浪費在悔恨上。
1998年,英偉達與臺積電達成戰略合作,將其產品交付臺積電生產,自己則專注于研發。此后數十年間,黃仁勛與臺積電創始人張忠謀也結下了深厚的情誼。
但英偉達真正的翻身仗,還要屬1999年8月推出的革命性產品GeForce 256。
1999年8月,英偉達發布了Geforce 256,并首創了圖形處理器GPU(Graphics Processing Unit)一詞。
此后,英偉達就把自己和「GPU發明者」這個頭銜深度綁定起來,不得不說這是非常聰明的一步棋。
彼時的芯片市場是英特爾的CPU所稱霸的世界,英偉達想要殺出一條血路,就必須另辟蹊徑,于是他們就想到了營銷GPU這一概念。說到這兒,就不得不講講CPU和GPU的區別了。
CPU的全稱是Central Processing Unit中央處理器,可以被認為是計算機的心臟,負責處理大部分指令,擅長邏輯控制和復雜的運算。
CPU的架構包括運算器ALU(Arithmetic/Logic Unit)、控制器(Control Unit)、緩存(Cache)等等
由于需要應對不同類型的數據計算,還要響應人機交互,CPU需要更大的緩存,保存各種任務狀態,以降低任務切換時的時延。
它也需要更復雜的控制器,進行邏輯控制和調度。 相對而言,真正干活的運算器ALU,也就是我們俗稱的「核」,就被擠得占比較少了。
而90年代中后期,蓬勃發展的游戲和多媒體產業,對計算機的3D圖像處理和渲染能力提出了更高的要求,傳統CPU就有點不堪重負了。
GPU的出現就是為了分擔CPU處理圖像的工作重擔的。
從它的名字圖形處理器Graphics Processing Unit中就可以看出,GPU的任務單一且明確,它要做的,就是圖形渲染。
而圖形是由海量像素點組成的,屬于類型高度統一、相互無依賴的大規模數據,所以GPU就被設計成了擅長大規模并發計算的架構,需要在在最短的時間里,完成大量同質化數據的并行運算。
并行運算,當然需要更多的「核」了,又因為其它的「雜活」少,GPU就不需要特別大的緩存和復雜的控制器。一般而言,CPU的核數也就幾十個,GPU的核數可以達到幾千個甚至上萬個。
業界喜歡把CPU比作幾個學識淵博的老教授,什么復雜的任務都能做,但得一項一項來。
而GPU就像是一大群小學生,雖然只能做加減乘除,但架不住人多力量大,你要是需要計算一億次100以內的加減法,想想也知道,最好的辦法肯定是雇一大幫小學生一起算。
英偉達曾發布過一支視頻,形象地解釋了CPU和GPU在處理圖形上的區別。CPU就像是一把精準的機關槍,但子彈需要一發一發的射出來。而GPU是成千上萬發子彈同時射出的。
GPU是為圖形處理而生的,但歪打正著,在深度學習當道的今天,用于處理海量訓練數據也能事倍功半,這正是英偉達稱霸AI芯片市場的原因,不過這都是后話了。
英偉達在推出Geforce 256的同年年初,在納斯達克成功上市,IPO價格為每股12美元,估值6.26億美元,現如今英偉達的市值已超過了3萬億,漲了4800倍。
一直以來,英偉達就在干一件事:設計和研發GPU。如今,我們常常將GPU稱為「顯卡」,但其實確切地說GPU 是顯示卡的芯片,也是顯卡的「心臟」。
而顯卡是把GPU、顯存、接口等部件集合在一起的計算機擴展卡。
英偉達只出貨GPU,也就是顯卡的心臟,而顯卡的生產則交給了剛才我們提到的全球第一家也是最大的一家集成電路代工制造商臺積電TSMC。
在臺積電生產力的加持下,黃仁勛提出了與「摩爾定律」并稱的「黃氏定律」。
摩爾定律是英特爾創始人之一的戈登·摩爾在1965年提出的,核心內容為:集成電路上可容納的晶體管數目在每過18個月到24個月會增加一倍,即每隔2年,CPU的性能會翻一倍。
而黃仁勛則說,GPU的發展速度將遠遠快于CPU。英偉達的核心戰略就是產品將每6個月升級一次,性能翻一番。
多年前,黃仁勛在接受采訪時被問到,英特爾也即將推出聚焦于圖形處理的產品,英偉達會不會感到有壓力?
黃仁勛問,英特爾的新產品什么時候問世啊?現場觀察員說,2010年年底,黃仁勛驚訝地說道,這么久啊,言外之意是,到時候英偉達的產品早就更新換代了好幾次了。
我們都知道,顯卡根據形態可以分為集成顯卡(iGPU,integrated GPU)和獨立顯卡(dGPU,discrete GPU)。
集成顯卡內置于CPU中,與CPU共享內存。獨立顯卡則是一個獨立的個體,有單獨的顯存,可以直接加裝到電腦主板上。
英偉達專注于獨立顯卡市場,而在該領域,ATI曾是英偉達最大的競爭對手。用戶們常把搭載英偉達GPU的顯卡稱為「N卡」,把搭載ATI GPU的顯卡稱為「A卡」。
ATI是一家加拿大公司,比英偉達早成立8年,90年代末開始進軍獨立GPU領域。2000年,ATI發布了繼Geforce 256之后第二款真正的GPU——Radeon 256。
其性能較英偉達的Geforce 256更優。此后的多年里,英偉達和ATI一直處于纏斗的狀態,2004年到2005年間,ATI的市場占有率甚至一度超過英偉達。
轉折出現在2006年7月,CPU市場上僅次于英特爾的第二大供應商AMD,以54億美元的價格收購了ATI,A卡上的標志從ATI換成了AMD。
黃仁勛聽到這個消息后說道「ATI 這是打算認輸了,讓我們成為世界上唯一一家獨立的圖形芯片公司吧!」
曾有AMD的離職員工爆料稱,AMD最初是打算收購英偉達的,但黃仁勛堅持在公司合并后,依舊由自己擔任CEO,最終AMD退而求其次,選擇了英偉達的對手ATI。
事實證明,黃仁勛的堅持再次幫了他,為了收購ATI,AMD幾乎用光了賬面現金,并產生了25億美元的債務。
因為債務危機,二者的合并沒能出現1+1大于2的「合力」,反倒讓英偉達撿了個大便宜,趁機重新找回了市場競爭力。
雖然整合完ATI之后,AMD也發起過數次反攻,但大勢已去,昔日「獨顯雙雄」的局面早已一去不復返。
2007年之后,英偉達在獨立GPU市場的占有率一直遙遙領先于AMD。
一個題外話是,在英偉達與ATI、AMD纏斗的那些年里,黃仁勛還意外喜提了「兩彈元勛」的稱號。
2010 年 12 月,AMD 推出了高端顯卡 HD6900 系列,迫于競爭壓力,三個月后,英偉達就推出了對標產品GTX590顯卡。
GTX590性能強悍自不用說,但發熱量和功耗也是高的嚇人的。喜歡搞機的朋友,買了新顯卡之后,又偏偏愛玩超頻。
所謂「超頻」就是讓芯片在高于廠方所設定的工作頻率的狀態下工作,從而提高它們的性能。
結果就是,超頻之下,GTX590竟然起火了,運氣不好的玩家,連同CPU、內存、主板和電源也一起報銷了,此后GTX590就被網友們戲稱為「核彈」。
之后推出的GTX690,GTX790,雖然功耗有所改善,但網友們仍然對其發熱不滿意,還將GTX690戲稱為「戰術核顯卡」。
本來這只是顯卡圈兒里的一個梗,但不知道哪個有才的網友,把這個「核顯卡」的梗寫進了國內的百度百科。
更搞笑的是,2014年,甘肅衛視制作的一檔軍事節目直接引用百度百科的文案,連資料的正確性都沒有核實,主持人就這么一本正經的說出了以下這段話
搭載690戰術核顯卡的火箭推進榴彈,一發就可以摧毀一個航母戰斗群。
顯卡圈最大的名場面就這么誕生了,從此,英偉達核彈廠名聲算是坐實了,CEO黃仁勛更是被冠上了「兩彈元勛」的稱號。
網友們做了一系列的表情包來調侃老黃,再加上英偉達早期曾推出過Riva TNT系列顯卡,驅動的名字叫雷管(Detonator),這似乎更加印證了老黃是個做軍火的。
插曲講完了,我們回歸正題。2006年,AMD收購ATI的同一年,英偉達發布了CUDA架構,這成為了它邁向巔峰的重要一步。
CUDA的全稱是Compute Unified Device Architecture,是英偉達為GPU設計的一種并行計算平臺和編程模型
它使開發人員能夠使用C語言,C ++,Fortran等編程語言直接在GPU上編程。
這么說,大家可能很難理解CUDA究竟是個什么東西,我換一種說法吧。
CUDA出現之前,GPU只是一個負責在屏幕上繪制圖像的「圖形處理單元」;有了CUDA,GPU的算力真正變得通用
因為不同領域的開發者用可以他們已經熟悉的編程語言在GPU上編程,驅動GPU完成不同的計算任務。
GPU如今能被廣泛應用于深度學習、大數據處理、挖礦等領域,全靠CUDA的支撐。
英偉達決定開發CUDA的契機,說起來也相當有意思。
早在2000年時,斯坦福大學計算機系的一位研究生伊恩·巴克Ian Buck將32塊GeForce顯卡連接在一起,外加 8 個投影儀來玩游戲《雷神之錘》(Quake)。
GeForce顯卡附帶了一種叫做「著色器」(shader)的原始編程工具。
伊恩Ian Buck黑進了著色器,訪問了下面的并行計算電路,將幾十個GeForce改裝成了一臺低成本的超級計算機。
伊恩Ian Buck說,這是世界上第一臺8K分辨率的游戲機,它占據了整面墻,看起來棒極了。這一事件讓英偉達意識到了GPU在超級計算領域的巨大潛力。
英偉達首席科學家大衛·柯克David Kirk認為,從長遠看,讓原本只做3D渲染的GPU技術通用化,有重大戰略意義。
后來,Ian Buck入職了英偉達,現在是英偉達的一名副總裁了。
決定啟動CUDA項目后,英偉達每年砸到CUDA上的研發成本至少5億美元起步
這些年,英偉達在將GPU轉化為更通用的計算工具上投入了將近100億美元,反映在賬目上就是成本增加、利潤率降低,甚至虧損。
黃仁勛要讓每一顆英偉達GPU都支持CUDA,但這意味著芯片面積增大、散熱增加、成本上升、故障率增高
這一舉動在當時被外界視為不計成本的瘋狂之舉,更何況,CUDA只是一個與公司核心業務關系不緊密的項目。
即使黃仁勛苦口婆心地闡述CUDA的價值,但華爾街的分析師們并不買賬,要知道,并不是所有人都像黃仁勛一樣具有前瞻性眼光,華爾街甚至將CUDA估值為0。
投資人也都覺得「你一家游戲顯卡公司為啥要花錢去做夢呢」。
2008年,英偉達還經歷了「顯卡門危機」,G84、G86系列顯卡由于存在封裝缺陷,導致裝有這些顯卡的筆記本電腦無法啟動,或啟動后出現黑屏等現象
客戶和投資人們對英偉達的不滿上升到了極點。那一年,英偉達的市值蒸發了76.3%。
直到2012年,事情發生了轉機。在之前AI簡史的那期視頻中,我們講到了人工智能的發展曾2次陷入低谷。
2012年,「深度學習之父」杰弗里·辛頓教授帶著他的兩位學生亞歷克斯·克里熱夫斯基和伊利亞·蘇茨克韋爾茲參加了全球最權威的計算機視覺大賽ImageNet大賽
他們設計的深度卷積神經網絡AlexNet以壓倒性的優勢奪得了冠軍,此事件標著這一直持續至今的連接主義學派(connectionism)人工智能研究熱潮的復蘇。
對AI的發展歷程好奇的朋友,還請回看之前的視頻。
而辛頓團隊訓練AlexNet模型時,用的就是兩塊雙GPU的GTX580顯卡。
AlexNet有6000萬個參數和65萬個神經元,完整訓練ImageNet數據集至少需要262千萬億次浮點運算
但4個英偉達GPU在一個星期內,就完成了訓練,如果用同樣數量的CPU,訓練時間可能長達1-2年。
2012年早些時候,谷歌團隊曾用1.6萬個CPU訓練了一個可以「識別貓」的神經網絡,但準確度卻遠比不上只用了4個GPU訓練出來的AlexNet模型。
辛頓學生亞歷克斯所寫的描述AlexNet的論文在此后十幾年前被引用了超過13萬次,成為了計算機科學史上最有影響力的論文之一。
可以說是深度學習算法和GPU的算力一拍即合,引發了人工智能大爆炸的時代。
辛頓說:「用專門的GPU訓練神經網絡速度要比通用CPU快100倍」,然后又補充說道「如果沒有CUDA,要進行機器學習就太麻煩了!」
一夜之間,英偉達從一家圖形公司搖身一變,成了一家為人工智能的發展提供引擎的公司,昔日不受待見的CUDA成了新時代的寵兒。
2016年8月,英偉達向一家初創公司捐贈了第一臺裝載了8塊GPU的專用于人工智能領域的超級計算機DGX-1,價值12.9 萬美元。
黃仁勛在機身上留下了一句話:「為了計算和人類的未來,我捐出世界上第一臺DGX-1。」
這家初創公司的聯合創始人艾隆.馬斯克Elon Musk、山姆·奧特曼Sam Altman以及一眾早期員工也激動地在機身上簽下了自己的名字。
6年后的2022年11月,這家初創公司發布了ChatGPT,一鳴驚人,沒錯這家公司就是Open AI。
ChatGPT發布一周后用戶破百萬,兩個月后用戶數破億,英偉達芯片的市場需求也隨之開始暴增。
英偉達與Open AI之間的故事乍看之下是一段「投桃報李」的緣分,但細想,何嘗又不是黃仁勛對于AI領域的提前押注呢。
其實早在2017年時,英偉達還曾被天上掉下的另一塊大餡餅砸中過。
2017 年,加密貨幣迎來大牛市,吸引了大量礦工「挖幣」,挖比特幣需要「礦機」,而礦機運行依賴的哈希算法需要算力,英偉達的GPU正是算力的來源。
全球顯卡銷量急劇增加,價格也水漲船高。以最受礦工歡迎的GTX 1060型號顯卡為例,2017 年 5 月之前的拿貨價約為 1650 元一張,2017 年 6 月后就漲到了 2900 元左右。
英偉達后來還推出了多款取消IO輸出接口的GPU,僅支持OpenGL,這意味著此類GPU沒法用于游戲,業內人士將這類GPU稱為「專業礦卡」。
受益于挖礦潮,英偉達的 2018 財年全年收入創下了 97.1 億美元的新高, 成為了加密貨幣大牛市背后的大贏家,天降財富。
如今,英偉達的市值(3.02 trillion USD)是騰訊(3.52 trillion HKD)的6.7倍、臺積電(25.39 trillion TWD)的3.8倍,英特爾(132.26 billion USD)的22.8倍, AMD(265.58 billion USD)的11.3倍。
雖然縱觀整個GPU市場,英特爾依舊占有百分之六、七十的市場份額,但這是因為大分部英特爾CPU都內置了相應的集成GPU(iGPU)。
在利潤豐厚的獨立GPU市場,英特爾幾乎沒有話語權。截止到2023年底,英偉達GPU在獨顯市場中占比80%,AMD占比19%,英特爾占比1%。
如果單把AI GPU市場拎出來看,英偉達的產品占比甚至達到了98%。
據投行瑞杰金融的估計,每枚英偉達H100 AI芯片的制造成本是3320美元,而售價是25,000至30,000美元,也就是說英偉達AI芯片的利潤率逼近1000%,但依舊供不應求。
2024年3月,英偉達重磅推出了Blackwell B200 GPU 和 GB200 超級芯片。Blackwell系列芯片的名字來源于數學家、博弈論家、概率論家 大衛·布萊克威爾。
英偉達高級科學家 Jim Fan稱其是「新的性能野獸」。Blackwell B200 GPU擁有 2080 億個晶體管,性能達到了 H100 的 2.5 倍。
GB200 超級芯片更是將2個GPU 與一個CPU相結合,在具有 1750 億個參數的 GPT-3大型語言模型(LLM) 基準測試中,GB200 的性能是 H100 的 7 倍,訓練速度是 H100 的 4 倍。
OpenAI CEO Sam Altman 在看完英偉達新品發布會后,在推特上發文稱「這是人類歷史上最有趣的一年,但會是未來最無趣的一年。」
3D游戲、加密貨幣、人工智能,英偉達一次次地踩中風口,成就了它如今AI霸主的地位。這其中當然有運氣的成分,但黃仁勛的前瞻性眼光也是毋庸置疑的。
16年前,在一檔訪談節目中,主持人將芯片行業的格局比作了「三國演義」,英特爾是曹操,AMD是劉備,英偉達是孫權,并問黃仁勛同意這個劃分嗎?
黃仁勛表示,「20年之后的世界是現在的我們無法想象的,你現在提到的幾個巨頭可能都不會在未來繼續攪弄風云。
如果以狹窄的眼光看待世界,那么你的戰略部署也必將是狹窄的」。
8年前,黃仁勛也曾預言,很快AI將掀起浪潮。那么如今這位AI教父對未來又抱著怎樣的看法呢?
2023年3月,黃仁勛先是喊出了那句振奮人心的「AI的iPhone時刻已經來臨」
幾個月后,黃仁勛接受了知名未來學家瑞安·帕特爾Ryan Patel的采訪,采訪中,黃仁勛表示
「這是人類第一次看到通用計算和AI兩種技術轉型同時出現,算力的進步結合深度學習的發展,將會帶來1+1大于2的效果,甚至會讓計算技術每10年進步一百萬倍。
2年后,英偉達乃至整個行業就會面目全非」。
2024年3月初,黃仁勛在母校斯坦福大學舉辦的一場活動上預測說,AI將在五年內通過所有人類測試,包括數學測試、推理測試、歷史測試、生物學測試、醫學考試、律師考試,以及你能想象到的每一個測試
屆時你可以說AI已經擁有了人類的智慧,AGI時代將全面到來。
這與我們在之前視頻中扒出的一份、據說是從Open AI內部泄露的文件「Q*信息」的內容高度一致。
「Q*信息」也聲稱2027年將會出現可以執行通用任務、可以像人類一樣思考和學習,具有自主意識和情感的「通用人工智能」(Artificial General Intelligence)。
不久前,在臺北舉辦的國際電腦展(COMPUTEX 2024)上,黃仁勛發表了一場主題為「開啟產業革命的全新時代」的演講。
演講中,黃仁勛對未來AI的發展做出了展望,我將其歸納為了3大預言。
第一,未來全球AI產業規模將高達100萬億美金,比之前IT時代的3萬億美元高出33倍以上,具有強大的市場前景。
第二,未來個人電腦,也就是PC,才是AI的主要載體,AI應用程序將充斥每個人的生活。第三,實體人工智能將融入我們的日常生活,AI將理解這個物理世界,機器人將無處不在。
黃仁勛還曾表達過一個觀點是,未來首先消失的職業可能就是「程序員」了。
在過去20年間,幾乎所有教育界、科技界大佬們都在不斷強調學習計算機科學和編程的重要性,但黃仁勛的卻說
「事實上,真相幾乎完全相反。在人工智能的幫助下,未來每個人都可以成為程序員,人類的自然語言就是編程語言。」
黃仁勛認為年輕人應該更專注于學習生物、教育等AI所無法完全替代人類的領域的知識。在以往的不少演講中,黃仁勛留下過無數給年輕人的寶貴建議。
在 2024年斯坦福大學經濟峰會(SIEPR)上,當被問到「關于成功,有什么給斯坦福學生的建議」時
黃仁勛說,「我覺得我最大的優勢之一就是我的期望很低,但是大部分斯坦福畢業生都對自己有很高的期望,當然了,你們也絕對配得上高期望,你們來自世界上最好的大學之一,成績拔尖,是同輩中的佼佼者。」
但黃仁勛接著說道「對自己期望非常高的人,往往韌性(resilience)也低,不幸的是,韌性對成功來說至關重要。」
黃仁勛強調,「成功不是來自于智慧,而是來自于品格,而品格是在苦難和挑戰中磨礪出來的。我希望年輕人有機會經歷大量的痛苦和磨難。」
2023年5月,黃仁勛受邀在臺大畢業典禮上致辭。
3年前,黃仁勛被授予了臺大名譽博士的學位,致辭中,黃仁勛講述了他創業過程中經歷的3次低谷:NV2的研發失敗;CUDA的飽受質疑;以及退出手機芯片市場。
他想借由這三件事告訴即將踏入社會的臺大學子3個道理:1)困境中,要懂得謙卑地尋求幫助。
2)要實現長遠的愿景,就要有承受近期苦難的能力。
3)有時候「放棄」也是一種智慧,有舍才能有得。
最后,黃仁勛用這樣一句話結束了他的致辭:「跑起來,別用走的!為了尋找食物而跑,或者為了避免成為獵物而跑,無論為了什么都要跑起來。」
作為一名臺南出生的企業家,黃仁勛對臺灣有著特殊的感情。他曾在硅谷的一個臺灣同鄉聚會上說道「這場新的工業革命、AI革命,臺灣就在中心,臺灣所做的工作非常重要。」
在剛剛結束的臺北國際電腦展(COMPUTEX 2024)上,黃仁勛也表示,「臺灣是英偉達開始的地方,是臺灣的合作伙伴們創造了世界級的AI基礎架構」。
黃仁勛會有這樣的感慨,并不是沒有理由的。與英偉達合作了近30年的臺積電,是全球最大的芯片代工企業。黃仁勛曾不止一次的在公開場合提到臺積電對英偉達的幫助。
90年代末,英偉達研發RIVA 128芯片,由于生產的復雜性,他們急需一家專業的代工廠來輔助他們,他找遍了美國的代工企業,但沒人理會他們這個初創小公司。
最后是臺積電的張忠謀向黃仁勛伸出了援手。接到張忠謀電話時,黃仁勛立刻對旁邊的人大叫道「噓!大家都安靜,Morris Chang打給我了!」
而這通電話就成了2家公司合作的開端。
成為科技圈新貴后,每次到訪臺灣,黃仁勛及其家人都會被大批粉絲和狗仔隊跟隨,而黃仁勛行事也相當親民。
一次,他在臺灣街頭,偶然入鏡了兩位年輕歌手的直播,化身好奇寶寶地老黃還還點播了一首 Lady Gaga 的歌,跟著唱了起來。
去年,英偉達市值飆升至萬億市值的前夕,黃仁勛卻跑到了臺北夜市,拎著一袋麻花到處閑逛,此時的他也許想到的是項羽的那句感嘆吧:富貴不歸故鄉,如衣繡夜行,誰知之者。
未來AI行業是否會一直沿著深度學習或者說連接主義學派的方向發展,還是一個未知數
英偉達是否會一直站在行業巔峰也未可知
但無疑的一點是,老黃身上的特質正應了那句話:成小功可能是運氣,成大功絕不會是偶然。
TX 40 SUPER系的最后一位成員GeForce RTX 4080 SUPER在2024年1月的最后一天如期而至。相比RTX 4070 SUPER的驚艷亮相,RTX 4070 Ti SUPER的加量不加價,RTX 4080 SUPER又會以怎樣的姿態面世?從NVIDIA的給出的資料和說法來看,這塊顯卡加量還降價了!嘿,還有這種好事兒?當然必須得來親自測試一番看看!
首先來看RTX 4080 SUPER這顆GPU的規格。RTX 4080 SUPER的核心代號為AD103-400,隸屬于AD103的RTX 4080家族。從硬件規格配置上來看,RTX 4080 SUPER共配置了7個GPC,40個TPC模塊組成80組SM單元和10240個CUDA核心,這樣的配置與前一代的RTX 3080 Ti處于同一水準,但Ada Lovelace更高效和先進的結構無疑會使RTX 4080 SUPER的性能表現遠勝RTX 3080 Ti,這一點毋庸置疑。
80個SM單元和10240個CUDA核心的配置使得RTX 4080 SUPER相比RTX 4080來說只能算是微小的升級,再加上幾乎相同的16GB GDDR6X顯存配置,使得二者的硬件規格差距僅有5%左右,具體到應用環境下,估計這個性能上的差距還會有縮小。而與當前Ada Lovelace的新旗艦RTX 4090 D相比,RTX 4080 SUPER與其在硬件規格上的差距就比較大了,達到了40%以上,因此RTX 4080 SUPER的性能相比RTX 4090 D來說應該是差距比較明顯的。
NVIDIA目前對RTX 4080 SUPER給出的指導首發價格是8099元,相比當初RTX 4080首發時的9499元大幅降低了1400元。結合RTX 4080 SUPER的硬件規格配置,它應該是針對RTX 4080的微小升級產品,所以在性能上RTX 4080 SUPER相對RTX 4080的提升不會太高。更低的價格和性能上的微小提升帶來了更高的性價,以此在高端顯卡市場上推出極具性價比的熱點產品,這或許就是RTX 4080 SUPER面世的最大意義。
外觀上,RTX 4080 SUPER仍然延續了RTX 40 SUPER系前兩款產品一樣的深邃黑風格,說實話,這比此前RTX 40系的淡淡香檳金的外框配色更顯沉穩,而且對我個人來說也更討好我的眼球。在整體風格上,仍然是非常簡潔清爽,沒有一絲多余的設計。拿到手里的時候,我們就第一時間發現RTX 4080 SUPER FE顯卡在整體造型和散熱模組的配置上,都沿用了此前RTX 4090的旗艦級配置,因此在散熱性能的表現上,它大概率會比RTX 4080的表現更好一些。
▲電源接口仍然是ATX 3.0電源規范的PCIe 5.0標準16Pin 12VHPWR供電接口,單口可實現600W供電支持。
▲視頻輸出接口為經典3DP 1.4a+1 HDMI 2.1
▲顯卡整體只在頂部的GeForce RTX Logo處設置了白色燈效
產品資料
核心架構:Ada Lovelace
核心代號:AD103-400
制程工藝:TSMC 4N定制
SM單元:80
CUDA核心數:10240
光追核心數(RT Cores):80(第三代)
AI核心數(Tensor Cores):320(第四代)
核心頻率:2295MHz~2550MHz
顯存容量:16GB GDDR6X
顯存速率:23Gbps
顯存位寬:256bit
顯存帶寬:736GB/s
L2緩存:64MB
支持DLSS版本:DLSS 3.5
TGP:320W
建議電源:750W
首發參考價:8099元
不廢話,讓我們進入到大家最關心的性能評測關。在接下來的這部分內容中,按照傳統慣例,我們將從游戲性能、AI計算性能和內容設計創作性能三個方面去全方位考察RTX 4080 SUPER的性能表現。與此同時,為了更便于大家對RTX 4080 SUPER的性能有直觀的感受和判斷,我們也在測試中加入了RTX 4080、RTX 3090 Ti和AMD目前的頂級旗艦Radeon RX 7900 XTX作為參考測試對象。
測試平臺
GPU:NVIDIA GeForce RTX 4080 SUPER FE、RTX 4080 FE、RTX 3090 Ti FE、AMD Radeon RX 7900 XTX(AIB產品,非公超頻版)
CPU 英特爾酷睿i9-14900K
主板:英特爾Z790
內存:DDR5 6000 24GB×2
硬盤:長江存儲致態 1TB PCIe SSD三體版
顯示器:戴爾UP3218K(7680×4320@60Hz)
驅動程序:NVIDIA Game Ready Driver 551.22
AMD Radeon Software Adrenalin Edition 24.1.1
操作系統:Windows 11 Pro 22H2
首先看RTX 4080 SUPER在AI性能上的表現。
和前兩款RTX 40 SUPER系GPU的測試一樣,我們仍然用Stable Diffusion Automatic1111+TensorRT擴展來測試TensorRT擴展支持下RTX 4080 SUPER的AIGC性能表現。作為對比的Radeon RX 7900 XTX,則是使用最常用的Stable Diffusion Automatic1111+DirectML在自帶的SD_1.5模型下進行對比測試。
從整體測試結果來看,在默認的SD_1.5模型測試下,RTX 4080 SUPER相比RX 7900 XTX的AIGC性能領先超過了200%,3個關鍵詞下的平均領先幅度達到了227%。同時,在開啟TensorRT之后,RTX 4080 SUPER的性能增幅也達到了120%~150%。對比RTX 4080來看,三種模型+TensorRT的測試下RTX 4080 SUPER皆有2%~7%的小幅領先。同比RTX 3090 Ti,RTX 4080 SUPER的整體性能領先也在25%以上。
從測試結果仍然能到Tensor RT這類SDK擴展給RTX 4080 SUPER帶來了強大的AI性能提升。同時在類似基于SD_XL這種大模型的AIGC運算上,GPU的顯存容量和規格也直接決定了運算效率的高低,越高配置的顯存,在這種大模型的AIGC運算上優勢也越明顯。而對比RX 7900 XTX也能看到,Ada Lovelace架構的第四代Tensor和CUDA核心的效率及性能也是碾壓競爭對手的存在。
正如我們在之前說過的一樣,從RTX 20系開始,NVIDIA就已經開始在PC的AI性能上著重布局,包括后續幾代產品的迭代進化也無一不體現出了NVIDIA對RTX GPU PC的AI性能上重視,并逐漸引導著整個產業朝向AIPC領域不斷前進和發展。在基于高性能RTX 4080 SUPER GPU的AIGC應用上,專業的靜態CG圖片工作者創作自己心中理想的圖片相比此前的產品能節省一半甚至更多的時間;游戲、動漫的角色設計師可以在TensorRT擴展支持下更自由、更輕松地創作自己理想中的人物形象;藝術創作者更可以更快地審視和修改自己的作品;甚至是淘寶、京東等電商平臺的店主,也能快速為自己的商品建模甚至是生成AI的服裝試穿等照片,潛在的應用場景可謂全面開花。
ON1 Resize AI 2023圖片AI處理測試中,RTX 4080 SUPER整體性能表現與RTX 4080非常接近,僅有1%~2%的微小領先幅度,相比Radeon RX 7900 XTX,RTX 4080 SUPER的性能領先則高達40%以上。對比RTX 3090 Ti,性能領先也接近20%。
▲NVIDIA RTX視頻超分辨率(RTX VSR)也是一項基于AI和云端協作對視頻播放進行畫質增強的技術。我們通過FireFox瀏覽器(不支持VSR)和EDGE瀏覽器(支持VSR)來播放同一段網絡上的游戲宣傳視頻可以看到,在開啟VSR之后(圖右),相比不支持VSR的瀏覽器(圖左)播放效果,視頻畫質得到了明顯的增強,擁有更好的清晰度和細節表現。
接下來看RTX 4080 SUPER在設計創作性能上的表現。和之前測試SUPER系產品一樣,我們仍然將通過視頻轉碼處理和3D渲染性能兩方面來衡量RTX 4080 SUPER在內容創作上的性能優勢,以及它相對于競爭對手的優劣分析。
在Davinci Resolve 18的視頻轉碼性能測試方面,在H.264和H.265的視頻轉碼性能上,RTX 4080 SUPER相比RX 7900 XTX有10%~17%的領先,而在AV1編碼輸出性能上,RTX 4080 SUPER的性能領先則高達40%以上。這也說明第八代NVENC在AV1視頻的硬件編碼性能上是要明顯強于RDNA 3核心AV1視頻硬件編碼性能的。此外在涉及AI處理性能的魔法遮罩效果測試上,RTX 4080 SUPER更是領先RX 7900 XTX高達400%以上,AI 性能方面也是表現出了足夠大的優勢。
與RTX 4080相比,同為雙第八代NVENC編碼器配置,因此二者的整體性能表現幾乎沒有差別。對于RTX 3090 Ti來說,RTX 4080 SUPER的視頻轉碼性能領先前者20%以上。
▲NVIDIA GPU設置為通用的CUDA加速模式,RX 7900 XTX設置為HIP加速模式。
3D渲染性能主要通過V-Ray Benchmark 6.0、Blender Opendata Benchmark和Blender 4.0實際模型渲染進行實際考核測試。從全部三項測試成績來看,RTX 4080 SUPER的性能基本與RTX 4080持平,性能差距僅在1%左右。與RX 7900 XTX相比,RTX 4080 SUPER在Blender Opendata Benchmark測試中性能領先前者高達50%以上,在Blender 4.0的實際模型渲染中,我們用RTX 4080 SUPER的CUDA加速模式對比RX 7900 XTX的HIP GPU加速模式渲染同樣的三個模型,最后發現RTX 4080 SUPER性能領先RX 7900 XTX在3%~25%,平均領先程度約為15%左右。如果換成OptiX硬件加速渲染模式,RTX 4080 SUPER在模型渲染性能上領先RX 7900 XTX更是高達50%~180%,平均性能領先已經達到了100%以上。
同比RTX 3090 Ti,在3D渲染性能上RTX 4080 SUPER已經表現出遙遙領先的勢頭,平均領先程度達到了35%左右。
▲對RTX GPU來說,OptiX渲染加速模式相比CUDA渲染加速模式有更高的效率,RTX GPU的用戶我們建議在用Blender進行模型渲染時開啟OptiX模式。
支持DLSS 3.5的D5渲染器測試成績也基本與前面的測試結果相符,RTX 4080 SUPER與RTX 4080在性能表現上仍然是相差無幾,而相比RTX 3090 Ti在不開啟DLSS 3.5時性能領先近30%,開啟DLSS 3.5之后,性能領先RTX 3090 Ti接近150%。
除了D5渲染器之外,DLSS 3.5也在不少其他設計創作軟件中得到了應用。DLSS 3.5中的幀生成能夠大幅度提升設計軟件的實時渲染幀率,而光線重建技術則可以對實時渲染畫面顯著地降噪和增強畫質。
▲在UE5引擎的CG渲染中,可以看到開啟光線重建之后(右圖),相比關閉光線重建中,實時渲染畫面的效果更優秀,更清晰,同時原本的渲染噪點也得到了幾乎完全的消除。
▲在Omniverse應用中,開關光線重建的渲染效果同樣異常明顯,可以看到在開啟光線重建之后(右圖),相比關閉的情況(左圖),3D渲染的靜態CG陰影表現更加清晰和真實,畫面更通透,幾乎看不到任何的噪點存在。
▲在3D渲染器CHAOS VANTAGE中,通過實時渲染一段CG可以看到,開啟光線重建之后(右圖),渲染細節更加豐富,物體呈現也更加真實,尤其是玻璃、大理石等紋理也得到了真實的展現。
下面看看RTX 4080 SUPER在其“本職工作”——游戲性能方面的表現。
在3DMark理論性能測試部分,RTX 4080 SUPER的整體性能與RTX 4080相差不太大,僅領先后者約3%。與RX 7900 XTX相比,RTX 4080 SUPER在光柵游戲性能上略略遜色3%左右,但在光追性能上卻領先對手18%左右,整體性能表現還是強于RX 7900 XT。與RTX 3090 Ti比較,RTX 4080 SUPER則在整體性能上領先達28%。
▲Radeon RX 7900 XTX在游戲中開啟FSR平衡模式(同時支持DLSS和FSR的游戲中)
由于硬件規格的差距極小,因此我們看到在常規游戲的測試中,RTX 4080 SUPER與RTX 4080的性能差距并不太明顯,整體在0.2%~6%之間,綜合全部游戲測試結果來看,RTX 4080 SUPER僅有3%左右的性能優勢。當然,在相差極小的硬件規格限制下,這個性能差距也是符合我們測試之前的預估的,畢竟這款產品的定位就是微小升級、價格更低。
相比RTX 3090 Ti,RTX 4080 SUPER的整體游戲性能明顯甩開了前者,在不開啟DLSS 3的情況下,整體性能也領先了近30%。就競爭對手RX 7900 XTX而言,在部分游戲中,RX 7900 XTX相對RTX 4080 SUPER有小幅度領先,如《不朽者傳奇》《孤島驚魂6》《星空》等,但在絕大多數游戲中,RTX 4080 SUPER都有明顯的領先優勢,綜合光追和光柵游戲整體性能來看,領先競爭對手近20%。
從4K分辨率的游戲性能來看,在不開啟DLSS的情況下,RTX 4080 SUPER已經能在絕大部分光追游戲下保持60fps+的流暢運行效果,在開啟DLSS之后,除要求特別高的極致光追效果游戲《傳送門:序曲》RTX版之外的絕大部分游戲中都達到了90fps+非常流暢的運行效果。
當然我們不能忘記RTX 40系GPU的黑科技DLSS 3,在開啟DLSS 3之后,RTX 4080 SUPER又有怎樣的華麗轉身呢?
從9款DLSS 3游戲的測試結果來看,在1440p分辨率下開啟DLSS 3之后,游戲幀率相對原生幀率提升了85%~340%,在4K分辨率下游戲幀率的提升更是達到了100%~410%,平均性能提升達到了180%左右。DLSS 3的巨大增幅作用再次得以驗證。
同時,從測試結果圖表中也可以明顯看出,得益于和NVIDIA Reflex技術的融合,開啟DLSS 3之后游戲的整體系統延遲也得到了極大的降低,1%L fps也有極大升高,這些都明顯地增強了游戲體驗的順滑無卡頓的愉悅程度。尤其對于《傳送門:序曲》RTX版這種光追性能要求極高的游戲而言,開啟DLSS 3之后游戲系統延遲能夠從200+毫秒瞬間降低到58毫秒,無疑能夠極大提升游戲體驗舒適度和絲滑享受的程度。
▲加入光線重建技術之后,DLSS 3也進行了半代升級來到了DLSS 3.5。對光追游戲,尤其是具備路徑追蹤效果的光追游戲來說,開啟DLSS 3.5的光線重建功能能極大提升游戲畫質表現,細節表現更豐富、更清晰。圖為《賽博朋克2077:往日之影》,幀生成開時,光線重建關閉(左)與光線重建開啟(右)畫質對比。
在《賽博朋克2077:往日之影》游戲中,我們開啟了最高光追特效+路徑追蹤,在游戲中通過開啟/關閉光線重建功能可以明顯地看到,在開啟光線重建之后,游戲畫面程序更加清晰通透,尤其是在反射效果上更加清晰,原有的噪點也得到了極好的抑制,畫質表現可以說是確實提升了一個檔次。
來看下DLSS 3的降維打擊效果。前面的游戲測試成績中,RTX 4080 SUPER相對RTX 3090 Ti性能領先約為30%左右,而開啟DLSS 3之后,RTX 4080 SUPER在游戲性能上相對只能開啟DLSS 2的RTX 3090 Ti平均領先程度已經達到了80%以上。
作為一款立足4K分辨率,通吃1440p游戲的游戲顯卡而言,我們主要測試了它在4K和1440p兩種分辨率下的游戲功耗表現。通過《賽博朋克2077》《暗黑破壞神Ⅳ》《星空》《生死輪回》和《光明記憶:無限》這5款游戲,分別在4K和1440p分辨率測試RTX 4080 SUPER FE顯卡的功耗表現,最后取其平均值作為RTX 4080 SUPER FE的平均游戲功耗。
在測試中,RTX 4080 SUPER FE在1440p分辨率下的平均游戲功耗約為260W左右,而在4K分辨率下的游戲功耗約為290W左右,平均游戲功耗275W,遠低于320W的TGP設計。
在烤機狀態下,滿負荷運行的RTX 4080 SUPER的功耗約為311W,略低于TGP設計。此時核心溫度僅在58℃左右,甚至遠低于RTX 4080的63℃。正如我們在最開始所說的那樣,RTX 4090散熱模組的套用讓RTX 4080 SUPER FE有著非常優秀的散熱性能表現,整體能耗比相比RTX 4080更為優秀。
從實際性能上來看,RTX 4080 SUPER在4K分辨率下即使不開啟DLSS也能流暢運行大部分全特效光追游戲,開啟DLSS 3之后在絕大部分光追游戲中都能保持近100FPS的游戲運行效果,4K游戲是暢玩無憂的。同時,無論是游戲性能還是AI性能或是設計創作性能,都已經遠勝前代旗艦RTX 3090 Ti,基本達到了30%以上,在DLSS 3的加持下游戲性能甚至超過RTX 3090 Ti達80%以上,性能表現無疑是非常合格的。與AMD目前的旗艦級游戲顯卡RX 7900 XTX相比,僅在少部分游戲中(主要是光柵游戲)RTX 4080 SUPER略有小幅度落后,大部分游戲中還是平均領先20%左右,在AIGC和設計創作性能更是遠勝RX 7900 XTX。
作為RTX 4080的升級版產品,也許很多玩家會對RTX 4080 SUPER相對RTX 4080的性能提升幅度有爭議,平均僅3%左右的游戲性能提升或許和不少玩家的心理預期值不符。但我們必須看明白的是,首先RTX 4080 SUPER從硬件規格上的限制就決定了它并不是一款如同RTX 4070 SUPER那樣性能大升級的產品,而是微升級的高性價比產品。NVIDIA對RTX 4080 SUPER給出的首發參考價為8099元,甚至比RTX 4080的首發價格還低了1400元,結合性能和價格兩方面來看,這簡直就是往高端頂級顯卡市場扔下了“王炸”,對手紛紛表示“要不起”。
所以NVIDIA的意圖應該是非常明顯了,那就是用稍強一些的性能和更低的價格,讓新的RTX 4080 SUPER成為目前高端游戲顯卡市場上非常有競爭力的產品,從而撐起RTX 40系GPU在高端顯卡市場的半壁江山。甚至我們還在想,或許RTX 4080 SUPER才是RTX 40 SUPER系首發這三款產品的最大殺手锏——性能更好一點,價格卻低很多,性價比直接碾壓當前市場上所有頂級顯卡。所以一旦RTX 4080 SUPER上市,在目前的顯卡市場上絕對會成為最具性價比的頂級顯卡選擇。能4K游戲、能AI創作、能內容創作,而且價格環比一眾同等級產品還特別有優勢,對那些追求頂級性能的發燒友或設計創作者來說,如果要找尋一款合適的具備高端性能的顯卡,我們實在想不到有什么理由不推薦它,直接認準RTX 4080 SUPER準沒錯!買買買,就完事兒!
月19日,NVIDIA在硅谷召開了GTC 2019主題演講,NVIDIA CEO黃仁勛發表演講,正式發布了機器人開發者工具箱Jetson Nano,可以為機器人設計引入AI算力。
Jetson Nano是一款類似于樹莓派的嵌入式電腦設備,其搭載了四核Cortex-A57處理器,GPU則是擁有128個NVIDIA CUDA核心的NVIDIA麥克斯韋架構顯卡,內存4GB LPDDR4,存儲則為16GB eMMC 5.1,支持4K 60Hz視頻解碼。
NVIDIA表示,Jetson Nano可以提供472千兆浮點的算力,同時功耗低至5W,另外Jetson Nano面積非常mini,長寬只有69.6x45mm,非常適合放在機器人或者智能音箱體內。
Jetson Nano套件可以直接運行Linux系統,并支持大量的AI框架(當然包括NVIDIA自己的框架)。
至于價格,Jetson Nano售價99美元,約合人民幣660元,此外NVIDIA還提供一個“production-ready”版本,售價129美元,約合人民幣860元。