在選擇電腦硬件時,許多人常常會問:CPU帶核顯和不帶核顯到底有什么區別?這兩者各自的優缺點是什么?本文將詳細解釋這一問題,希望幫助你更好地做出選擇。
核顯,又稱集成顯卡,是指集成在CPU中的圖形處理單元顯卡(GPU)。它能夠處理圖像顯示、視頻解碼等任務。通常,核顯性能較低,適用于基本的辦公、視頻播放和輕度游戲等需求。
獨顯,又稱獨立顯卡,是指單獨的一塊顯卡,通常安裝在主板上的PCI-E插槽中。獨顯具有獨立的顯存和GPU,它的性能較強,適用于高要求的圖形處理、視頻編輯和大型3a游戲等任務。
成本效益:帶核顯的CPU通常更便宜,因為不需要購買獨立顯卡。對于預算有限的用戶,這是一個不錯的選擇。
節省空間:沒有獨立顯卡的電腦內部結構更簡單,適合小型機箱或緊湊型設計。
能效更高:核顯功耗較低,有助于降低整體能耗,延長筆記本電腦的電池續航時間。
性能限制:核顯性能相對較低,無法滿足高要求的圖形處理和大型游戲需求。
升級空間有限:一旦發現核顯性能不足,必須更換整套CPU或加裝獨立顯卡,成本較高。
高性能:獨顯性能遠超核顯,適合需要強大圖形處理能力的用戶,如游戲玩家、視頻編輯和3D設計師。
可升級性:獨顯可以單獨更換或升級,不需要更換整套CPU,靈活性更高。所以獨顯是更好的選擇!
成本較高:需要額外購買獨立顯卡,增加了整體成本。
功耗較高:獨顯的功耗通常較高,可能導致電腦發熱量增加,需要更好的散熱系統。
普通辦公和多媒體娛樂:如果你的需求僅限于文檔處理、網頁瀏覽、高清視頻播放等,那么帶核顯的CPU完全能夠勝任。核顯已經能夠滿足這些基本需求,同時保持低成本和低功耗。
專業圖形處理和大型游戲:如果你是一個游戲玩家、視頻編輯、3D設計師或需要處理高分辨率圖像和視頻的專業人員,那么獨顯是必不可少的。獨顯能夠提供更高的幀率、更流暢的圖形效果和更快的處理速度。
預算考量:如果預算有限,選擇帶核顯的CPU可以節省不少費用,適合基本需求。
性能需求:如果追求高性能,選擇不帶核顯的CPU并搭配獨顯是更好的選擇。
使用場景:根據你的使用場景來決定,如果僅是輕度使用,核顯足矣;如果是重度使用,獨顯更佳。
CPU帶核顯和不帶核顯各有優缺點,選擇哪種配置取決于你的具體需求和預算。希望本文能幫助你更好地了解兩者之間的區別,并做出最適合自己的選擇。
歡迎留言討論?
I PC的概念逐漸深入人心,CounterPoint數據顯示今年一季度出貨的筆記本大約45%都是AI PC,成功帶動全球PC市場止住了連續八個季度的頹勢,終于反彈增長約3%。
行業對于AI PC的定義也逐漸明晰,CPU、GPU、NPU三大引擎被認為都是必需,而且各有所長。
其中CPU適合通用性負載,最為靈活,新興的NPU適合持續性低負載以大大節約功耗,只是應用范圍還比較有限,算力也不可能太高,GPU則憑借無可比擬的強大算力,一直承擔著核心責任。
這方面最有話語權的自然是NVIDIA,一方面是專業級的GPU加速器近乎壟斷整個行業,另一方面是消費級的GeForce RTX 40系列GPU正在各行各業變革體驗。
2018年,NVIDIA推出了全新的GeForce RTX 20系列GPU、RTX技術,首次通過專用的Tensor Core為AI提供全面加速,DLSS超分辨率技術正是AI在游戲中最領先、最直觀的體現。
即使是入門的GeForce RTX 4050筆記本電腦GPU,也可提供高達194 TOPS的算力,GeForce RTX 4090 D則能提供高達1177 TOPS的算力,覆蓋各式臺式機、筆記本、工作站,而目前沒有獨立GPU的輕量級AI PC,算力只有大約10-45 TOPS,下一代才能突破100 TOPS。
硬件之上,NVIDIA RTX也提供了極為豐富的AI相關開發套件和應用軟件加速,尤其是TensorRT可以大大加速非常熱門的AIGC模型,包括最流行的Stable Diffusion 1.5、SDXL 1.0等等,還獲得了全新UL Procyon AI圖像生成基準測試的支持。
目前,RTX AI PC已擁有超過1億用戶、500多款應用和游戲,形成了豐富的生態。
近日,NVIDIA舉辦了一場特別的RTX AI媒體品鑒會,宣布了多項AI相關內容更新,展示了多項AIGC藝術創作作品,并演示了最新的技術DEMO。
【NVIDIA RTX AI:無處不在】
在全行業的合力推進之下,AI技術尤其是AIGC正在極大普及,深入各行各業,概括起來可分為繪畫、平面設計、3D創作、視頻編輯、視頻體驗、會議/直播、文檔助手、編程開發、游戲、游戲開發等十大領域。
在每一個領域甚至每一個場景,NVIDIA RTX GPU都在提供各種創新的加速技術。
Stable Diffusion生圖繪畫,RTX GPU是PC上最快的加速方法。RTX 4090 D默認可以每秒生成8張圖,TensorRT加速后結合進一步性能優化,每秒生成超過120張圖片。
RTX GPU還是最具生產力的加速方法,支持市面上所有的SD WebUI(Automatic1111、ComfyUI、SD-Forge、秋葉等),支持最先進的SD工作流(LoRA、ControlNet、微調、AnimateDiff、IPAdapter、InstantID、實時繪畫等)。
平面設計,全面支持市面上主流的設計軟件,可為各種圖片編輯功能提供加速。
諸如智能肖像、對象選擇、細節增強、圖像超分辨率、圖片修復、色彩還原、RAW增強、天空選擇、眼部增強,等等。
來到3D設計,RTX 40 系列GPU可以為各種離線渲染器、實時渲染器提供AI加速,最近流行的D5,大名鼎鼎的UE、Unity都可以從中獲益匪淺,其中更是可以用到DLSS。
視頻編輯方面,同樣支持主流軟件工具,功能也相當豐富,比如對象遮罩、自動場景檢測、自動畫面重構、視頻超分辨率、銳化遮罩、顏色矯正、語音識別、人體跟蹤、風格轉換、視頻補幀等。
視頻體驗方面,最值得一提的是RTX VSR超級分辨率、Video HDR,可大大增強在線視頻的畫質體驗,支持在Chrome、Edge瀏覽器內播放任意視頻,支持國內主流視頻網站,而且是驅動自帶功能,無需額外下載任何軟件、插件。
無論是最新的RTX 40系列,還是早期的RTX 30/20系列,都可以享受這一福利。
會議與直播方面,NVIDIA Broadcast提供了非常完美的解決方案,通過目光接觸、人臉跟蹤、背景模糊、自動聚焦、視頻降噪、虛光、回聲消除等等,可帶來最佳的流媒體質量優化。
它支持市面上幾乎所有的視頻會議軟件、直播軟件,包括騰訊會議、釘釘、飛書、Teams、OBS等等,RTX 40/30/20系列都能用。
人機交互方面,AI對話、文檔整理是典型的應用,NVIDIA也打造了ChatRTX技術Demo。,用于本地增強檢索生成。
它可以使用本地的RTX 40/30 系列 GPU (8GB及以上顯存) 算力加速,進行大語言模型推理,智能離線檢索本地隱私文檔(txt/docx/pdf等等)并生成結果,尤其是支持中文對話模型和文檔檢索,包括智譜ChatGLM3等等,開發者還可以自行添加其它支持TensorRT-LLM加速的大語言模型。
更關鍵的是,ChatRTX是免費的,而且開源。
開發方面,TensorRT可以說是當前市面上最快的深度學習推理加速框架,尤其是支持領先的中文開源模型,RTX 40/30/20 GPU都可以跑。
推理性能上,相比于LlaMA.cpp,它的生成速度可以領先多達4倍,Batch Size越大優勢越明顯。
Stable Diffusion生圖上,相比于通用的PyTorch,速度可以輕松翻番,更是可以輕松碾壓蘋果CoreML框架。
游戲應用中最典型的就是實時光追、DLSS的聯手,可以根據需要,選擇不同的質量和速度,這個就不多說了。
游戲上的典型例子就是NVIDIA RTX Remix,可以讓DX8、DX9老游戲煥發新生,自動捕獲游戲場景和材質,通過AI進行增強,并加入實時光追、DLSS 3/3.5,傳送門RTX版就是最佳例子。
硬件方面支持RTX 40/30 GPU。
事實上,NVIDIA已經為全領域AI開發提供端到端的開發平臺支持,開發、訓練、整合、部署都能獲得RTX GPU的加速。
Omniverse、Nemo、DLSS、ACE、Optix、VSR、Maxine、TensorRT、CUDNN……如此豐富的開發工具,恐怕僅此一家。
【合作案例1:火星時代教育的TensorRT SD創作加速指南】
Stable Diffusion是文生圖、圖生圖創作最廣泛的應用,已經有大量設計師、藝術家甚至普通辦公族用它來加速工作,前文也說過NVIDIA TensorRT可為其帶來無可比擬的加速。
不過,Stable Diffusion仍然存在相當的學習和使用門檻,TensorRT也需要一定的摸索。
因此,火星時代教育在NVIDIA技術團隊的支持下,打造了《NVIDIA TensorRT Stable Diffusion創作加速指南》,為AI設計愛好者和創作者詳細介紹基于RTX 40系列GPU提升Stable Diffusion創作效率的詳盡實操性教程。
在這個指南里,你可以看到Stable Diffusion/TensorRT的安裝與設置、加速引擎的構建、加速效果的對比,以及實際商業創作場景應用,包括海報設計、電商設計、室內效果圖設計、插畫設計等等。
《NVIDIA TensorRT Stable Diffusion創作加速指南》鏈接:
https://www.hxsd.com/pdf/viewer/HXSD-NVIDIATensorRT-GuideBook/
設計案例:
【合作案例2:吐司的SD GPU配置推薦】
Stable Diffusion的使用門檻還有硬件層面,GPU算力越強出圖速度自然就越快,但不同級別的GPU到底有多大差異呢?
作為行業第一家實現在線生圖的AI模型社區,吐司(國際版為Tensor.Art)已經匯聚超過16萬的AI模型,如今聯合NVIDIA打造了一份《個人用戶玩轉Stable Diffusion的GPU配置推薦》。
它使用第三方軟件UL Procyon AI基準測試和吐司自己的Benchmark,完整測試了RTX 40系列桌面、筆記本顯卡不同型號在SD 1.5 和SDXL 1.0中的推理性能表現,可以作為AIGC用戶創作的參考。
UL Procycon SD 1.5、SDXL桌面顯卡性能對比:RTX 4090D都是一枝獨秀,RTX 4060 8GB則已經無法支撐SDXL。
UL Procycon SD 1.5筆記本顯卡性能對比:可以看到RTX 4080和RTX 4070筆記本電腦GPU 之間出現了一個較大的空檔,RTX 4090筆記本電腦GPU領先的幅度則不是很大。
UL Procycon SDXL筆記本顯卡性能對比:只剩下高端的RTX 4090/4080 筆記本電腦GPU可以運行,其他都被淘汰。
吐司Benchmark SD 1.5/SDXL桌面顯卡開關TensorRT加速性能對比:可以看到在任何級別的型號上,加速效果都十分顯著,實現翻倍的生圖性能提升(RTX 4070 Ti, SD1.5 測試)。
RTX 4090筆記本電腦GPU、酷睿Ultra核顯分別使用各家優化引擎,測得的性能差異簡直是云壤之別,兩者性能相差高達驚人的27倍!
LoRA性能也可以測試,性能差異一目了然,RTX 4090D依然遙遙領先。
【AI加速創作:藝術與技術的激情碰撞】
AIGC給藝術創作帶來了無限可能,可以將設計師、藝術家的種種創意快速轉化為現實,從而大大提升創作效率,節省出來的時間可以追求更多奇思妙想。
當然,AI不會無中生有,更不可能取代人類,它只是一個幫手,它生成的圖片、視頻也只是創作的基礎,就像一個畫板,只有在人的畫筆之下,才能真正成為作品,成為藝術品。
NVIDIA已經與大量創作人士進行了合作,利用RTX AI加速,幫助他們盡情揮灑創意,奉上更驚艷的藝術作品。
土豆人Tudou_man:數字藝術家、策展人
數字藝術家土豆人Tudou_Man 表示:“每天有大量AIGC內容涌現,宛如微小的青苔連續改寫當下。不久,我們的文明也將被數字所覆蓋。通過RTX 40系列AI PC平臺的運算加持,震驚之余,我使用RTX 40系列 RTX AI PC創作了《復寫苔原》系列作品,RTX 平臺為像我這樣的數字藝術家提供高效的AI算力加速。我將AIGC作品注入人的思考與靈魂,在不可逆的數據洪流中保持本真。”
這里摘錄幾個土豆人Tudou_Man的AIGC作品:
《咖啡浪潮的1000次演進》:
為2023年的上海咖啡文化周創作的AIGC概念作品。
以上海蘇州河游船為創作原型,采用實景采集與MidJourney、Stable Diffusion組合的方式創作,通過上千次的疊加演算,近乎真實地讓浪花載著一杯巨大的外賣咖啡出現在蘇州河上。
《不落冰川系列-001》:
視頻作品通過MJ+SVD+Deforum創作,將之間一組系列作品做了動態化演繹。
冷風吹動的藍色塑料布像極了黑沙灘上舞動的冰川,而冰川之下是克蘇魯內核的滋長,無盡變化的水母不斷循環叩擊著夢境。
《戴圍巾上海老建筑系列》:
把晚霞做成了毛絨絨的圍巾,掛在了武康大樓、外灘鐘樓、和平飯店上,圣誕氛圍拉滿。
《巨大的小熊軟糖系列》:
這是一組AIGC+實景合成的巨物化創意作品,超寫實的城市場景與可愛的巨大軟糖熊形成了反差萌。
《麥麥博物館》:
麥當勞“傳家寶”,將麥當勞的超級單品與中國館藏文物相結合,得到了麥當勞中國官方支持。
《鉆石大都會》:
為全新雅詩蘭黛白金唇膏創作的AIGC概念短片。
在寶石般的億萬切面中,一覽大都會的璀璨華美,城市的摩登奢華又在琉光中筑成一枚唇間的藝術品,可能這就是白金唇膏令人愛不釋手的理由。
Simon阿文:AbleSlide聯合創始人、Blender藝術家、AI創作者
包括央視春晚AI動畫等作品在內,從文字、圖像到影像,他的許多探索是基于本地RTX 4090顯卡完成的。他表示:“AIGC的可能性是一片藍海,AI PC是我的帆船。”
《維度筆觸》:
將傳統油畫與現代3D建模、AIGC相結合,油畫紋理均為Disco Diffusion生成,數字精確性與藝術表達相遇。
《擱淺的云》:
通過Blender制作簡模,使用ComfyUI搭建工作流進行AI轉繪,把AI渲染應用到傳統的3D工作流中。靈感來自海辛的短篇《擱淺的云》中的一句話:“我在海邊遇到一朵擱淺的云。”
《低俗小說》:
將《低俗小說》中著名的搖擺舞,通過AI的方式轉繪為油畫、皮影戲、雕塑等多個風格并進行重新剪輯,達到一種多元宇宙的視覺效果。
《花中維納斯》:
系列作品,花卉和維納斯的經典形象在一個迷人的舞蹈中融合。通過AI的力量,這些靜態圖像被轉化為一種動態體驗,每一片花瓣都在綻放的微妙芭蕾中緩緩展開,見證維納斯的重生。
【NVIDIA RTX DEMO:游戲NPC變“真人”】
接下來的環節,看看NVIDIA的幾項RTX AI加速技術演示Demo,其實大部分都是大家的老朋友了,這次難得在線下一次性都體驗到。
重點看看ACE微服務數字人,主要應用就是游戲里的NPC。
它利用基于NVIDIA Audio2Face的面部動畫、基于NVIDIA Riva自動語音識別(ASR)/文本轉語音(TTS)的語音交流,讓虛擬數字人物真正鮮活起來。
通過將認知、感知、行為系統集成在一起,結合多模態展示,不但渲染出來的角色令人驚嘆,而且不再每次都是固定、死板的對話和動作,而是完全根據玩家的語音、文字交互,實時給出動態、匹配的反應,游戲節奏和進程可以每次都是截然不同的。
AI NPC可以通過混合式AI,使用預訓練定制的大語言模型進行聆聽、處理、生成對話,并做出回應,而且每個步驟都是實時的,以確保流暢對話。
第一步,Riva利用RTX PC的GPU加速的多語種語音和翻譯微服務,處理玩家輸入的語音,生成實時對話式AI工作流。
第二步,ASR處理語音內容,并利用AI實時提供非常準確的轉錄文本,支持涉及二十多種語言。
第三步,轉錄文本進入LLM(例如Gemma/Llama 2/Mistral),并借助Riva的神經網絡機器翻譯,生成以自然語言表述的文本回復。
第四步,使用Riva的文本轉語音功能,生成音頻回復。
第五步,A2F生成面部表情,并與對話同步。
期間,RTX AI PC會自動制作NPC面部、眼睛、嘴巴、舌頭和頭部動作的動畫,并與情緒范圍和強度水平匹配,A2F還可以根據音頻片段自動推斷情緒。
年初的CES上,我們第一次見識到了ACE NPC的表演,就是那段“吃面”,由NVIDIA與ConvAI合作打造。
3月份的GTC技術大會上,NVIDIA又帶來了更震撼的演示DEMO Covert Protocol。
它基于UE5引擎開發,結合了ACE技術和Inworld AI引擎,玩家在其中扮演一名私家偵探,在一家酒店大廳內,與前臺、服務生、專家共三名NPC進行互動,完成預定任務。
他們都會根據玩家的交互做出不同的反應,這就考驗玩家如何變著花樣套出自己所需要的信息,每次都不一樣,可玩性非常高,以往那種看都不看就跳過NPC互動的情況再也不會出現了。
另一個重點是ChatRTX,使用檢索增強生成(RAG)、NVIDIA TensorRT-LLM加速庫、通過NVIDIA RTX加速,可以快速、輕松地將本地文件作為數據集,連接到開放式大語言模型(比如智譜AI ChatGLM3-6B),快速查詢與上下文相關的答案。
ChatGLM是基于GLM預訓練框架的雙語對話模型,采用了獨創的多階段增強預訓練方法,包括6B、12B、32B、66B等多種參數規模,并支持NVIDIA TensorRT-LLM框架等多種加速工具,從而在合理的精度損失下提升推理速度。
除了文本之外,ChatRTX還很快將增加支持語音輸入和圖像功能。
圖片已獲授權
SD專業工作流:
通過人像生成控制模型InstantID,足不出戶就能使用普通攝像頭的自拍照,生成影棚級別的高質量肖像照,并且可以用RTX GPU進行加速。
SD一秒生成8張圖:
作為市面上最快的Stable Diffusion計算生圖工具,RTX 4090 D可以做到高達每秒8張圖的生成速度,而且是開箱即用,無需任何復雜設置。
使用當前最快的加速方法TensorRT,再配合進一步的性能優化,RTX 4090 D GPU最高能實現每秒超過120張圖的生成速度,生圖創作也能像高幀率游戲一樣絲滑。
建筑實時渲染:
即致AI基于擴散模型和蒸餾技術,通過RTX 40 系列GPU的加速,實現了秒級的AI實時繪畫。
再結合即致AI自研的全網下載量超50萬的國內建筑行業大模型,可以幫助建筑設計師快捷、便利地進行AI實時渲染,并保證極高的出圖效果。
聲音克隆:
基于開源的GPT-SoVITS項目,不需要任何訓練,僅需5秒鐘的聲音樣本,就能根據其發音特征,生成個性化的語音,RTX AI的加速下僅僅幾秒鐘就能完成生成。
如果使用更多樣本的微調訓練,比如1分鐘,還可以實現更高質量,接近1:1復刻的聲音克隆。
AI PC時代雖然才剛剛開始,但已經百花齊放、精彩紛呈。作為AI PC的算力基礎,CPU、GPU、NPU三大引擎也都在各顯其能、爭奇斗艷。
當然了,三者沒有誰比誰更重要,只有誰更適合做什么。
RTX GPU作為當今的硬件算力天花板,再加上NVIDIA強大的技術實力、豐富的開發與應用生態、無比的行業號召力,無疑最為適合需要強悍性能的AI應用,既能帶來最快的速度,也能帶來最好的質量、兼容性和穩定性。
本次介紹的種種RTX AI加速應用,遍布于游戲、2D/3D設計、藝術創作、生產力、垂直行業等方方面面,都給人帶來了耳目一新的感覺,無論速度還是質量都堪稱翹楚。
期待RTX AI、AI PC能帶來越來越多的精彩應用,真正讓AI普及到每一個人的生活、工作、娛樂之中,釋放技術之美,全方位變革普羅大眾的日常體驗。
I PC的概念逐漸深入人心,CounterPoint數據顯示今年一季度出貨的筆記本大約45%都是AI PC,成功帶動全球PC市場止住了連續八個季度的頹勢,終于反彈增長約3%。
行業對于AI PC的定義也逐漸明晰,CPU、GPU、NPU三大引擎被認為都是必需,而且各有所長。
其中CPU適合通用性負載,最為靈活,新興的NPU適合持續性低負載以大大節約功耗,只是應用范圍還比較有限,算力也不可能太高,GPU則憑借無可比擬的強大算力,一直承擔著核心責任。
這方面最有話語權的自然是NVIDIA,一方面是專業級的GPU加速器近乎壟斷整個行業,另一方面是消費級的GeForce RTX 40系列GPU正在各行各業變革體驗。
2018年,NVIDIA推出了全新的GeForce RTX 20系列GPU、RTX技術,首次通過專用的Tensor Core為AI提供全面加速,DLSS超分辨率技術正是AI在游戲中最領先、最直觀的體現。
即使是入門的GeForce RTX 4050筆記本電腦GPU,也可提供高達194 TOPS的算力,GeForce RTX 4090 D則能提供高達1177 TOPS的算力,覆蓋各式臺式機、筆記本、工作站,而目前沒有獨立GPU的輕量級AI PC,算力只有大約10-45 TOPS,下一代才能突破100 TOPS。
硬件之上,NVIDIA RTX也提供了極為豐富的AI相關開發套件和應用軟件加速,尤其是TensorRT可以大大加速非常熱門的AIGC模型,包括最流行的Stable Diffusion 1.5、SDXL 1.0等等,還獲得了全新UL Procyon AI圖像生成基準測試的支持。
目前,RTX AI PC已擁有超過1億用戶、500多款應用和游戲,形成了豐富的生態。
近日,NVIDIA舉辦了一場特別的RTX AI媒體品鑒會,宣布了多項AI相關內容更新,展示了多項AIGC藝術創作作品,并演示了最新的技術DEMO。
【NVIDIA RTX AI:無處不在】
在全行業的合力推進之下,AI技術尤其是AIGC正在極大普及,深入各行各業,概括起來可分為繪畫、平面設計、3D創作、視頻編輯、視頻體驗、會議/直播、文檔助手、編程開發、游戲、游戲開發等十大領域。
在每一個領域甚至每一個場景,NVIDIA RTX GPU都在提供各種創新的加速技術。
Stable Diffusion生圖繪畫,RTX GPU是PC上最快的加速方法。RTX 4090 D默認可以每秒生成8張圖,TensorRT加速后結合進一步性能優化,每秒生成超過120張圖片。
RTX GPU還是最具生產力的加速方法,支持市面上所有的SD WebUI(Automatic1111、ComfyUI、SD-Forge、秋葉等),支持最先進的SD工作流(LoRA、ControlNet、微調、AnimateDiff、IPAdapter、InstantID、實時繪畫等)。
平面設計,全面支持市面上主流的設計軟件,可為各種圖片編輯功能提供加速。
諸如智能肖像、對象選擇、細節增強、圖像超分辨率、圖片修復、色彩還原、RAW增強、天空選擇、眼部增強,等等。
來到3D設計,RTX 40 系列GPU可以為各種離線渲染器、實時渲染器提供AI加速,最近流行的D5,大名鼎鼎的UE、Unity都可以從中獲益匪淺,其中更是可以用到DLSS。
視頻編輯方面,同樣支持主流軟件工具,功能也相當豐富,比如對象遮罩、自動場景檢測、自動畫面重構、視頻超分辨率、銳化遮罩、顏色矯正、語音識別、人體跟蹤、風格轉換、視頻補幀等。
視頻體驗方面,最值得一提的是RTX VSR超級分辨率、Video HDR,可大大增強在線視頻的畫質體驗,支持在Chrome、Edge瀏覽器內播放任意視頻,支持國內主流視頻網站,而且是驅動自帶功能,無需額外下載任何軟件、插件。
無論是最新的RTX 40系列,還是早期的RTX 30/20系列,都可以享受這一福利。
會議與直播方面,NVIDIA Broadcast提供了非常完美的解決方案,通過目光接觸、人臉跟蹤、背景模糊、自動聚焦、視頻降噪、虛光、回聲消除等等,可帶來最佳的流媒體質量優化。
它支持市面上幾乎所有的視頻會議軟件、直播軟件,包括騰訊會議、釘釘、飛書、Teams、OBS等等,RTX 40/30/20系列都能用。
人機交互方面,AI對話、文檔整理是典型的應用,NVIDIA也打造了ChatRTX技術Demo。,用于本地增強檢索生成。
它可以使用本地的RTX 40/30 系列 GPU (8GB及以上顯存) 算力加速,進行大語言模型推理,智能離線檢索本地隱私文檔(txt/docx/pdf等等)并生成結果,尤其是支持中文對話模型和文檔檢索,包括智譜ChatGLM3等等,開發者還可以自行添加其它支持TensorRT-LLM加速的大語言模型。
更關鍵的是,ChatRTX是免費的,而且開源。
開發方面,TensorRT可以說是當前市面上最快的深度學習推理加速框架,尤其是支持領先的中文開源模型,RTX 40/30/20 GPU都可以跑。
推理性能上,相比于LlaMA.cpp,它的生成速度可以領先多達4倍,Batch Size越大優勢越明顯。
Stable Diffusion生圖上,相比于通用的PyTorch,速度可以輕松翻番,更是可以輕松碾壓蘋果CoreML框架。
游戲應用中最典型的就是實時光追、DLSS的聯手,可以根據需要,選擇不同的質量和速度,這個就不多說了。
游戲上的典型例子就是NVIDIA RTX Remix,可以讓DX8、DX9老游戲煥發新生,自動捕獲游戲場景和材質,通過AI進行增強,并加入實時光追、DLSS 3/3.5,傳送門RTX版就是最佳例子。
硬件方面支持RTX 40/30 GPU。
事實上,NVIDIA已經為全領域AI開發提供端到端的開發平臺支持,開發、訓練、整合、部署都能獲得RTX GPU的加速。
Omniverse、Nemo、DLSS、ACE、Optix、VSR、Maxine、TensorRT、CUDNN……如此豐富的開發工具,恐怕僅此一家。
【合作案例1:火星時代教育的TensorRT SD創作加速指南】
Stable Diffusion是文生圖、圖生圖創作最廣泛的應用,已經有大量設計師、藝術家甚至普通辦公族用它來加速工作,前文也說過NVIDIA TensorRT可為其帶來無可比擬的加速。
不過,Stable Diffusion仍然存在相當的學習和使用門檻,TensorRT也需要一定的摸索。
因此,火星時代教育在NVIDIA技術團隊的支持下,打造了《NVIDIA TensorRT Stable Diffusion創作加速指南》,為AI設計愛好者和創作者詳細介紹基于RTX 40系列GPU提升Stable Diffusion創作效率的詳盡實操性教程。
在這個指南里,你可以看到Stable Diffusion/TensorRT的安裝與設置、加速引擎的構建、加速效果的對比,以及實際商業創作場景應用,包括海報設計、電商設計、室內效果圖設計、插畫設計等等。
《NVIDIA TensorRT Stable Diffusion創作加速指南》鏈接:
https://www.hxsd.com/pdf/viewer/HXSD-NVIDIATensorRT-GuideBook/
設計案例:
【合作案例2:吐司的SD GPU配置推薦】
Stable Diffusion的使用門檻還有硬件層面,GPU算力越強出圖速度自然就越快,但不同級別的GPU到底有多大差異呢?
作為行業第一家實現在線生圖的AI模型社區,吐司(國際版為Tensor.Art)已經匯聚超過16萬的AI模型,如今聯合NVIDIA打造了一份《個人用戶玩轉Stable Diffusion的GPU配置推薦》。
它使用第三方軟件UL Procyon AI基準測試和吐司自己的Benchmark,完整測試了RTX 40系列桌面、筆記本顯卡不同型號在SD 1.5 和SDXL 1.0中的推理性能表現,可以作為AIGC用戶創作的參考。
個人用戶玩轉Stable Diffusion 的GPU配置推薦鏈接:
https://tusi.cn/event/nvidia
UL Procycon SD 1.5、SDXL桌面顯卡性能對比:RTX 4090D都是一枝獨秀,RTX 4060 8GB則已經無法支撐SDXL。
UL Procycon SD 1.5筆記本顯卡性能對比:可以看到RTX 4080和RTX 4070筆記本電腦GPU 之間出現了一個較大的空檔,RTX 4090筆記本電腦GPU領先的幅度則不是很大。
UL Procycon SDXL筆記本顯卡性能對比:只剩下高端的RTX 4090/4080 筆記本電腦GPU可以運行,其他都被淘汰。
吐司Benchmark SD 1.5/SDXL桌面顯卡開關TensorRT加速性能對比:可以看到在任何級別的型號上,加速效果都十分顯著,實現翻倍的生圖性能提升(RTX 4070 Ti, SD1.5 測試)。
RTX 4090筆記本電腦GPU、酷睿Ultra核顯分別使用各家優化引擎,測得的性能差異簡直是云壤之別,兩者性能相差高達驚人的27倍!
LoRA性能也可以測試,性能差異一目了然,RTX 4090D依然遙遙領先。
【AI加速創作:藝術與技術的激情碰撞】
AIGC給藝術創作帶來了無限可能,可以將設計師、藝術家的種種創意快速轉化為現實,從而大大提升創作效率,節省出來的時間可以追求更多奇思妙想。
當然,AI不會無中生有,更不可能取代人類,它只是一個幫手,它生成的圖片、視頻也只是創作的基礎,就像一個畫板,只有在人的畫筆之下,才能真正成為作品,成為藝術品。
NVIDIA已經與大量創作人士進行了合作,利用RTX AI加速,幫助他們盡情揮灑創意,奉上更驚艷的藝術作品。
土豆人Tudou_man:數字藝術家、策展人
數字藝術家土豆人Tudou_Man 表示:“每天有大量AIGC內容涌現,宛如微小的青苔連續改寫當下。不久,我們的文明也將被數字所覆蓋。通過RTX 40系列AI PC平臺的運算加持,震驚之余,我使用RTX 40系列 RTX AI PC創作了《復寫苔原》系列作品,RTX 平臺為像我這樣的數字藝術家提供高效的AI算力加速。我將AIGC作品注入人的思考與靈魂,在不可逆的數據洪流中保持本真。”
這里摘錄幾個土豆人Tudou_Man的AIGC作品:
《咖啡浪潮的1000次演進》:
為2023年的上海咖啡文化周創作的AIGC概念作品。
以上海蘇州河游船為創作原型,采用實景采集與MidJourney、Stable Diffusion組合的方式創作,通過上千次的疊加演算,近乎真實地讓浪花載著一杯巨大的外賣咖啡出現在蘇州河上。
《不落冰川系列-001》:
視頻作品通過MJ+SVD+Deforum創作,將之間一組系列作品做了動態化演繹。
冷風吹動的藍色塑料布像極了黑沙灘上舞動的冰川,而冰川之下是克蘇魯內核的滋長,無盡變化的水母不斷循環叩擊著夢境。
《戴圍巾上海老建筑系列》:
把晚霞做成了毛絨絨的圍巾,掛在了武康大樓、外灘鐘樓、和平飯店上,圣誕氛圍拉滿。
《巨大的小熊軟糖系列》:
這是一組AIGC+實景合成的巨物化創意作品,超寫實的城市場景與可愛的巨大軟糖熊形成了反差萌。
《麥麥博物館》:
麥當勞“傳家寶”,將麥當勞的超級單品與中國館藏文物相結合,得到了麥當勞中國官方支持。
《鉆石大都會》:
為全新雅詩蘭黛白金唇膏創作的AIGC概念短片。
在寶石般的億萬切面中,一覽大都會的璀璨華美,城市的摩登奢華又在琉光中筑成一枚唇間的藝術品,可能這就是白金唇膏令人愛不釋手的理由。
Simon阿文:AbleSlide聯合創始人、Blender藝術家、AI創作者
包括央視春晚AI動畫等作品在內,從文字、圖像到影像,他的許多探索是基于本地RTX 4090顯卡完成的。他表示:“AIGC的可能性是一片藍海,AI PC是我的帆船。”
《維度筆觸》:
將傳統油畫與現代3D建模、AIGC相結合,油畫紋理均為Disco Diffusion生成,數字精確性與藝術表達相遇。
《擱淺的云》:
通過Blender制作簡模,使用ComfyUI搭建工作流進行AI轉繪,把AI渲染應用到傳統的3D工作流中。靈感來自海辛的短篇《擱淺的云》中的一句話:“我在海邊遇到一朵擱淺的云。”
《低俗小說》:
將《低俗小說》中著名的搖擺舞,通過AI的方式轉繪為油畫、皮影戲、雕塑等多個風格并進行重新剪輯,達到一種多元宇宙的視覺效果。
《花中維納斯》:
系列作品,花卉和維納斯的經典形象在一個迷人的舞蹈中融合。通過AI的力量,這些靜態圖像被轉化為一種動態體驗,每一片花瓣都在綻放的微妙芭蕾中緩緩展開,見證維納斯的重生。
【NVIDIA RTX DEMO:游戲NPC變“真人”】
接下來的環節,看看NVIDIA的幾項RTX AI加速技術演示Demo,其實大部分都是大家的老朋友了,這次難得在線下一次性都體驗到。
重點看看ACE微服務數字人,主要應用就是游戲里的NPC。
它利用基于NVIDIA Audio2Face的面部動畫、基于NVIDIA Riva自動語音識別(ASR)/文本轉語音(TTS)的語音交流,讓虛擬數字人物真正鮮活起來。
通過將認知、感知、行為系統集成在一起,結合多模態展示,不但渲染出來的角色令人驚嘆,而且不再每次都是固定、死板的對話和動作,而是完全根據玩家的語音、文字交互,實時給出動態、匹配的反應,游戲節奏和進程可以每次都是截然不同的。
AI NPC可以通過混合式AI,使用預訓練定制的大語言模型進行聆聽、處理、生成對話,并做出回應,而且每個步驟都是實時的,以確保流暢對話。
第一步,Riva利用RTX PC的GPU加速的多語種語音和翻譯微服務,處理玩家輸入的語音,生成實時對話式AI工作流。
第二步,ASR處理語音內容,并利用AI實時提供非常準確的轉錄文本,支持涉及二十多種語言。
第三步,轉錄文本進入LLM(例如Gemma/Llama 2/Mistral),并借助Riva的神經網絡機器翻譯,生成以自然語言表述的文本回復。
第四步,使用Riva的文本轉語音功能,生成音頻回復。
第五步,A2F生成面部表情,并與對話同步。
期間,RTX AI PC會自動制作NPC面部、眼睛、嘴巴、舌頭和頭部動作的動畫,并與情緒范圍和強度水平匹配,A2F還可以根據音頻片段自動推斷情緒。
年初的CES上,我們第一次見識到了ACE NPC的表演,就是那段“吃面”,由NVIDIA與ConvAI合作打造。
3月份的GTC技術大會上,NVIDIA又帶來了更震撼的演示DEMO Covert Protocol。
它基于UE5引擎開發,結合了ACE技術和Inworld AI引擎,玩家在其中扮演一名私家偵探,在一家酒店大廳內,與前臺、服務生、專家共三名NPC進行互動,完成預定任務。
他們都會根據玩家的交互做出不同的反應,這就考驗玩家如何變著花樣套出自己所需要的信息,每次都不一樣,可玩性非常高,以往那種看都不看就跳過NPC互動的情況再也不會出現了。
另一個重點是ChatRTX,使用檢索增強生成(RAG)、NVIDIA TensorRT-LLM加速庫、通過NVIDIA RTX加速,可以快速、輕松地將本地文件作為數據集,連接到開放式大語言模型(比如智譜AI ChatGLM3-6B),快速查詢與上下文相關的答案。
ChatGLM是基于GLM預訓練框架的雙語對話模型,采用了獨創的多階段增強預訓練方法,包括6B、12B、32B、66B等多種參數規模,并支持NVIDIA TensorRT-LLM框架等多種加速工具,從而在合理的精度損失下提升推理速度。
除了文本之外,ChatRTX還很快將增加支持語音輸入和圖像功能。
圖片已獲授權
SD專業工作流:
通過人像生成控制模型InstantID,足不出戶就能使用普通攝像頭的自拍照,生成影棚級別的高質量肖像照,并且可以用RTX GPU進行加速。
SD一秒生成8張圖:
作為市面上最快的Stable Diffusion計算生圖工具,RTX 4090 D可以做到高達每秒8張圖的生成速度,而且是開箱即用,無需任何復雜設置。
使用當前最快的加速方法TensorRT,再配合進一步的性能優化,RTX 4090 D GPU最高能實現每秒超過120張圖的生成速度,生圖創作也能像高幀率游戲一樣絲滑。
建筑實時渲染:
即致AI基于擴散模型和蒸餾技術,通過RTX 40 系列GPU的加速,實現了秒級的AI實時繪畫。
再結合即致AI自研的全網下載量超50萬的國內建筑行業大模型,可以幫助建筑設計師快捷、便利地進行AI實時渲染,并保證極高的出圖效果。
聲音克隆:
基于開源的GPT-SoVITS項目,不需要任何訓練,僅需5秒鐘的聲音樣本,就能根據其發音特征,生成個性化的語音,RTX AI的加速下僅僅幾秒鐘就能完成生成。
如果使用更多樣本的微調訓練,比如1分鐘,還可以實現更高質量,接近1:1復刻的聲音克隆。
AI PC時代雖然才剛剛開始,但已經百花齊放、精彩紛呈。作為AI PC的算力基礎,CPU、GPU、NPU三大引擎也都在各顯其能、爭奇斗艷。
當然了,三者沒有誰比誰更重要,只有誰更適合做什么。
RTX GPU作為當今的硬件算力天花板,再加上NVIDIA強大的技術實力、豐富的開發與應用生態、無比的行業號召力,無疑最為適合需要強悍性能的AI應用,既能帶來最快的速度,也能帶來最好的質量、兼容性和穩定性。
本次介紹的種種RTX AI加速應用,遍布于游戲、2D/3D設計、藝術創作、生產力、垂直行業等方方面面,都給人帶來了耳目一新的感覺,無論速度還是質量都堪稱翹楚。
期待RTX AI、AI PC能帶來越來越多的精彩應用,真正讓AI普及到每一個人的生活、工作、娛樂之中,釋放技術之美,全方位變革普羅大眾的日常體驗。