言
英特爾在去年底正式發布了新一代移動端處理器,酷睿Ultra系列,堪稱英特爾40年來最大的架構變革。該系列處理器的亮點之一就是首次在客戶端芯片上加入了神經處理單元(NPU),從而大幅提升了筆記本的AI性能表現。這標志著個人電腦(PC)不再僅僅是執行日常簡單任務的工具,而是變成了能夠處理復雜AI運算的高性能設備,為開發者和用戶提供了更廣泛的創造能力。
隨著各大廠商紛紛推出搭載新處理器的產品,在PC本地部署大模型已成為可能。本地部署大模型是指在本地計算資源(如個人計算機、服務器或專用硬件)上安裝、配置和運行大型人工智能模型的過程,而不是通過云服務或遠程服務器訪問這些模型。這種部署方式允許用戶直接在本地設備上處理和分析數據,而無需將數據發送到外部服務器。過去受限于硬件的計算能力,本地部署往往只適用于搭載了專業硬件的昂貴設備;但隨著技術的發展,普通電腦用戶現在也可以在筆記本這樣的消費級電腦上部署大模型,領略AI的魅力。
本地部署大模型的優勢主要體現在以下幾個方面:
隱私和安全性:對于處理敏感或私有數據的應用,本地部署可以減少數據泄露的風險,因為所有數據都儲存在本地,沒有通過互聯網傳輸。
性能和響應時間:本地部署可以減少網絡延遲對響應時間影響,特別是在需要實時或近實時處理的應用中。直接在本地硬件上運行模型可能更快地獲得結果。
可靠性:本地部署模型不依賴于持續的云服務連接,這意味著即使在網絡連接不穩定或中斷的情況下,應用仍然可以正常運行。
成本控制:雖然本地部署需要前期投資購買硬件設備,但從長遠看可以避免持續的云服務費用,特別是對于需要大量計算資源的任務。
自定義配置:本地部署允許用戶根據具體需求定制硬件和軟件配置,提供更高的靈活性和控制能力。
在以往,本地部署大模型的最大缺點可能就是高性能計算硬件帶來的不菲費用。如今,隨著PC性能的進步,本地部署對普通用戶已不再是遙不可及。不過,在PC部署大模型并非完美無缺?,F階段單一PC的性能仍不能與大型企業使用的專業設備媲美??梢灶A料的是,在PC上部署的大模型同企業提供的API在性能、效果等方面會存在一定差距,但這并不會掩蓋本地部署的價值。下文為針對某款32GB內存版本的PC進行本地部署大模型的簡單實測。
初步測試
本文選擇了幾款輕量模型并對它們在PC上的表現進行了簡單評估,包括gemma-2b-it、gemma-7b-it、gemma-7b-it-fp16、qwen-4b-chat、qwen-7b-chat以及qwen-14b-chat。評估覆蓋了量化參數、文件大小、CPU與內存占用、英文和中文的生成速度,結果如下:
初步評價
● gemma-2b-it模型在文件大小和生成速度上表現出色。
● 7b以上的模型生成速度在實際測試中體驗不佳,可感到明顯卡頓。
● gemma-7b-it-fp16未進行量化,雖然文件體積大,但適合對生成質量有更高要求的場景。
● 對于測試用的一組相對簡單的問題的中英文版本,幾個模型的對應的中英文回答無明顯差異。(測試問題見文末)
綜上,以下選擇 gemma-2b-it(4-bit 量化版本)與qwen-4b-chat(4-bit 量化版本)進行進一步測試。
進階測試
模型本身知識(詳細問題見文末):
l 案例1 新聞知識問答
為測試模型的時效性,即其能夠根據最新的新聞內容提供答案的能力,我們模擬了一個金融場景下的問答。我們提供一則關于大眾投資小鵬汽車的金融新聞,并讓兩個模型回答大眾的投資金額。
gemma-2b-it和qwen-4b-chat均回答正確。
l 案例2 錯誤的召回知識問答
接下來我們模擬提供的知識和問題并不相關的情況,測試模型能否回答不知道。我們同樣給出大眾投資小鵬汽車的金融新聞,但問奧迪對小鵬的投資金額,注意,這個問題不是在新聞中可以獲得的信息。
gemma-2b-it正確回答了不知道,但qwen-4b-chat未作出合適的回答。
l 案例3 非常識性知識問答
不同于常識性的知識可由訓練數據的增多得到加強,小眾的專業領域知識以及人為編造的知識一般很少會被包含在模型之中。這個例子中,我們提供一段和游戲 《我的世界》中紅寶石相關的語料,并問模型如何獲得紅寶石。
英文下,gemma-2b-it和qwen-4b-chat均只回答出了3種正確方式中的2種。
中文下,gemma-2b-it只回答出一種,但qwen-4b-chat回答出了全部正確方式。
l 案例4復雜來源的輸入
在實際業務場景中,經常會遇到多種多樣的文本格式。這個例子中,我們提供 GitHub 中的一個與 Tailwind CSS 有關的 README.md——這個文檔因含有大量的 Markdown 記號所以內容較復雜——然后詢問模型哪些網站使用了Tailwind。
gemma-2b-it和 qwen-4b-chat各自回答了不同的部分網站,但都正確。gemma-2b-it在中文下措辭稍有不足。
l 案例5數學計算問題
數學計算問題指的是需要運用數學方法和原理來解決的問題。不同于前幾個問題對答案有或多或少的寬容度,數學計算問題需要極其完善的邏輯推理才能被準確回答,即使是簡單的加減乘除運算。我們提問了一個百位數乘千位數的問題。
gemma-2b-it和qwen-4b-chat均回答錯誤。
外掛知識庫:
l 在WebUI中上傳相同內容的pdf及docx文件,并測試模型能否總結全文以及抽取關鍵信息。結果如下
l 部分截圖如下
實測總結
實測中重點測試的兩個模型各有所長。gemma-2b-it 更適合需要快速文本生成和處理中文內容的場景,但需要注意其在處理特定文檔格式上的限制。qwen-4b-chat 顯示出更好的外掛文檔處理能力和較高的文檔兼容性,盡管在總結能力上有待提高(外掛長文本總結可考慮7b版本),但在信息抽取方面表現良好。針對特定場景應根據具體需求考慮模型的生成速度、處理能力和文檔兼容性擇優選擇模型。
未來展望
芯片制造及軟件技術正蓬勃發展,可以預料AI PC在將來會有以下方面的進步:
硬件改進:隨著專門為AI計算設計的硬件變得更加普及并集成到消費級PC中,本地與基于云的模型性能之間的差距將縮小,使得更復雜的模型能夠在PC上高效運行。
軟件優化:模型優化技術的進步將在使大型模型更適合PC部署中發揮關鍵作用。如模型剪枝、量化和知識蒸餾等技術將允許在減少計算需求的同時保持模型性能。
去中心化:未來可能會看到向去中心化AI生態系統的轉變,其中模型不僅被共享,還由全球用戶社區協作改進。去中心化使部署模型變得更加容易,并促進創新和隱私保護。
而當PC的性能日漸強大,許多曾經難以想象的AI應用將變得觸手可及,例如:
實時AI翻譯和同聲傳譯:提升的計算能力將允許PC實時處理復雜的語言模型,提供更準確、自然的翻譯和同聲傳譯,大幅提升國際交流的便捷性。
高級個性化學習:AI可以根據學習者的進度、偏好和反饋,實時調整教學內容和方法,提供高度個性化的學習體驗。這將使在線教育更加高效和吸引人。
虛擬現實(VR)和增強現實(AR)的普及:更強大的處理能力將使PC能夠流暢運行高質量的VR和AR應用,為用戶提供沉浸式的游戲、模擬訓練和遠程工作體驗。
本地AI創作:包括文本、圖像、音樂和視頻等內容的AI創作工具將變得更加強大和易用,使創作者能夠輕松產生高質量的作品,促進思想表達和內容創新。
高級數據分析和可視化:PC將能夠處理更大規模的數據集,并運行復雜的機器學習模型來分析數據,為研究、商業分析和決策提供強大支持。
實時3D渲染和模擬:在工程設計、建筑、游戲開發等領域,更強的計算能力將允許實時渲染復雜的3D模型和環境,加速設計和測試過程。
智能家居和物聯網(IoT)集成:PC將成為家庭智能設備管理的中心,能夠處理和分析來自各種設備的數據,提供更加智能化和個性化的家居體驗。
高效能的個人助理:基于AI的個人助理將因更強大的計算能力而變得更加智能,能夠更好地理解和預測用戶的需求,提供更加貼心和高效的服務。
深度偽造檢測和網絡安全:隨著PC性能的提升,可以期待更加強大的客戶端安全工具出現,用于檢測和防范深度偽造內容和各種網絡攻擊,保護用戶的隱私和數據安全。
云游戲和云計算服務的本地化:原本需要依賴云端服務器處理的高負荷任務,如高端游戲和專業軟件,可能會逐漸轉移到本地處理,減少對網絡連接的依賴,降低延遲,提高用戶體驗。
結語
隨著新一代處理器的推出,個人計算機的AI性能和應用范圍已迎來歷史性的飛躍。從實測結果來看,即使面臨性能、效率以及兼容性的挑戰,本地部署大模型仍然展現出巨大的潛力和多樣的應用前景。這不僅僅是技術進步的象征,更是開啟了個人用戶探索AI世界的新篇章,使得復雜數據分析、內容創作、虛擬現實等高級AI功能不再是云計算和大型數據中心的專利。展望未來,個人計算機的AI能力提升將會促進新一代軟硬件解決方案的出現,推動AI技術的普及,使得更多的個人和小型企業能夠利用強大的AI工具來解決實際問題、創造新的價值。這個社會正處在這場技術革命的前沿,每一個創新都可能解鎖前所未有的機遇,為人類的工作和生活方式帶來深刻的改變。
嘍大家好,我是小分手。我是一名在深圳工作的某品牌車企的資深內外飾設計工程師,作為一名資深的設計工程師,平時我主要在平面設計、AI繪圖、3DS Max渲染以及復雜模型曲面制作等場景進行創造生產力。這讓我對電腦的性能要求非常高。
我們都知道CPU在計算的時候數據都是在內存條中進行處理,因此在大量的數據需要處理的時候內存條的容量以及它的工作頻率對電腦的性能影響尤為重要。無論處理器顯卡配置有多高,如果內存條的容量不足的話電腦的性能一定會嚴重的拖后腿。因此超大容量的內存已經逐漸成為專業用戶的剛需。而光威神策DDR596GB很好的滿足了我的需求。
它不僅擁有超大的容量,優秀的性能還擁有高顏值、夢幻水晶一樣的發光。它搭載的是最新的海力士M-die顆粒,單顆容量為3GB,單條內存雙面布置16顆共計48GB的容量,出廠即擁有6400MHz的工作頻率。要知道雙面顆粒的大容量內存性能一般相對較弱。
下面我們就來看看光威神策DDR596GB的性能到底怎么樣。裝機后在主板的BIOS中選擇XMP,一鍵超頻到6400MHz,此時時序低至CL32。進入 windows 后通過AIAD64的測試可以看到內存讀取速度為98.9GB每秒,寫入為91.9GB每秒,無顯示為95.5GB每秒,內存的延遲為7點1拉秒,這個成績是相當不錯的,并且可以完美的通過TM5內存穩定性測試。
那么我們繼續玩玩它的強力如何經過幾方測試:光為神測Save configuration and exit?最高工作頻率為7600G*[自動]。此時內存的性能讀取為108.9GB每秒,寫入為100.1GB每秒,讀顯示為101.7GB每秒,內存的延遲為七十一點一拉秒,這個性能再次提升不少。
但畢竟搞設計生產的電腦運行的穩定性很重要,因此不建議極限超頻使用,最終在7000MHz的頻率下,官光威神策96GB套條可以完美的通過TM5的測試,是它的最優工作頻率?,F在光成神策DDR596GB,是時候發光發熱了。在4K視頻線性編輯中,即便項目的素材高達幾十GB,甚至100GB以上,此時各個素材加載更迅速,剪輯也不再卡頓,相當的流暢,后期剪輯的效率大幅度提升。
而在3DS Max渲染的應用中,即便再復雜的高精度模型、復雜場景以及大量反射燈光的項目渲染中,模型打開的速度更快,渲染場景的加載也提升明顯。另外AI會務中高達幾十GB的模型庫數據加載也更快,以往打開要四五分鐘以上的,而現在1分鐘左右即可加載完畢,提升的相當明顯。不得不說大內存是真香!
總的來說,在我的創作中,光威神策DDR5 6400MHz 48GB*2,它不僅僅是提升了我的工作效率,更是提升了我的工作能力。因為效率提升,讓我有更多的時間和精力去提升我的工作創意。這個升級相當值,它的售價僅僅2599元。相比國際品牌同規格的產品,它的售價便宜幾百元甚至上千元,可謂誠意滿滿。
它的容量大、頻率高、顏值高。兩套光威神策DDR5 6400MHz 48GB*2,還可以組建192GB的超大容量內存。不過4條的話建議降頻使用,以確保穩定性。
如果你從事專業工作,電腦需要大量數據處理,那么升級大容量內存很有必要。這套光威神策DDR5 6400MHz 48GB*2的套條安利給你。
生活中經??梢砸姷侥P?,房子、汽車、電腦、風扇,都是,這些東西都是經過不斷改進造成的,并不是一下子就完成的,造手機,先得造工程樣機,看是否好用,才能大批量生產。
你每天起床,穿衣服、洗漱、吃早餐、上班,都是需要模型的,不可能每天都推理一遍自己要做什么,都是需要參考模型的。
國家管理也是需要模型的,公路的寬度需要參考以往的車流量,監獄的容量需要參考犯罪率,電力的功率需要參考用電量,如果沒有模型,是不能治理國家的。
經營公司也需要模型。產品的生產需要模型,不然怎么保證產品合格、實用。產品的生產數量也是需要參考市場模型的,不然一股腦得生產,賣不出去怎么辦?產品的工藝也是需要參考市場上的模型的,不然技術落后怎么賣得出去?
模型很重要,生產產品,生活起居,政策施行,科研考察,救死扶傷都需要參考模型進行,不然,每次都推演一遍,還不把人累死