欄目導航

新聞資訊

新聞資訊

的AirPods聽起來比以前安靜嗎？一個AirPod的聲音比另一個大嗎？這里有一些技巧可以幫助你提高音量，消除與音量相關的問題。

調整AirPods的音量

在我們深入研究修復AirPods的更技術性方法之前，讓我們先檢查一下它們是否處于最佳音量水平，并在你嘗試更改音量時正確響應。如果你的AirPods連接到iPhone，按下音量降低按鈕一次，看看耳機的音量是否會降低。一旦它們做出反應，試著通過按下音量增大按鈕來增加音量，直到它們的聲音對你來說足夠大。

如果AirPods對音量按鈕沒有響應，請確保iPhone的藍牙已啟用，并且AirPods有足夠的電量。如果你確信你的AirPods已經充電，可以考慮重新啟動iPhone，看看它是否正確連接，以及AirPods是否開始對音量變化做出響應。

考慮到你的iPhone音量按鈕有可能出現故障（就像我的一樣），試著用Siri調整AirPods的音量。只需呼叫語音助手，讓它把音量調大或調低。你也可以使用控制中心來修改音量級別。如果你使用的是AirPods Pro（第二代），請嘗試使用桿上的滑動控制來調高或調低音量。在AirPods Max上，左耳杯上有一個數字表冠，可以幫助你調整音量。

檢查你的AirPods是否對音量按鈕做出響應很重要，因為這有助于我們了解是音量按鈕還是AirPods工作不正常。如果你已經嘗試了所有的方法來增加音量，但你的AirPods感覺異常安靜，下面是你接下來可以做的。

清潔你的AirPods

如果你有一段時間沒有清潔AirPods，那么這是你應該做的第一件事。由于AirPods大部分時間都在你的耳朵里，它們會積聚耳垢、灰塵和污垢。雖然最初可能不會影響音質，但過多的碎片很容易影響響度，導致AirPods聽起來不太好。

首先，用柔軟、干燥、無絨布擦拭AirPods的外部。如果你擁有AirPods Pro，請取下橡膠尖端并清潔布的兩側。使用干燥的棉簽清除揚聲器濾網和麥克風上的粘液。你還可以清潔耳機附帶的充電盒。

如果你的AirPods暴露在任何可能導致污漬或其他損壞的地方，請使用70%異丙醇擦拭AirPods（常規版、AirPods Pro或AirPods Max）的外表面。然而，蘋果公司建議不要在AirPods Max的針織網罩和耳墊上使用酒精濕巾。

對于AirPods Max的耳墊，用一塊無絨布蘸上液體洗滌劑混合物，與頭帶一起擦拭一分鐘。然而，如果你正在這樣做，請確保在放回墊子并開始使用耳機之前，將多余的水分擦干。

提醒一句：不要將AirPods淹沒或在水下運行。與iPhone不同，它們不防水，你可能會永久損壞設備。

進行耳塞貼合度測試

為了確保你使用的是正確的耳塞，并且AirPods Pro沒有聲音泄漏，請進行耳塞貼合度測試。你看，使用錯誤的耳塞會導致音質降低，讓你想提高音量以獲得更好的聆聽體驗。

將AirPods Pro連接到iPhone，然后將其放在耳朵里。進入“設置>[你的]AirPods”，點擊信息圖標。

滑動到頁面底部，點擊“耳塞貼合度測試”。

點擊“繼續”，然后點擊下一個屏幕上的播放按鈕。

如果測試表明你使用的耳塞很合適，那就好了。否則，請根據建議使用不同的耳塞。

從ANC或透明切換到常規模式

AirPods Pro和AirPods Max具有三種收聽模式。首先，有一種噪音消除模式，可以降低背景噪音的水平。然后是透明模式，它可以捕捉麥克風發出的環境聲音，并將其傳遞到耳朵中。最后但并非最不重要的是，還有常規收聽模式，它依靠被動降噪和AirPods的音質來提供平衡的體驗。

然而，有時，AirPods的降噪或透明模式會降低整體音質，對響度和清晰度產生負面影響。因此，如果你啟用了ANC或透明模式，請嘗試將其關閉，看看AirPods的聲音是否會變大。為此，從iPhone和iPad的右上角向下滑動，前往控制中心，按住音量滑塊，然后選擇所需的模式。

在Mac電腦上，你會在屏幕右上角找到這個選項，只需點擊“聲音”下的AirPods，然后選擇你想要使用的收聽模式。

關閉耳機安全

所有iOS 14的iPhone都啟用了耳機安全功能。它會自動測量音頻水平以保護你的聽力。如果你超過建議的七天限制（根據世界衛生組織制定的安全聽力指南），該功能會向你發送通知。除了響度警報，該功能還將總音量降低到特定的分貝水平。默認情況下，音頻級別降低到85分貝，大約與繁忙的街道交通一樣大。

如果你的AirPods聲音不像以前那么大，你可能已經在通知部分看到了這個警報。你的iPhone可能降低了默認音量，以減少你的響度。雖然我們贊同蘋果關于持續暴露在大噪音中會導致聽力損失的說法，但有時你可能需要在某些情況下提高音量。

以下是如何禁用耳機安全功能并恢復AirPods的響度。

前往“設置>聲音和觸感”。

點擊“耳機安全”。

關閉“耳機通知”和“降低高音量”。

檢查聲音/均衡器設置

如果你在擺弄Apple Music的均衡器設置后開始注意到AirPods的響度較低，那么你可能已經將均衡器設置為不合適的配置文件，從而扭曲音頻或抑制某些頻率。換句話說，你根本不喜歡均衡器的設置，關閉它可能會有所幫助。

前往“設置>音樂”。

選擇“均衡器”，然后在以下菜單中選擇“關閉”（這是第一個選項）。現在檢查AirPods的聲音是否更好。

如果你啟用了Dolby Atmos，請禁用該設置，看看AirPods是否感覺比以前更響。

在同一菜單中，關閉“聲音檢查”。

如果你在Mac上使用AirPods，請轉到“音樂>設置>播放”，然后禁用“聲音增強器”和“聲音檢查”。

一個AirPod比另一個安靜嗎

如果一個AirPod比另一個更安靜，很可能音頻平衡不在中心。這是AirPods用戶面臨的最常見問題之一。通常情況下，問題源于瞬時故障或立體聲設置不平衡。幸運的是，有兩種方法可以解決這個問題。

如果問題源于故障，將AirPods從耳朵上取下并放回原處可以解決問題。你也可以嘗試將AirPod放回充電盒中，等待幾秒鐘，然后再次取出，以確保完美同步。

如果問題更頑固，你可能需要手動修復不平衡的音頻。要執行此操作，請打開“設置”應用程序，然后選擇“輔助功能”。

向下滾動并點擊“音頻/視覺”。

檢查滑塊在“平衡”下的位置。如果滑塊不在中心，將其拖動到條的中間，使其頂部的值顯示為“0.00”。

重新校準AirPods的音量

將AirPods與iPhone、iPad和MacBook等不同設備配合使用，可能會導致最大音量和最小音量不匹配。但是，你可以重新校準AirPods以獲得最大響度。

當你的AirPods連接到iPhone時，可以在音樂流應用程序上播放一些內容。播放音軌時，按下音量降低按鈕直至靜音。現在，通過控制中心禁用藍牙，斷開AirPods的連接。現在，播放音樂（音樂應該來自iPhone的揚聲器）。再次將音量調低至零。現在，打開控制中心，啟用藍牙，然后重新連接AirPods。

重置AirPods并與iPhone重新配對

如果什么都不起作用，是時候將AirPods重置為出廠設置了。為此，請將AirPods插入充電盒并合上蓋子。等待大約30秒，然后將AirPods從手機殼中取出，放入耳朵。現在，進入“設置>藍牙>[你的]AirPods”，點擊信息圖標，然后選擇“忘記這個設備”。點擊“確認”啟動該過程。

一旦你從連接的藍牙設備列表中刪除了AirPods，就把AirPods放回充電盒中，但這次要打開蓋子。同時，按住充電盒上的設置按鈕，直到看到充電盒的狀態指示燈閃爍白色。最后，把你的AirPods（在充電盒中）靠近你的iPhone，幾秒鐘內，你就會看到手機屏幕上出現一個彈出窗口。按照屏幕上的說明將AirPods與iPhone連接起來。

希望你的AirPods現在聲音更大了。如果重置AirPods也不能解決問題，我建議你與Apple支持預約，并對設備進行專業診斷。蘋果可以測試你的AirPods，讓你知道你可以采取什么措施來解決這個問題。

fc110u.dll是一個動態鏈接庫文件，屬于Microsoft Visual C++ 2012 Redistributable Package的一部分。它是Microsoft Foundation Classes (MFC) 庫的一個版本，專門用于支持基于MFC開發的應用程序運行。MFC是一個用于Windows操作系統上使用C++進行本機應用程序編程的庫集合，而mfc110u.dll是MFC版本11.0的動態鏈接庫文件，為Microsoft Visual Studio 2012編程工具集制作。

mfc110u.dll文件提供了許多用于開發Windows應用程序的函數和類，這些函數和類幫助開發人員更輕松地創建和管理Windows應用程序的界面和功能。如果一個應用程序需要使用這些函數和類，它就會依賴于mfc110u.dll文件。因此，如果該文件丟失或損壞，可能會導致應用程序無法正常運行。下面詳解介紹mfc110u.dll的多種解決方法！

一、mfc110u.dll是干嘛的

首先，我們來了解一下mfc110u.dll這個文件。mfc110u.dll是Microsoft Foundation Class（MFC）庫中的一個重要的動態鏈接庫文件。MFC是微軟提供的一種為C++語言編寫windows桌面應用的框架。此類dll文件包含程序在運行時所需要調用的一些功能、命令及資源，它有助于程序實現各種操作，比如生成窗體、處理文件和圖形、實現網絡功能等。

當系統或應用程序缺少mfc110u.dll文件時，就可能導致無法正常運行的問題。那么我們該如何解決呢？接下來讓我們分段落進行詳細說明。

提供MFC類庫: 包含了MFC類的定義，這些類為開發Windows原生界面的應用程序提供了基礎框架。
用戶界面開發: 支持創建和管理窗口、對話框、控件等用戶界面元素，使得開發者能夠快速構建圖形用戶界面。
文檔/視圖架構: 實現文檔-視圖架構，幫助開發者分離數據處理邏輯和用戶界面展示。
事件處理: 管理應用程序中的事件和消息循環，包括鼠標點擊、鍵盤輸入等。
資源管理: 支持訪問和加載資源文件，如圖像、字符串表和對話框模板。
繪圖和圖形渲染: 提供繪圖和圖形處理功能，支持GDI和GDI+。
數據庫支持: 通過ODBC或DAO等接口，簡化數據庫應用程序的開發。
網絡編程: 支持TCP/IP、HTTP等協議的網絡通信功能。
多線程支持: 便于在應用中實現多線程處理，提高程序效率和響應性。
異常處理: 集成了C++異常處理機制，增強程序健壯性。
序列化: 支持對象的持久化存儲和加載。
ActiveX和COM支持: 允許應用程序與其他組件或控件交互。
打印支持: 簡化打印功能的實現過程。
國際化和本地化: 支持多語言界面和區域設置，便于開發國際化的應用。
性能優化: 內置的優化機制有助于提升應用程序執行效率。
兼容性: 保障基于MFC的應用程序在不同Windows版本間的兼容性。
應用程序框架: 為應用程序提供基本的啟動、初始化、消息循環和清理等框架結構。
調試輔助: 配合Visual Studio等開發環境，提供調試支持，幫助開發者診斷和修復代碼錯誤。

二、mfc110u.dll丟失的多個解決方法

第一、使用系統文件檢查工具（SFC）

1.以管理員權限運行命令提示符

要使用系統文件檢查工具（SFC），用戶首先需要以管理員權限運行命令提示符。這可以通過右鍵點擊開始菜單或在搜索欄輸入“cmd”后，右鍵點擊命令提示符圖標并選擇“以管理員身份運行”來完成。根據微軟官方文檔，以管理員身份運行命令提示符可以確保用戶有足夠的權限來執行系統級別的操作。

2.執行sfc /scannow命令

在命令提示符窗口中，用戶需要輸入sfc /scannow命令并按回車鍵執行。sfc是System File Checker的縮寫，而/scannow參數指示系統立即掃描并修復丟失或損壞的系統文件。微軟官方數據顯示，SFC工具能夠識別并修復超過90%的已知Windows系統文件問題。

第二、利用計算機內部dll修復工具（實測有效）

1. 在瀏覽器頂部輸入：dll修復程序.site（按下鍵盤回車鍵打開）并下載。

2. 下載后安裝dll修復工具，然后利用這個修復工具進行相關的DLL修復。

3. 完成修復后，重新啟動計算機，并嘗試打開出現錯誤的軟件或游戲，查看問題是否得到解決。

第三、重新安裝相關程序

1 卸載問題程序

如果mfc110u.dll文件的丟失與特定程序相關，用戶應首先嘗試卸載該程序。根據軟件卸載工具的統計，正確卸載程序可以解決約70%的DLL相關問題。

2 重新下載并安裝

卸載完成后，用戶應從官方網站或可信的下載源重新下載程序的最新版本，并按照安裝向導進行安裝。

第四、更新操作系統

1 檢查系統更新

用戶應檢查并安裝所有可用的Windows更新，包括安全更新和功能更新。微軟官方數據顯示，定期更新可以提高系統的穩定性和安全性。

2 安裝最新更新

安裝最新更新后，用戶應重啟計算機以確保更新生效。這一步驟有助于解決由于系統版本過舊導致的DLL文件丟失問題。

第五、從回收站恢復

1.檢查回收站看是否誤刪了mfc110u.dll文件，如有則還原。

第六、檢查依賴項

確保mfc100u.dll所依賴的其他DLL文件或庫文件都存在且未損壞。

第七：清理注冊表

有時候注冊表中的錯誤或過時的條目可能會導致DLL文件無法正確加載，使用注冊表清理工具可能有助于解決問題。

第八、系統還原

1.如果之前設置了系統還原點，可嘗試還原到mfc110u.dll未丟失前的狀態。

第九：、恢復出廠設置

1.作為最后手段，如果其他方法無效，考慮恢復出廠設置（注意備份數據）。

三、mfc110u.dll丟失的原因

系統文件被病毒或惡意軟件感染：病毒或惡意軟件可能會刪除或破壞系統文件，包括mfc110u.dll。
程序安裝或卸載不完整：如果程序在安裝或卸載過程中出現問題，可能會導致mfc110u.dll文件丟失。
系統更新或修復：在某些情況下，系統更新或修復可能會刪除或替換mfc110u.dll文件。
硬件故障或意外刪除：如果硬盤出現故障，或者用戶不小心刪除了mfc110u.dll文件，也可能導致其丟失。
此外，mfc110u.dll文件丟失可能是由以下幾種原因導致的：
系統文件損壞：由于病毒、木馬或其他惡意軟件的攻擊，或者由于誤操作、意外斷電等原因，可能會導致mfc110u.dll文件損壞或丟失。
軟件卸載不徹底：當我們卸載某個軟件時，可能沒有完全刪除與其相關的所有文件，導致mfc110u.dll文件丟失。
系統更新：在操作系統進行更新時，可能會對系統中的一些文件進行替換或刪除，從而導致mfc110u.dll文件丟失。
硬件故障：硬盤損壞、內存故障等硬件問題也可能導致mfc110u.dll文件丟失。
軟件沖突：當我們安裝了多個軟件或游戲時，它們之間可能會產生沖突，導致mfc110u.dll文件丟失

三、如何預防mfc110u.dll文件再次丟失

為了預防mfc110u.dll文件再次丟失，可以采取以下措施：

定期更新驅動程序：保持系統和驅動程序的更新是防止DLL文件丟失的關鍵。確保安裝了最新版本的DirectX驅動程序，因為mfc110u.dll是DirectX的一部分。可以通過訪問微軟官方網站來獲取最新的DirectX安裝包。
1.安裝必要的軟件包：確保系統中安裝了Microsoft Visual C++ Redistributable Package，這個包包含了應用程序運行所需的Visual C++庫文件，包括mfc110u.dll。如果已經安裝，請確保是最新版本。
2.使用可靠的DLL文件來源：如果需要手動下載mfc110u.dll文件來替換，務必選擇可信的來源，以確保文件的安全性和完整性。
3.定期進行系統維護：定期運行系統文件檢查器（SFC）掃描，以檢測和修復系統文件的損壞或缺失。同時，保持防病毒軟件的更新，以防止惡意軟件損壞系統文件。
4.創建系統還原點：在系統穩定時創建系統還原點，以便在遇到問題時能夠快速恢復到之前的狀態。
5.注意軟件安裝和卸載：在安裝新軟件或卸載程序時，注意是否有提示缺少某些組件，這可能會影響系統文件的完整性。

通過上述措施，可以大大降低mfc110u.dll文件丟失的風險，并確保計算機系統的穩定運行。

四、缺失mfc110u.dll的后果

應用程序無法啟動：最直接的后果是依賴于MFC庫的應用程序無法打開，顯示缺少mfc110u.dll錯誤信息。
錯誤提示：用戶界面彈出錯誤消息，指出mfc110u.dll未找到或丟失。
游戲崩潰：使用MFC的游戲可能在啟動時崩潰或無法加載。
軟件功能受限：即使部分軟件能夠啟動，也可能缺少某些功能，因為mfc110u.dll包含了關鍵的庫函數。
系統穩定性下降：頻繁的錯誤報告和應用程序崩潰可能降低整個系統的穩定性和性能。
系統緩慢：錯誤處理和資源管理問題可能導致系統響應變慢。
兼容性問題：某些舊版或特定版本的軟件可能無法在新系統上運行。
打印功能失效：MFC庫支持的打印功能可能無法工作。
網絡連接問題：如果mfc110u.dll與網絡組件相關，可能影響應用程序的網絡通信能力。
UI元素缺失：用戶界面可能缺少控件或顯示不正確，影響用戶體驗。
數據庫訪問失敗：依賴MFC數據庫類的應用可能無法連接數據庫。
多線程錯誤：應用程序中的多線程操作可能因mfc110u.dll缺失而失敗。
異常處理失效：可能導致程序在遇到錯誤時直接崩潰，而不是優雅地處理異常。
文件讀寫問題：文件操作功能可能受限，如保存、打開文件失敗。
內存泄漏：MFC庫負責的部分資源管理功能缺失，可能導致內存使用異常增長。
軟件升級失敗：現有軟件可能無法順利升級，因為更新過程依賴MFC庫。
注冊表錯誤：關聯的注冊表項可能因mfc110u.dll缺失而出現錯誤或混亂。
配置文件損壞：應用程序的配置文件可能因錯誤處理不當而受損。
安全風險：使用不受信任來源的DLL文件可能導致系統被惡意軟件感染。
系統恢復失敗：依賴MFC庫的系統恢復或備份工具可能無法正常工作。
驅動程序問題：某些硬件驅動可能間接依賴MFC庫，導致驅動不正常。
系統更新中斷：缺失的DLL可能阻礙系統更新進程。
資源占用增加：系統和應用程序可能因錯誤處理消耗更多資源。
性能監控失效：依賴MFC的性能監控工具可能無法提供準確數據。
開發環境問題：使用MFC開發的應用在編譯或調試時遇到障礙。
腳本和宏錯誤：使用MFC組件的自動化腳本或宏可能無法執行。
多語言支持缺失：MFC支持的國際化功能受影響，導致界面顯示不正確。
圖形渲染問題：圖形處理或渲染功能受限，影響視覺效果。
聲音和多媒體問題：與多媒體播放或聲音處理相關的功能可能不工作。
網絡共享和協作問題：影響應用程序的網絡共享和協作功能。
服務停止：后臺服務依賴MFC庫可能停止運行。
應用程序兼容性助手警告：Windows可能頻繁提醒用戶存在兼容性問題。
自定義控件失效：基于MFC的自定義控件無法正常工作。
錯誤日志累積：系統和應用程序日志中頻繁記錄mfc110u.dll相關的錯誤信息。
系統恢復點創建失敗：可能無法成功創建新的系統恢復點。
虛擬環境問題：在虛擬機中運行的依賴MFC的應用可能遇到特定問題。
軟件認證失敗：軟件的正版驗證可能因缺少必要組件而失敗。
用戶教育與培訓需求：用戶可能需要學習如何應對頻繁出現的錯誤提示和系統不穩定情況。

綜上所述，通過規范軟件安裝、維護更新、實施防護措施以及謹慎管理權限，可以在很大程度上減少系統文件（如mfc100u.dll）丟失的風險。同時，教育用戶養成良好的電腦使用習慣也是十分重要的。

文章來自互聯網，不代表電腦知識網立場。發布者：電腦知識網，轉轉請注明出處：https://www.pcxun.com/n/115751.html

記員這個職業大家都不陌生，他們能在各類場合高效迅速地將演講內容轉化為會議記錄。如果把速記員變成軟件，其核心功能就是語音識別 + 轉寫。這類需求使用場景廣泛，在線視頻 AI 字幕、線上會議 / 網課的速記、生肉番劇 / 電影 / 歌曲字幕的制作和轉譯、通話錄音等等，都會用到。

速記的精髓在于速度，快最重要，但在很多場景中，無論是人力還是軟件，都無法達到超快的轉寫速度和準確率，而滿足專業用戶高效轉寫需求的工具，往往需要付費獲取。如某品牌的語音轉寫暢想包訂閱費用是 79 元連續包月，599 元 / 年；另一款則需要注冊企業用戶，然后找客服咨詢費用標準，據說標準版費用是每個用戶 199 元 / 年，高級版費用則是每個用戶 299 元 / 年。

對企業 / 專業用戶來說，付費訂閱軟件一定最佳選擇，它們的速度快、無需高性能硬件成本（GPU）、準確率高、支持人工精校，肯花錢甚至可獲得一對一的專屬客服支持，但如果只是偶爾使用性價比就不是很高了。

另外，這些訂閱軟件的 AI 服務，通常需要用戶將原始的視頻或音頻文件上傳到服務器和全程聯網，且通過廠商的專業設備在云端運行，如果視頻或音頻文件中包含個人隱私 / 商業等內容，顯然也不太合適。

關于 Whisper

那有沒有一款完全免費開源，不需要聯網，完全依賴本地硬件算力去跑語音識別和轉寫，準確率還不低的語音轉寫軟件呢？或許喜歡關注 AI 領域的朋友早就有了答案，它就是來自的 OpenAI 團隊所開發的 Whisper。從官網的介紹文章日期上不難看到，Whisper 早在 2022 年 9 月就已經推出，但時至今日它依舊是最好用的免費語音轉寫工具。

說它最好用原因有三點，一是它的語種支持廣泛（99 種），二是轉寫速度超快，三是識別準確性很高，且只需要一張高性能顯卡就能辦到，這幾點我都會在后面的體驗中給大家詳細分析。

先給大家簡單科普下 Whisper，它是一個多模態語音識別模型，基于 Transformer 引擎所打造，通過了 68 萬個小時的語音數據訓練，支持 99 種語言（包括中文），在具備語音識別能力的同時，還支持語音活性檢測（VAD），聲紋識別，說話人日志 (Speaker Diarization，即在多人對話場景下檢測不同人物的說話時間段)，語音翻譯（翻譯為英文），語音對齊等能力，其英文識別準確率非常強悍。

而上面所提到的 Transformer 引擎，恰好 NVIDIA 在 RTX 40 系列顯卡上引入了一個針對 AI 計算的新硬件特性，具體來說 RTX 40 系顯卡增加了對 FP8 低精度浮點數的支持，基于 Transformer 引擎，相比 AI 訓練常用的 FP16 半精度浮點數來說，動態范圍相當，在相同加速平臺上的峰值性能顯著超越后者，但 FP8 更少的位數有利于減小空間占用和提升網絡利用效率，允許模型擁有更多的參數量，從而算得更快。

有意思的是 OpenAI 迄今為止推出的大模型，包括大家耳熟的 GPT，Sora.，Dell 以及今天提到的 Whisper，都是基于 Transformer 模型所開發，這類模型的參數量巨大，并利用了 Transformer 模型所擁有的 Scability（可擴展性）特性，可以不斷疊加模型的參數和神經網絡層數，獲得更精細和強大的 AI 能力。

此外，OpenAI 團隊也注意到了 Transformer 模型的自注意力機制，使其能夠理解序列中任意兩個詞元間的聯系并無視距離，提高輸出的質量和連貫性。自注意力還可擴展為多頭注意力，允許模型將數據信息切割細化為矩陣（頭），然后對每個矩陣（頭）分別進行自注意力計算，最后合并輸出。

在這兩種機制下，Transformer 模型捕捉的信息類型更全面，學習能力和表達能力也更突出。正是由于 OpenAI 將 Transformer 模型作為產品發展平臺的策略，以及 RTX 40 系顯卡對 FP8 Transformer 引擎的支持，才使得 RTX 40 顯卡成為普通消費者現階段體驗 Whisper 最合適的硬件。

這就不得不提到本次體驗用到的兩個重要硬件，第一個是 i9-14900K 處理器，作為最新一代消費級市場旗艦級定位的 CPU，其采用了 24 核心 32 線程的核心規格，最高睿頻頻率可達 6GHz，不僅自身性能強悍，也不會影響顯卡性能的發揮。

主角則是這款影馳 GeForce RTX 4070 Ti SUPER 星曜 OC 顯卡，它基于 AD103 核心所打造，包含 8448 個 CUDA 核心，顯存位寬提升到了 256bit，并擁有 16GB GDDR6X 的大顯存。

它所搭載的第四代 Tensor Cores 核心專為 AI 而生，新增的 FP8 引擎支持，使其具有高達 1.32 petaflops 的 Tensor 處理性能，可實現混合精度計算，動態調整算力，對于萬億級參數生成式 AI 模型的訓練速度提升 4 倍，性能可達 FP16 的 6 倍，推理性能提升 30 倍，非常適合拿來體驗 Whisper 的性能。

而在外觀上，影馳 GeForce RTX 4070 Ti SUPER 星曜 OC 顯卡亦是設計感拉滿，純白卡身裝甲，自帶亞克力“水晶”外殼，三風扇支持 RGB 光環特效，還附送專屬定制顯卡支架，顏值非常出色，拿來組白色海景房簡直是絕配。

那既然是拿它來跑 AI，顯卡驅動也得選 Studio 驅動，否則跑出來的速度很可能不太理想。目前 NVIDIA 官網提供的最新 Studio 驅動版本為 555.99。

部署 Whisper

首先 Whisper 是一個模型而非軟件，它基于 Python 編程語言開發，直接下載 GitHub 上的原版部署的話就需要通過命令行工具來運行。好在現在已經有不少支持 Whisper 的 GUI 軟件，其中簡單易用的代表就是 Buzz 和 Whisper Desktop 了。

選擇這兩款 GUI 軟件的原因也非常簡單，第一是兩款軟件都免費，體積占用非常小，最新 v0.8.4 版本的 Buzz 安裝包僅有 197MB，完全安裝后的占用空間約 1.21GB，而 Whisper Desktop 甚至只需要 324kb 大小的單文件和一個配置文件就能運行。

第二是兩款軟件的界面非常簡單，上手簡單容易。首先來看 Buzz，它主要是通過 CPU 來跑 Whisper，因此兼容性更強，而且支持 Windows、Linux 和 MacOS 系統平臺，非常全面。Windows 和 MacOS 用戶都可以通過 GitHub 進行下載，Mac App Store 里的版本要價 9.99 美元，不是專業用戶完全不推薦。

在安裝好 Buzz 后，我們要下載 Whisper 的模型文件，推薦大家通過 Huggingface 鏡像站進行下載，上面有 Whisper 模型的合集專題頁，而且會保持更新。

Whisper 官方提供了 Tiny、Base、Small、Medium 和 Large 五種不同大小的模型，占用的體積依次增加，模型越大處理音頻的時間也越長，準確性越高。建議大家一步到位將五種大小的模型都下載下來，親自試試效果。

這里需要注意的是，原版模型的文件名后綴是.pt，如果你下載的模型文件名和后綴不同，很可能是別人轉換或者微調后的模型。下載完成后，還需要將模型文件統一放在“C:\Users\ 電腦用戶名 \.cache\whisper”文件目錄下，然后部署流程就搞定了，是不是非常簡單。

打開 Buzz 后，它的界面是這樣的，非常簡單粗暴，點擊麥克風按鈕將會采集系統聲音來分析正在播放的音視頻中的語音，不過這種方式的識別精度比較低，建議大家還是點擊“+”號按鈕手動指定本地音、視頻文件進行運算更加穩妥。

點擊“+”號選擇文件后，會彈出以上菜單窗口，需要依次選擇模型類型、模型大小、處理方式以及識別語言，然后在底部的導出選項中選擇字幕文件類型。

這里我給大家做了一些中文注釋，模型類型直接選第一個 Whisper 就好，體積方面理論上轉寫英語音頻選擇 Small 模型就能有不錯的效果，中文音頻則需要 Medium 或 large 模型，處理類型選擇轉寫，因為轉譯是將識別結果翻譯成英文，而且只能翻譯成英文，局限性較大。

按理說對排版有要求一定要勾選文字時間戳選項，否則識別結果就會擠在一起，但是目前 Buzz 的文字時間戳選項有 BUG，勾選后不僅識別速度慢不少，識別結果每行幾乎只有一個單詞或單字，就像上圖這樣，好在不勾選它也會對每句話進行分段，最后導出文檔類型大家按需選擇。

全部選好之后點擊右下角的“Run”按鈕即可運行，識別過程中 Buzz 會給出當前的識別進度百分比，直到完成轉寫。

待識別進度變成 Completed（已完成）狀態時，選中列表中的文件，點擊“+”旁邊的雙箭頭圖標，會彈出識別結果的預覽窗口，里面記錄了每句話的時間起始和轉寫結果，再次點擊右下角的下載按鈕并選擇導出文檔類型即可下載到電腦。

再看下 Whisper Desktop，首先是下載，Whisper Desktop 軟件和模型下載地址我貼在這里，同樣也是五種大小的模型，只不過文件名前綴和文件類型后綴不同。

然后是 Whisper Desktop 的界面和操作。打開后我們首先需要選擇模型，Whisper Desktop 不需要指定的模型存放目錄，手動選擇模型地址就行。

大家注意，Whisper Desktop 的模型文件并不是.pt 后綴的，而是.bin 后綴的，文件名中也多了 ggml-model 的字樣，顯然這是經過轉換后的模型文件。

實際上，該軟件就是 Whisper 的 ggml 版本，ggml 是一個用于機器學習的張量庫，所使用的模型文件是 bin 格式的二進制文件，識別效果等同于 Whisper。

然后模型生成方式這里選擇 GPU。高級參數設置中，有獨顯的選擇獨顯，沒有獨顯的則選擇核顯，我這里就直接選擇影馳的 GeForce RTX 4070 Ti SUPER 星曜 OC 顯卡就行了。

全部選好后點擊 OK 進入二級頁面，這里的操作步驟和 Buzz 比較類似，我也給大家都標注了中文注釋，一看就會。選好后點擊右下方的 Transcribe（轉寫）按鈕即可。

對比測試

測試環節我們將進行四組不同語種、語速、類型的音源文件比較，對比內容為識別 + 轉寫速度和識別準確率，比照對象則是以 Buzz 軟件 + i9-14900K 的 CPU 處理陣營和以 Whisper Desktop + 影馳 GeForce RTX 4070 Ti SUPER 星曜 OC 顯卡的 GPU 陣營。

第一次先看中文識別效果，我們在網上下載了一段錘子科技當年在鳥巢舉辦的新品發布會上，老羅對 TNT 功能進行演示的視頻片段，然后轉換為去掉觀眾席聲音的 5 分 30 秒 MP3 音頻文件，這段中文語音中混雜了中文、英文和數字，比較考驗 Whisper 的綜合實力。

在同樣選擇 large 模型的情況下，Buzz 采用 i9-14900K 處理器渲染，最終轉寫速度為 3 分 08 秒左右，Whisper Desktop 采用影馳 GeForce RTX 4070 Ti SUPER 星曜 OC 顯卡渲染，轉寫速度為 26 秒，Whisper Desktop 僅用了 Buzz 軟件 1/6 不到的時間便完成轉寫，由此可見自帶 Transformer 引擎的顯卡對于 Wisper 的效率提升是巨大的。

轉寫排版上 Buzz 和 Whisper Desktop 在不選擇時間戳文本類型的 TXT 文件格式下，勢均力敵，基本都能做到按照一句完整語音進行換行斷句。

不過，在識別結果的字數上，兩者竟然并不相同。Buzz 的轉寫字數為 910 字，而 Whisper Desktop 的轉寫字數為 933 字。識別準確性上，Buzz 識別錯誤 27 個字 / 詞，準確率為 97%，Whisper Desktop 識別錯誤 9 個字 / 詞，準確率 99%。為了不被偶然性影響，我們連續測試三次，基本都是這個比例。

兩者在錯誤類型上，即使我只截識別錯誤的這句話，不聯系上下文，大家都能一眼看出錯在哪了，基本就是中英文混說 / 純中文發音識別錯誤。

另外，Buzz 輸出某些英文也會識別錯誤，而 Whisper Desktop 的英文和數字是完全沒錯誤的。至于為什么 Whisper Desktop 的識別結果字數要多一些，主要是語音中存在重復說相同詞語時，Buzz 有幾率只轉寫一次，而且 Whisper Desktop 有些地方還會添油加醋，比如結尾莫名多出來一句謝謝觀看，還挺貼心的哈。

第二輪對比我們選擇了一段 BGM 舒緩，類型為朗讀的英文短篇，整體朗讀速度較為適中，吐字清晰，音頻時長為 1 分 31 秒的 MP3 音頻，模型則選用了 medium。

這次的轉寫速度差距也非常明顯，Buzz 轉寫耗時 26 秒，而 Whisper Desktop 僅用時 3.8 秒便完成轉寫。

在轉寫排版上，由于 Buzz 選擇時間戳文本有 Bug，所以 Whisper Desktop 略勝一籌。不過在識別準確率上兩者完全打平，因為都是 100%，比較前文也提到了 Whisper 的英文識別能力非常強悍。

當然，大家非常關心的日文我們也進行了測試，這次我們選擇了一首日本歌手 BoA 演唱的《妖精的尾巴》TV 動畫 OP 主題曲《MASAYUME-CHASING》，這首歌的 BGM 比較燃，語速相對前面的英文朗誦也快不少，還有很多重復疊聲詞，歌曲時長為 3 分 40 秒，測試模型選擇 Large。

轉寫速度上，Buzz 用時 1 分 44 秒完成，Whisper Desktop 用時 17 秒完成，影馳 GeForce RTX 4070 Ti SUPER 星曜 OC 顯卡再次完勝。

轉寫排版和前面的英文差不多，只是兩者在一些語句的斷句長度上有所不同。而準確性上，兩者的很多錯誤都一樣，識別準確率都是 96%。但是 Buzz 有些地方錯成了假名，而 Whisper Desktop 相同位置則錯成了英文，比如歌詞原句為“燃やせ胸の火を”，中文大致意思是“胸中之火熊熊燃燒”。Buzz 的轉寫結果為“燃やせ胸のヒール”，中文變成了“燃燒胸前的高跟鞋”，Whisper Desktop 的轉寫結果為“燃やす胸の hero”，中文變成了“燃燒胸前的英雄”。錯的結構基本都是這種，懂日語的小伙伴可以在評論區解釋一下。

最后我們選擇了一首英文說唱類型的視頻，這個視頻比較特殊，首先它雖然是作者二創填詞，但聲音選擇了 AI 配音，有很重的“花果山口音”，其次語速很快，每句話中都有大量的英文單詞，吐字也不算很清楚，屬于稍微“鬼畜向”的作品，我們同樣將其轉成 MP3 格式，采用 medium 模型，看看這種音頻 Whisper 能搞定嗎？

然而出乎意料的是，Whisper Desktop 僅用時 2.6 秒就完成了轉寫，這也太快了！Buzz 則花費了 1 分 03 秒完成。

可是這次轉寫的結果著實令人哭笑不得，Buzz 似乎順利識別出了整首歌的歌詞，而 Whisper Desktop 直接撲街，一個字都沒聽出來，這下子高下立判了。

別急，仔細看 Buzz 的文檔我又發現，它這個文案很多地方像“腦補”出來的，對比原視頻只能說錯對一半一半，關鍵很多話中錯了幾個詞意思就完全對不上了。顯然，在面對 AI 配音 + 口音 + BGM 的場景，Whisper 似乎也無能為力，所以大家就別指望用它來轉寫口語化很重、方言以及鬼畜視頻了。

經過上面三組測試的對比，我們可以得出以下幾點結論：

相比 CPU，RTX 40 系顯卡的 AI 性能對 Whisper 這類基于 Transformer 引擎所打造的多模態大模型是有絕對優勢的。
影馳 GeForce RTX 4070 Ti SUPER 星曜 OC 顯卡即使在 Large 最大體積模型下，也能將 5 分鐘以內的音頻文件轉寫時間壓縮到 60 秒以內，16GB 大顯存可以輕松駕馭 Large 模型的負載。
Whisper 對于中文的識別精度目前還算不上很出色，難度相比日語、英語都要大。而日文、東亞語種的識別準確率也是明顯會差于英語的。但從錯誤數量相對整個文本的占比來看，Whisper 依舊做到了 90% 以上的準確性，相比收費軟件識別速度或許不一定會占優，但勝在免費、離線和低門檻，整體表現在免費轉寫工具中出類拔萃。
口音很重或者通過變聲的 AI 配音、變聲鬼畜向視頻，不適合使用 Whisper 進行轉寫。

除此之外還要特別說明 2 點，一是拿 i9-14900K 進行對比，主要目的是給到大家識別速度上的參照物，并非為表明 RTX 40 顯卡的 AI 性能一定比 intel CPU 強；二是大家使用 Whisper 進行識別轉寫前，最好還是通過三方軟件，將音視頻中的人聲和 BGM 進行分離，識別效果會更好。

總結

在 Whisper 配合兩款 GUI 軟件的體驗過程中，除了部署階段涉及到大量外網模型資源的下載有些麻煩，操作體驗沒有任何問題，非常人性化。

對于有非商業，非大批量語音識別 + 轉寫使用場景的用戶來說，Whisper 足夠滿足他們的日常需求，而像影馳 GeForce RTX 4070 Ti SUPER 星曜 OC 顯卡所擁有的 Tensor Core、CUDA 以及 16GB 大顯存，能夠輕松應付 Lager 模型給到的 AI 運算負載壓力，給用戶帶來顯著效率提升。

或許現在很多 AI 領域離我們的生活還很遠，但不可否認的是，善用 AI 一定能讓我們的生活變得更加美好。

最后，由于文中部分鏈接對網絡環境要求較高，這里就給大家附上此次測試所用到的模型資源好了：

操屁眼的视频在线免费看,日本在线综合一区二区,久久在线观看免费视频,欧美日韩精品久久综