前段時間,微信 PC 端更新了一個 OCR 功能,能識別圖片里的文字。
說實話,這應該是微信 10 年來推出的最實用功能之一了。
比如你用微信截圖時,只要點擊下方的「 識別文字 」,就可以獲取截圖里的文字。
在微信里收到的圖片,也支持你直接選取文字復制。
除了功能實用,另一方面,微信早已成了電腦上必裝軟件,微信截圖也是很多人默認截圖工具。
所以微信 OCR 就好比系統功能一樣,無需任何安裝成本,以后遇到什么無法復制的文字,調出微信就好。
一般來說,微信 OCR 是可以滿足大部分人的需求。
但因為功能較基礎,在一些特殊情況時,它就顯得有點笨了。
比如你有很多文字需要識別,那就得一次次截圖再一次次識別,再一次次復制。
或者你要 OCR 一段古詩,文字是縱向且自右向左,那微信識別出的順序就會亂。
就在最近,世超發現了一款叫 Umi-OCR 的工具( 支持 Win10&11 )。
它的功能很強大,支持你批量識別圖片、選擇屏蔽區域、指定文字方向,微信能不到的它都能做到。
噢最關鍵的是,它免費開源,無需安裝、無需網絡,離線可用。
簡單給大家演示一下。
假如下面是一段要充錢才能復制的文字,我們點擊軟件的截圖功能,然后把文字框住,0.73 秒后就能獲得文字。
因為是本地運行,電腦性能越強,耗時會越短。
和微信不同的是,Umi-OCR 自帶了一個記錄板,每次識別出的文字會出現在記錄板,并一直保存。
這就是說,如果你有一堆要識別的文字,就可以像打連狙一樣,連續截圖。
截完所有的圖片,記錄板上也已經識別了所有文字。
到這時你再來復制粘貼啥的,會方便很多。
當然還有一種情況,你本地里已經存好了所有的圖片,那這就更方便了。
Umi-OCR 支持批量識別,如果說剛才是連狙,那么這個功能就是一鍵加特林。
直接扔幾百張圖片過去,剩下的交給 Umi-OCR。
接著,記錄板上就會出現一行行的文字。
與此同時,識別結果還會以 txt 文件保存起來,可以說一條龍服務齊全了。
如果你不需要 txt,而是 md、jsonl 的格式,沒關系它都支持。
除了剛才說的這幾項,Umi-OCR 還有一些細節功能,可以照顧到特殊情況。
舉個例子,下面這個圖你只想要正文里的那一句話,水印等其他無效信息不想要。
要是一張圖,你截圖劃一個區域就行了。
但要是有 100 張類似的圖呢?
誒,這個軟件支持你指定識別區域。
只要你導入一張照片,然后選擇一些要屏蔽的區域,那接下來所有同分辨率的圖片,識別時就會自動屏蔽這些區域。
這樣批量識別出的結果,就只有我們想要的部分了。
另外,Umi-OCR 還可以調整段落化。
什么意思呢,一般 OCR 段落識別是根據行距來的,行與行之間空隙大了,它就會判斷為下一段。
但如果遇到下面這樣的特殊格式,一句話就是一段,距離很近,那 OCR 工具會把它們識別成一句話,合在一起。
比如微信識別出來是這樣的。
但 Umi-OCR 支持段落優化,不同的段落格式可以選擇不同的設置,如單行優化、左對齊、自然段等等。
遇到剛才的格式,就可以選擇「 優化單行 」。
其他的情況也都有對應的選項,下圖供參考。
最后,Umi-OCR 還支持更改文字識別方向。
比如你要識別一首古詩,只要選擇一下「 文字方向為縱向、從右到左 」即可。
對了有一點忘了提,除了支持中文、英文識別,通過導入多語言識別擴展包,Umi-OCR 還支持繁中、日、韓、俄、德、法等語言,鏈接會一起放在文末。
我知道,大家肯定關心它的識別準確率,我只能說表現尚可。
在第一張測試圖里,世超就發現捂臉表情被識別成一個( ,然后少了一個引號和一個句號。
小表情識別成文字,這點錯誤各位應該可以接受,畢竟沒多少文章像我們這樣,寫著寫著塞點表情。
引號和句號丟失,我認為無傷大雅。
但除了這幾個問題,Umi-OCR 也會識別錯文字,比如把「 畢竟 」識別成了「 華竟 」。
另外,世超建議各位不要用它識別一些粗體字,效果不太理想。
當然,大家也不要因此拒絕使用 Umi-OCR,市面上就沒有一家 OCR 工具敢保證 100% 準確率。
像剛才的古詩,Umi-OCR 錯了最后一個字,但微信 OCR 識別下來,就沒幾個對的了。
此外,微信 OCR 還會把粗體的 MVP 識別成 MUP。
所以說,使用 OCR,不管你用的是哪家,都要做好會遇到識別錯誤的準備。世超是建議大家每次自己再簡單檢查一遍。
還是那句話,如果只是偶爾需要 OCR,那還是微信好。
但如果你的需求很大,很特殊,害怕泄露隱私啥的,那這款 Umi-OCR 更適合你。
非常感謝大家對曉技巧第三期文章的支持,看到大家的熱情和關注,現在繼續為大家帶來下一期的必備軟件推薦。大家別顧著收藏,記得點贊呦。關注我,下期內容更精彩!
一、騰訊辦公軟件
騰訊公司開發的各種即時通訊軟件,包括QQ、微信、TIM、企業微信等。這些聊天軟件提供了文字聊天、語音聊天、視頻聊天、文件傳輸等功能,已成為日常生活中必不可少的工具之一。
二、遠程軟件
遠程控制軟件是一種非常實用的辦公軟件。利用遠程控制軟件,用戶可以在不同的地點通過網絡實現遠程控制其他計算機,包括打開文件、運行程序、傳輸文件、監控屏幕、發送消息等等。這種方式可以實現遠程辦公、遠程維護、遠程教育、遠程支持等多種應用場景,非常方便和高效。這里推薦Todesk和向日葵遠程控制。
三、思維導圖
思維導圖可以讓用戶更加直觀地表達和組織自己的思路。可以創建各種不同類型的筆記,例如思維導圖、腦圖、流程圖、大綱等。還支持多人協作,適合需要頻繁整理和歸納信息的人士,例如學生、教師、研究人員、企業人員等。這里推薦幕布。
四、PDF轉換軟件
PDF轉格式也是經常會用到的功能,但是,當前市面上的許多轉換軟件在轉換效果和收費方面都存在一些問題,這給用戶帶來了很多不便。因此,為了方便大家的使用,這里推薦PDF24和PDF Shaper Free,它們不僅轉換效果較好,而且還提供免費服務,可以滿足大家多樣化的需求。
五、辦公軟件WPS
對于在辦公室的工作人員,辦公軟件也是必不可少,現在一般安裝的都是wps或者Microsoft Office的辦公軟件,這里推薦國產的WPS軟件考試專用版。特別推薦在校學生使用。
六、強大的剪貼板增強工具
Ditto是一款免費、開源的剪貼板管理工具,它可以讓你方便地存儲、管理和檢索剪貼板歷史記錄,從而提高你的工作效率。使用Ditto可以避免重復輸入、復制粘貼等操作,節省你的時間和精力,讓你專注于更重要的工作。如果你經常使用剪貼板,那么Ditto是一款值得嘗試的工具。
七、OCR文本識別工具
文字識別在日常中使用中很方便,OCR就是使用人工智能技術的文字識別系統,可以將圖片或掃描件中的文字內容自動識別并轉換為文字文檔,不再需要手動輸入文字,可以大大提高工作效率,節省敲字時間和精力。這里推薦天若文本識別和PandaOCR.Pro。
各位家人們記得關注點贊喲,下期再見!