提示:本文多圖,請手機端注意流量。
前言
利用做圖片識別,識別提取圖片中的文字會有很多方法,但是想要簡單一點怎么辦,那就可以使用識別引擎來實現,一行代碼就可以做到提取圖片文本。
一、配置環境1. 安裝依賴
本程序用到了兩個庫,和PIL,所以先來安裝。
運行以下命令
pip install Pillow pip install pytesseract
如果在中沒有報錯,說明程序安裝成功python識別圖片中數字,
2. 安裝識別引擎
安裝完以上兩個依賴還需要對應的識別引擎。點擊去下載
咱們直接使用5月10號構建的最新版本。
安裝識別引擎(可跳過)
下載完成后打開程序進行安裝,先選擇語言,這里選擇英語就行,然后點ok
接下來就是next,完了點擊I Agree同意協議,
為所有用戶安裝,然后點next,如圖,
接下來安裝中文的語言包用來識別中文,需要滑到下面python識別圖片中數字,選擇中文,我這里橫排簡體中文和豎排簡體中文都選擇了,完成后點擊next,
選擇安裝路徑,建議安裝到C盤以外,然后點擊next
這里點擊安裝,
等待安裝完成
安裝完成后,點擊next,再點擊完成安裝,
驗證是否安裝成功
添加環境變量,就是你安裝到的那個文件夾路徑,直接加到path里面,
然后在命令行運行 -v,如果和下圖一樣,說明你已經安裝成功了,
二、使用步驟1.引入庫
from PIL import Image import pytesseract
2.提取圖片文字
將讀取圖片的一行代碼封裝為一個函數,
def read_image(name): print(pytesseract.image_to_string(Image.open(name), lang='chi_sim'))
在main函數中直接調用即可,
def main(): read_image('1657158527412.jpg')
3.運行效果
以以下圖片為例,
運行效果如下,
總結
本文介紹了的調用,也就是庫,其中還有一些其他的內容并沒有涉及,僅涉及到了圖片提取文字,如果你對其感興趣,可以深入探索一下,也希望能和我探討一下。
完整代碼
from PIL import Image import pytesseract def read_image(name): print(pytesseract.image_to_string(Image.open(name), lang='chi_sim')) def main(): read_image('img.png') if __name__ == '__main__': main()
關于利用 快速識別提取圖片中的文字( 圖片識別)的文章就介紹至此,更多相關 識別圖片文字內容請搜索編程寶庫以前的文章,希望以后支持編程寶庫!
下一節:繪圖demo實現流程介紹編程技術
前言冒個泡泡,好久沒有冒泡泡了,那么今天的話就淺淺水一下博文吧。任務是這樣的,將Excel當中的數據,把它放到咱們的里面去畫個圖。數據是這樣子的:這里面有很多shee ...