操屁眼的视频在线免费看,日本在线综合一区二区,久久在线观看免费视频,欧美日韩精品久久综

新聞資訊

    一、代碼運行視頻(嗶哩嗶哩)

    【印刷字符識別】OCR印刷字母+數字識別【含源碼 1861期】

    二、OCR簡介

    OCR技術是光學字符識別的縮寫, 是通過掃描等光學輸入方式將各種票據、報刊、書籍、文稿及其它印刷品的文字轉化為圖像信息, 再利用文字識別技術將圖像信息轉化為可以使用的計算機輸入技術。由于其應用前景廣泛, 在應用領域有著重要的意義。

    手寫體數字識別matlab_手寫 英文 識別_千彩手寫識別系統設置

    1 預處理部分

    本部分可進一步細分為要素定位、二值化、切割、文字歸整幾個部分。由清分機或者高速掃描儀掃入的原始票據經過本部分的處理, 其識別要素如金額、日期按照單個漢字分別被存儲為漢字點陣, 其中手寫體大寫漢字、印刷體大寫漢字以及印刷體小寫數字, 被存儲為6464的點陣, 而手寫的小寫數字被存儲為9680的點陣, 然后對此漢字點陣進行字符識別處理。由于某些種類的票據中, 即便為同一張票據, 其各要素的背景噪聲都不相同, 所以對各不同要素區域采用了不同的二值化方法。在切割完成之后, 各要素已經成為單獨的字符點陣, 文字歸整則是針對單個字符點陣進行。票據上的金額、日期、帳號等都分別要經過上面的流程處理。

    2 文字識別部分

    手寫 英文 識別_手寫體數字識別matlab_千彩手寫識別系統設置

    按照識別系統所要識別的字符種類來分, 本系統需識別的文字有:印刷體漢字、印刷體數字、手寫體漢字、手寫體數字。按照識別要素, 系統包含日期識別、金額識別、帳號識別、磁碼識別幾個不同模塊。

    本系統對漢字識別采用了模板匹配方法,對數字識別采用了人工神經網絡方法。

    模板匹配的基本原理是抽取未知文字的特征與事先存儲好的標準的文字特征進行匹配手寫體數字識別matlab, 在一定的距離或相似度測度下, 找出與未知文字的特征匹配得最好的標準特征, 將該標準特征所代表的文字作為未知文字的識別結果。

    手寫體數字識別matlab_千彩手寫識別系統設置_手寫 英文 識別

    3 特征訓練

    訓練是識別的基礎,標準特征的好壞直接影響到識別結果手寫體數字識別matlab, 選取具有代表性的樣本作為訓練樣本。訓練前先將樣本按一定的順序存放起來, 訓練樣本也是64*64的點陣。與識別部分的特征抽取相對應, 訓練部分的特征抽取也是在對文字圖像進行規整和分割基礎之上進行的。抽取的標準特征是每個漢字不同的樣本的特征值的平均值, 還抽取了每個漢字的標準方差, 方差記錄了每個字的離散度。標準特征和標準方差在識別過程中都有很重要的作用。

    4 印刷體數字和英文字母識別算法開發

    手寫 英文 識別_千彩手寫識別系統設置_手寫體數字識別matlab

    首先, 改進漢字識別算法, 必須充分考慮即將要開發的識別算法所要面對的識別對象與原有算法所面對的識別對象之間的區別。原算法是面對變形較大、筆劃比較稠密的手寫漢字, 而所開發的算法面對的是字形比較固定、筆劃比較稀疏的小寫數字, 相對來講, 識別對象簡單了很多。而且識別字符集也小了不少, 由原來的3755個漢字變為簡單的十個數字, 1, 2, 3, 4, 5, 6, 7, 8, 9, 0, 不過其中相似字仍然存在, 如5和6, 3和8; 其次是識別要求上的變化, 識別率由原來的手寫漢字的識別率要求基本達到100%。

    三、版本及參考文獻

    1 版本

    手寫 英文 識別_千彩手寫識別系統設置_手寫體數字識別matlab

    2019b

    2 參考文獻

    [1]張殿東,包常新,溫尚卓.OCR技術在銀行票據識別系統中的應用[J]. 山東科學. 2005,(02)

    3 備注

網站首頁   |    關于我們   |    公司新聞   |    產品方案   |    用戶案例   |    售后服務   |    合作伙伴   |    人才招聘   |   

友情鏈接: 餐飲加盟

地址:北京市海淀區    電話:010-     郵箱:@126.com

備案號:冀ICP備2024067069號-3 北京科技有限公司版權所有