辨認手寫筆跡對于我們來說是一件十分困難的事情,而對于軟件機器人來說,更是如此。
如今,明信片、銀行支票、汽車保險理賠、新冠肺炎疫苗接種記錄等各類手寫文件對于企業(yè)而言仍是不可或缺的文件。不論是郵局或稅務部門等公共部門機構(gòu),還是銀行、保險公司等組織,各個企業(yè)都有相應的手寫文件需要處理。
根據(jù)信息和圖像管理協(xié)會(AIMM)的研究, 目前49%的數(shù)據(jù)均源自于紙張。在日常生活中,還有大量人們在平板電腦上輸入的手寫信息。因此,提取和理解筆跡的能力對文檔工作流程的自動化和加速企業(yè)的數(shù)字化轉(zhuǎn)型至關重要。
無論是手寫在紙上的信息,還是手寫到平板電腦上的信息,手寫文本從識別的角度來說都不是標準化的,就像人們用筆在紙張或電子屏幕上寫字一樣,筆跡識別通常都具有較大的難度。
一般而言,手寫文檔的數(shù)字化都會涉及到人工處理流程。不僅耗時,且不夠準確,經(jīng)常會帶來客戶體驗差和效率延遲等問題。同時,人工識別的重復性、繁雜性可能會影響員工的工作效率及工作興致,致使員工無法去完成更高附加值的工作。
此外,大多數(shù)筆跡識別的解決方案都無法充分滿足本地部署、云部署以及混合部署等筆跡處理場景的需求。
筆跡識別引擎,深度解析文本
為了幫助我們的客戶解決這些難題,在 中內(nèi)嵌了一個筆跡識別引擎.
筆跡識別使用了在大量數(shù)據(jù)集基礎上訓練的深度學習模型, 這些數(shù)據(jù)集包含各種分辨率和手寫樣式的圖像。與處理手寫體的傳統(tǒng)方法不同,使用深度學習的優(yōu)勢在于,我們的模型可以將初始手寫樣本作為基礎進行歸納,然后使用該模型繼續(xù)對每個數(shù)據(jù)樣本進行學習。
同時,這種方法的另一個優(yōu)勢在于,深度學習模型可以從圍繞手寫文本的文檔元素中學習上下文,對手寫文本進行有理推斷。例如,如果在顯示為常用表單區(qū)塊的欄目中手寫輸入 (例如街道地址或醫(yī)保編號),那模型就可以更快地解析筆跡。
多環(huán)境部署,靈活修正錯誤字段
Form 的一部分涉及筆跡識別解決方案,它依賴于為數(shù)據(jù)提取創(chuàng)建的文檔模板。
Form 可以查找和提取信息,如復選標記、機器文本、大寫和小寫、潦草字跡、刪除線,以及簽名檢測,讓用戶在可預測的字段和位置中提供手寫信息的結(jié)構(gòu)化表單。
在下面的屏幕截圖中,我們可以看到W-9,即“請求納稅人標識號和認證”的表單,這是一個企業(yè)所有者和獨立承包商常用的美國IRS表單。如圖所示,它其中有一些筆跡字段和簽名。
面對這樣的筆跡文檔,用戶可以借助于精準的筆跡引擎進行處理。并且,還可以持續(xù)地訓練和優(yōu)化該引擎。在根據(jù)文檔和業(yè)務需求對筆跡信息進行進一步檢查時,筆跡信息將會被發(fā)送到人工驗證站點進行進一步審查。此時,如果機器人不能確定提取字段的準確性,員工便可以對提取的字段進行確認或修正。
如下圖,我們可以看到我們的用例是如何在 中處理、顯示的電腦手寫輸入不能使用,該W-9表單,業(yè)務用戶使用該表單手動評估電腦手寫輸入不能使用,即可自動捕獲難以辨別的文檔區(qū)域。
更重要的是,支持多環(huán)境部署,包括云部署、本地部署和混合部署。這為筆跡識別應用場景提供了巨大的靈活性,各企業(yè)可根據(jù)其特定的業(yè)務場景實施強大的手寫識別解決方案。金融機構(gòu)、醫(yī)療保健公司或公共部門等企業(yè)為遵守隱私要求需要完全避免手寫識別流程,因而支持多環(huán)境部署對這些企業(yè)尤其重要。
在的服務客戶中,有一家美國的大型醫(yī)療保健公司就有場景部署問題。這家醫(yī)療保健公司希望簡化處方藥和服務的事先授權(quán)流程,該企業(yè)每年都要手工處理幾百萬份的手寫表格,時常會出現(xiàn)授權(quán)延誤、人工抄送筆跡錯誤等業(yè)務問題,并且,此類文件的掃描和低分辨率讓這些問題更加嚴重。
但出于數(shù)據(jù)隱私和敏感性方面的嚴格要求,以及1996年《醫(yī)療保險便攜性和責任法案》(HIPAA),這家醫(yī)療保健公司無法使用云解決方案優(yōu)化業(yè)務。所以,這家醫(yī)療保健公司在內(nèi)部部署了 ,以此來解決筆跡難題。
可以讀取格式文本和手寫文本的混合表單,任何需要人工驗證的提取信息都會被發(fā)送到人工驗證站進行人工重點識別。的這一技術(shù)在提高表單處理效率的同時,還遵守了用戶數(shù)據(jù)的隱私合法性。
通過 ,該企業(yè)實現(xiàn)了事先授權(quán)流程自動化,極大減少人工識別筆跡的錯誤率。
總結(jié)
現(xiàn)在,手寫信息的自動化處理仍然是一個不小的技術(shù)挑戰(zhàn)。筆跡識別引擎正在穩(wěn)步應對該挑戰(zhàn),積極且有效的解決更多筆跡識別的問題。