達(dá)觀OCR文字識別賦能公積金中心實(shí)現(xiàn)業(yè)務(wù)辦理再提速
隨著智慧政務(wù)理念的提出,利用先進(jìn)的AI技術(shù)和手段提高政府部門在辦公、監(jiān)管、服務(wù)和決策等多方面的智能化水平已經(jīng)成為大家的共識。而OCR作為成熟且落地應(yīng)用多的AI技術(shù),是眾多智慧政務(wù)業(yè)務(wù)系統(tǒng)的重要底層支撐組件。只有應(yīng)用識別精度高、速度快的OCR平臺(tái)才能讓智慧政務(wù)系統(tǒng)的業(yè)務(wù)審批再提速,從而使人民群眾辦理自助辦理審批業(yè)務(wù)時(shí)更加便捷化和無感化。

以某一線城市公積金中心業(yè)務(wù)為例,在申辦和審批業(yè)務(wù)中的貸款、歸集和處罰業(yè)務(wù)流程中需要識別身份證、結(jié)婚證、銀行卡、公積金提取申請表、貸款合同、規(guī)劃許可證等多類文檔的多種關(guān)鍵信息。前端業(yè)務(wù)人員接收到的申請資料五花八門,且不同類型文檔的樣本質(zhì)量參差不齊,對識別模型的準(zhǔn)確率影響很大。
達(dá)觀智能OCR平臺(tái)可從同類文檔不同樣本中分析共性、提取特征,從而獲得高精度的識別模型。獨(dú)創(chuàng)的多模態(tài)信息識別可從文本布局、文字語義、字體形式、周邊特征詞等因素去識別提取樣本中的關(guān)鍵信息,實(shí)現(xiàn)了OCR+CV+NLP的完美結(jié)合。
以不動(dòng)產(chǎn)登記證明為例:
1、?通過版面分析,將一張圖片自動(dòng)切分為兩頁,預(yù)處理使得識別效果大幅上升;
2、?通過文字語義分析,將切分好的內(nèi)容歸入“不動(dòng)產(chǎn)登記證明”類型的文檔,自動(dòng)選擇相應(yīng)的識別模型進(jìn)行識別抽取,抽取;
3、?通過字體形式、表格識別,“理解”文本、分辨出標(biāo)題、落款、蓋章、編號以及表格內(nèi)的重要信息。

對于證照中的印章,達(dá)觀自研有強(qiáng)大的印章文字識別技術(shù),可快速找到文檔中的所有印章并精準(zhǔn)識別其中的文字,對文檔中是否有印章、印章是否正確作雙重驗(yàn)證。目前可處理的包括紅章、黑章、圓章、方章、橢圓章、三角章等。

目前達(dá)觀在某一線城市公積金中心已完成18類文檔、100多個(gè)關(guān)鍵信息的智能識別和提取,有效減少前端業(yè)務(wù)人員的錄入工作、加快了業(yè)務(wù)辦理速度。此外,文檔識別與抽取優(yōu)化了業(yè)務(wù)流轉(zhuǎn)方式,實(shí)現(xiàn)了無紙化、智能化、線上化的業(yè)務(wù)辦理,市民群眾辦理公積金業(yè)務(wù)時(shí)已不再必須跑線下網(wǎng)點(diǎn)取號排隊(duì)辦理、加快了全市的公積金業(yè)務(wù)的審批速度。