據(jù)悉,外部審計(jì)在執(zhí)行審計(jì)程序時(shí),會(huì)涉及到大量的文本處理工作,如合同內(nèi)容抽取、流水信息核驗(yàn)、詢證函比對與追蹤、發(fā)票信息抽取與金額合理性分析等。審計(jì)員需要在海量的文本信息中篩選關(guān)鍵信息,進(jìn)而從完整性、真實(shí)性、截止性等角度發(fā)現(xiàn)相關(guān)風(fēng)險(xiǎn),以完成審計(jì)目的。如今,各類文本信息展示的方式多樣、收集方法眾多, 舞弊信息的藏匿也愈發(fā)隱蔽,審計(jì)員人工收集、挖掘與分析信息的難度與工作量越來越大,轉(zhuǎn)而留給分析與復(fù)核的時(shí)間則愈發(fā)緊張。在AI技術(shù)迅猛發(fā)展的今天,采用智能化的算法與技術(shù),為審計(jì)人員提供更為便捷的文本處理與智能分析工具是科技發(fā)展與審計(jì)行業(yè)發(fā)展的需求所驅(qū),同時(shí)也是AI技術(shù)與業(yè)務(wù)深度融合,實(shí)現(xiàn)人工智能技術(shù)落地與發(fā)展的重要舉措。
審計(jì)行業(yè)可應(yīng)用的智能文本處理技術(shù)
智能文本處理領(lǐng)域常提及的技術(shù)包括自然語言處理(NLP)、光學(xué)字符識(shí)別(OCR)、智能流程化機(jī)器人(RPA),它們可以將票據(jù)、流水、報(bào)表、合同等散亂無固定格式的文件中的關(guān)鍵信息梳理,并輸出成統(tǒng)一的基礎(chǔ)格式,以便于后期信息采用、分析與人員復(fù)核等。
如果將整個(gè)智能文本處理流程比作一個(gè)虛擬的人,那么NLP技術(shù)為大腦,以類人腦的方式滿足文本與語義學(xué)習(xí)的需求;OCR技術(shù)是眼睛,通過獨(dú)特的字符識(shí)別技術(shù)對掃描件、圖片等載體中不可選中、不可編輯的文字及數(shù)字等信息轉(zhuǎn)換為可編輯、可提取的信息,以滿足用戶對票據(jù)、流水、報(bào)表、合同掃描件或圖片等信息的提取與再加工;RPA技術(shù)則是四肢,以高于人類實(shí)際手工操作千倍速度的方式實(shí)現(xiàn)被識(shí)別與抽取的數(shù)據(jù)的搬運(yùn)與傳輸工作。
與此同時(shí),在審計(jì)行業(yè)中,我們不僅將這三大人工智能技術(shù)組合應(yīng)用,還結(jié)合財(cái)會(huì)審計(jì)業(yè)務(wù)中常用的語料信息、業(yè)務(wù)思維特征、審計(jì)基礎(chǔ)原理,并與業(yè)務(wù)場景深度融合,在純算法的體系上增加統(tǒng)計(jì)學(xué)原理及既定規(guī)則定制(如對中國會(huì)計(jì)準(zhǔn)則的應(yīng)用等),方能實(shí)現(xiàn)技術(shù)場景落地與業(yè)務(wù)實(shí)用性的雙贏。
適合采用AI智能文本處理技術(shù)的場景
由于計(jì)算機(jī)與人腦天然的不同,以目前AI的發(fā)展情況來看,人工智能技術(shù)尚不能全部覆蓋審計(jì)工作的全部場景,特別是無文本數(shù)據(jù)提供,需要人工進(jìn)行信息交互與判斷的工作場景。
從NLP、OCR、RPA技術(shù)的實(shí)現(xiàn)原理來看,適合采用AI智能文本處理技術(shù)的場景應(yīng)包括如下特征:
1. 文本信息可獲得
2. 處理規(guī)則可梳理
3. 處理數(shù)量相對大
基于如上三個(gè)特征,我們在審計(jì)前期、審計(jì)過程中、審計(jì)結(jié)論及審計(jì)報(bào)告管理等審計(jì)流程中均選取出適用工作場景以智能文本處理技術(shù),為協(xié)助審計(jì)人員進(jìn)行深度多向分析,以提高審計(jì)效率及審計(jì)效果。
基于如上原則,我們挑選了智能函證流程這個(gè)代表性場景。
智能函證流程簡介
發(fā)函是必執(zhí)行的審計(jì)程序,通常審計(jì)員在發(fā)函時(shí)需要?dú)v經(jīng)如下幾個(gè)程序:
1. 編寫詢證函(銀行函證、往來函證、關(guān)聯(lián)方函證、存貨函證等)
2. 客戶信息確認(rèn)并蓋章
3. 函證件拷貝留底
4. 發(fā)函快遞信息填寫
5. 發(fā)函快遞追蹤
6. 回函信息追蹤
7. 回函信息比對
8. 相關(guān)結(jié)論得出
基于“文本信息可獲得、處理規(guī)則可梳理、處理數(shù)量相對大”三大原則,如上流程可采用的人工智能技術(shù)優(yōu)化方案如下表:

在智能函證方案中,我們應(yīng)用到的人工智能技術(shù)如下:
印章識(shí)別
在印章定位中,我們使用OCR技術(shù)中的目標(biāo)檢測(OD)技術(shù),對日期章、客戶章、回函章進(jìn)行定位,以得出相關(guān)結(jié)論,如:
1. 日期章、客戶章是否在函證指定位置加蓋;
2. 回函章是否在“相符”或“不符”區(qū)域加蓋;
在印章識(shí)別中,我們使用達(dá)觀自研的印章識(shí)別技術(shù),可識(shí)別菱形章、方章、圓形章、橢圓章等印章形狀,并可提取印章中的文字,進(jìn)行相關(guān)信息的整合。
如下圖所示,系統(tǒng)左側(cè)是印章原文形態(tài),右側(cè)是文字識(shí)別結(jié)果,系統(tǒng)在對印章進(jìn)行目標(biāo)檢測后進(jìn)行信息識(shí)別。

因此,在此項(xiàng)技術(shù)下,我們可以實(shí)現(xiàn)函證信息中發(fā)函件與回函件的印章位置正確與否的判定,以及發(fā)函件與回函件的一致性比對。
函證的印章識(shí)別與比對作為發(fā)函程序中的必經(jīng)程序,本項(xiàng)技術(shù)的實(shí)現(xiàn)無論在執(zhí)行程序的必要性還是在審核的準(zhǔn)確性方面都具有解放人腦的意義,且此項(xiàng)方案不僅可應(yīng)用于會(huì)計(jì)師事務(wù)所,還可用于投行在IPO過程中的發(fā)函程序。
文本智能比對
在函證程序中,為了減少回函被篡改的風(fēng)險(xiǎn),審計(jì)員通常對回函與發(fā)函前的拷貝件進(jìn)行肉眼比較。在此流程中,我們可以應(yīng)用智能文本比對功能,快速準(zhǔn)確完成回函與發(fā)函件的異同比對工作。
文檔比對功能通過使用NLP與OCR技術(shù),可對目標(biāo)文件進(jìn)行語義級別的比對,同時(shí)適用于掃描件、電子版PDF、圖片及word文檔之間的比對,以保證具有更高的文本適用性和格式靈活性。
我們以服務(wù)協(xié)議合同為例介紹比對模塊的具體功能及樣式:

如上圖,系統(tǒng)可一目了然地對全文比對結(jié)果進(jìn)行展示,并對比對結(jié)果以輔助線連接、比對詳情等方式展示,清晰可見。
在函證程序中,用戶只需上傳發(fā)函拷貝件與回函,即可開箱即用,發(fā)現(xiàn)兩份文檔的異同。此舉采用地毯式語義理解的方式進(jìn)行比對,因此與人眼觀察相比效率和準(zhǔn)確率更高。
RPA抓取函證信息
RPA適用于大量重復(fù)的操作,在書寫快遞單、函證及回函信息物流追蹤的過程中,RPA技術(shù)可較好地實(shí)現(xiàn)快遞單信息打印、函證控制表生成、物流信息實(shí)時(shí)追蹤,并定期生成物流報(bào)告,以實(shí)現(xiàn)審計(jì)員的函證發(fā)收過程中的控制。
在以往手工操作過程中,快遞單的書寫與打印、函證收發(fā)過程與物流控制占據(jù)了審計(jì)員較多的時(shí)間,一些大型會(huì)計(jì)師事務(wù)所不得不建立函證中心來控制成本。
若使用RPA進(jìn)行控制,無論對于審計(jì)員還是函證中心來說,都具有極大的成本效益性,且由于RPA極高的準(zhǔn)確率,在減少人工失誤及人工疲乏等都具有不可比擬的優(yōu)點(diǎn)。
其他場景及應(yīng)用
在審計(jì)流程中,合同信息抽取、銀行流水識(shí)別與分析、財(cái)務(wù)數(shù)據(jù)橫向縱向分析、費(fèi)用全量合理化分析等場景都有較多的應(yīng)用及可落地方案。我們希望智能抽取、智能審核、智能比對、RPA等AI技術(shù)能夠在細(xì)化的場景中實(shí)現(xiàn)輕定制的方案應(yīng)用,以最大可能發(fā)揮計(jì)算機(jī)的優(yōu)勢,并在不斷的場景化訓(xùn)練中更新迭代模型,以實(shí)現(xiàn)類人腦智能的不斷發(fā)展與技術(shù)落地。