近期,達(dá)觀數(shù)據(jù)通過(guò)自研的達(dá)觀智能文檔審閱系統(tǒng),幫助證券行業(yè)實(shí)現(xiàn)了文檔審核審批業(yè)務(wù)的智能化及自動(dòng)化,極大程度地提高了工作效率和數(shù)據(jù)抽取的準(zhǔn)確性。
達(dá)觀智能文檔審閱系統(tǒng)通過(guò)引入比對(duì)文檔關(guān)鍵信息自動(dòng)化提取、通過(guò)對(duì)標(biāo)準(zhǔn)版本識(shí)別、不同版本差異比對(duì)、審批風(fēng)險(xiǎn)項(xiàng)預(yù)警等,實(shí)現(xiàn)以“秒級(jí)”的時(shí)間展示結(jié)果,并對(duì)比對(duì)結(jié)果進(jìn)行深度分析以及圖標(biāo)可視化。操作過(guò)程極其便利,只需一鍵導(dǎo)入合同文本,即可快速檢測(cè)合同版本之間的差異,數(shù)分鐘內(nèi)實(shí)現(xiàn)上百頁(yè)合同的自動(dòng)比對(duì),完美覆蓋表格、簽字、水印、蓋章等復(fù)雜場(chǎng)景。支持段落顛倒,同級(jí)比對(duì)等多種策略信息自動(dòng)提取與錄入,數(shù)百個(gè)風(fēng)險(xiǎn)點(diǎn)自動(dòng)審查,有效減少證券業(yè)務(wù)人員的重復(fù)性工作,大幅提升合同審批效率和質(zhì)量,平均一份合同比對(duì)的處理從半天時(shí)間縮短至1小時(shí)以?xún)?nèi)。
證券行業(yè)的托管部門(mén)每天需處理大量文本合同,格式包括word、PDF、圖片等,日常痛點(diǎn)如下:
- 文檔比對(duì)過(guò)于耗時(shí),人力耗費(fèi)較大:
進(jìn)行不同合同版本的比對(duì),例如客戶(hù)修改版本與原始版本,最終審核版本與雙簽版本,一份一百頁(yè)的合同比對(duì)通常需要半小時(shí)左右,如果是數(shù)十份合同,則需要消耗若干人的幾天的工作量; - 人為過(guò)失難以避免,信息錄入效率低下:
合同關(guān)鍵信息人工錄入、復(fù)核、審批,一份合同的信息錄入需要1-2小時(shí)時(shí)間,且無(wú)法保證信息錄入過(guò)程中的人為出錯(cuò); - 審核步驟過(guò)于繁瑣,流程無(wú)法從簡(jiǎn):
合同風(fēng)險(xiǎn)審查,例如分比例金額準(zhǔn)確性審查,組織機(jī)構(gòu)存續(xù)狀態(tài)審查等合同規(guī)范性、合規(guī)性、一致性審查,審查不僅需要逐條審核,還需要其他文件例如身份證、營(yíng)業(yè)執(zhí)照、財(cái)務(wù)票據(jù),外部數(shù)據(jù)庫(kù)信息進(jìn)行比對(duì)審核。
達(dá)觀智能文檔審核系統(tǒng),基于深度學(xué)習(xí)、NLP(自然語(yǔ)言處理)算法通過(guò)對(duì)合同文本內(nèi)容、合同管理制度要求的學(xué)習(xí),不僅能從幾百頁(yè)的長(zhǎng)文檔中智能提取實(shí)體、關(guān)系級(jí)別信息,也能提取關(guān)鍵圖表、段落、章節(jié)等文檔要素級(jí)別信息,可百倍提升閱讀效率。憑借穩(wěn)定可靠的產(chǎn)品能力、優(yōu)質(zhì)的長(zhǎng)期服務(wù)以及強(qiáng)大的產(chǎn)品交付能力得到眾多金融領(lǐng)域客戶(hù)的認(rèn)可。
通過(guò)對(duì)某證券機(jī)構(gòu)現(xiàn)有業(yè)務(wù)痛點(diǎn)的深入分析,達(dá)觀基于領(lǐng)先金融科技能力為其構(gòu)建非結(jié)構(gòu)化文檔智能審核平臺(tái),將非結(jié)構(gòu)化文檔數(shù)字化、結(jié)構(gòu)化,實(shí)現(xiàn)內(nèi)容的自動(dòng)識(shí)別、智能提取、智能審核,在節(jié)省人工的基礎(chǔ)上達(dá)到提質(zhì)增效的目的。
以下場(chǎng)景使用情況為例:
01合同/文檔內(nèi)容的智能抽取
1.強(qiáng)大的自研標(biāo)注功能:
(1)支持文字劃選、框選、表格內(nèi)容一鍵標(biāo)注
通過(guò)標(biāo)注好的訓(xùn)練數(shù)據(jù),可以教會(huì)模型如何來(lái)識(shí)別文本中的內(nèi)容及隱含的意圖,使模型能夠更加精準(zhǔn)地抽取正確的內(nèi)容。
圖1 字段的劃選標(biāo)注
(2)?支持圖片、表格框選
對(duì)于包含有圖片,表格的文檔,達(dá)觀智能文檔審閱系統(tǒng)可以通過(guò)框選的方式實(shí)現(xiàn)標(biāo)注
圖2 表格類(lèi)的框選標(biāo)注
2.簡(jiǎn)單個(gè)性化的抽取字段配置:
(1)支持指定抽取字段的新建,修改,刪除,顏色配置,條款類(lèi)型設(shè)置以及一鍵導(dǎo)入功能。用戶(hù)可以根據(jù)字段類(lèi)型需求選擇不同的字段標(biāo)注方案,實(shí)現(xiàn)不同形式的字段展示。
圖3 基金合同抽取字段配置
3.文檔內(nèi)容智能提取,一鍵原文定位:
合同抽取結(jié)果支持顯示后處理內(nèi)容,智能高亮聯(lián)動(dòng)合同內(nèi)容章節(jié),方便業(yè)務(wù)人員定位到關(guān)鍵章節(jié)與內(nèi)容。
??圖4基金合同的智能內(nèi)容提取
某證券機(jī)構(gòu)引入達(dá)觀智能文檔審閱系統(tǒng)從而實(shí)現(xiàn)對(duì)基金合同的智能解讀,完成非結(jié)構(gòu)化的關(guān)鍵信息提取,可結(jié)合不同合同類(lèi)別特點(diǎn)定制算法,完美貼合業(yè)務(wù)需求,同時(shí)支持自定義合同類(lèi)型,通過(guò)可視化界面自行訓(xùn)練模型,靈活擴(kuò)展場(chǎng)景。大量的用戶(hù)實(shí)際案例證明,使用達(dá)觀智能文檔審閱系統(tǒng)能夠有效避免人工操作失誤。
02合同/文檔內(nèi)容的多版本內(nèi)容比對(duì)
1.個(gè)性化的比對(duì)規(guī)則配置:
支持文件類(lèi)型,排版樣式,文件內(nèi)容,指定頁(yè)碼設(shè)置,透視矯正,邊緣過(guò)濾等個(gè)性化配置功能。在默認(rèn)比對(duì)規(guī)則不能滿足特定需求的情況下,用戶(hù)可根據(jù)實(shí)際情況修改比對(duì)規(guī)則,如:需要查出標(biāo)點(diǎn)差異、需要查出段落順序、忽略手寫(xiě)體差異等。
圖5 比對(duì)規(guī)則配置選項(xiàng)
2.合同內(nèi)容比對(duì):
支持合同文檔多版本的內(nèi)容比對(duì),能夠有效幫忙業(yè)務(wù)人員快速識(shí)別、定位到不同合同版本的內(nèi)容變更項(xiàng)。
圖6 智能比對(duì)
3.比對(duì)圖表統(tǒng)計(jì):
精準(zhǔn)統(tǒng)計(jì)出合同之間的差異個(gè)數(shù)及類(lèi)型占比,免去審核人員再次進(jìn)行統(tǒng)計(jì)工作的必要,減少人工作業(yè)。
圖7 文檔比對(duì)差異點(diǎn)統(tǒng)計(jì)
讓機(jī)器“讀懂”文檔,讓機(jī)器成為“伙伴”。在達(dá)觀智能文檔審閱系統(tǒng)(IDPS)投入到證券行業(yè)的建設(shè)項(xiàng)目以來(lái),達(dá)觀數(shù)據(jù)依托在金融領(lǐng)域AI技術(shù)沉淀經(jīng)驗(yàn),利用自主研發(fā)OCR、NLP等先進(jìn)技術(shù)解決基金確認(rèn)單、私募基金合同、文檔比對(duì)、通用表格解析多類(lèi)場(chǎng)景的非結(jié)構(gòu)化文檔的數(shù)據(jù)識(shí)別與處理,實(shí)現(xiàn)相關(guān)場(chǎng)景非結(jié)構(gòu)化文檔的識(shí)別解析、智能審核及與業(yè)務(wù)對(duì)接等,并通過(guò)平臺(tái)化建設(shè)提供一定的可拓展性和泛化能力,助力證券行業(yè)的業(yè)務(wù)部門(mén)拓展更多AI應(yīng)用場(chǎng)景,有效地應(yīng)對(duì)大批量的合同審核事務(wù)性工作,減少重復(fù)作業(yè),也能夠釋放員工精力,讓業(yè)務(wù)專(zhuān)家們聚焦核心業(yè)務(wù),證券機(jī)構(gòu)中也實(shí)現(xiàn)了業(yè)務(wù)部門(mén)運(yùn)轉(zhuǎn)流程效率的提升。