近日,達觀IDP智能文檔審閱系統(tǒng)參加了中國信通院組織的首輪“可信AI”智能文檔處理產(chǎn)品測評,在功能及性能方面均表現(xiàn)優(yōu)異,順利通過了測評并獲得最高評級5級。
此外,為促進智能文檔處理技術(shù)和產(chǎn)品的標(biāo)準(zhǔn)化及規(guī)范化發(fā)展,進一步提升行業(yè)應(yīng)用水平,達觀數(shù)據(jù)接受信通院邀請,會同百度、阿里云等多家公司出任核心參編單位,聯(lián)合編制了行業(yè)標(biāo)準(zhǔn)《自然語言處理技術(shù)和產(chǎn)品評估方法 第8部分:智能文檔處理系統(tǒng)》。
智能文檔處理(Intelligent Document Processing, IDP)具有技術(shù)能力多、應(yīng)用范圍廣、業(yè)務(wù)場景專等特點,涉及模態(tài)融合、數(shù)據(jù)處理、信息抽取、知識加工等多個重要技術(shù)環(huán)節(jié),能便捷嵌入企業(yè)單位的OA系統(tǒng)、智能客服機器人、機器人流程自動化等軟件。IDP智能文檔處理可支持合同、票據(jù)、文書、報表等文檔內(nèi)容的自動識別、提取、分類、整合及校驗,已廣泛應(yīng)用于金融、零售、電力、審計、海關(guān)、醫(yī)療等垂直行業(yè),為個人、企業(yè)、行業(yè)實現(xiàn)自動化、數(shù)字化、智慧化辦公提供了技術(shù)支撐和應(yīng)用服務(wù)。
信通院認(rèn)為,在功能方面,達觀IDP智能文檔處理系統(tǒng)支持信息抽取、表格文字識別、表格結(jié)構(gòu)識別、版面分析等通用能力,支持文檔生成、文檔比對、文檔分類、文檔審核、文檔層級結(jié)構(gòu)提取等文檔處理能力。在性能方面,達觀IDP智能文檔處理系統(tǒng)在文本糾錯、文本分類、文本生成、實體識別、關(guān)系抽取、事件抽取、光學(xué)字符識別等能力項上的準(zhǔn)確率、可接受度行業(yè)領(lǐng)先。
達觀IDP智能文檔處理系統(tǒng)目前已迭代近10個大版本,幾十個小版本,產(chǎn)品成熟度和市場接受度受到廣泛認(rèn)可。
隨著文檔種類、數(shù)量的不斷增加,企業(yè)對快速處理各種文檔,并智能響應(yīng)變化的需求也在不斷增長。在此背景下,達觀IDP智能文檔審閱系統(tǒng)融合自然語言處理(NLP)、光學(xué)字符識別(OCR)、計算機視覺(CV)等核心技術(shù),結(jié)合海量文本語料庫、外界知識庫(法律法規(guī)、監(jiān)管要求)及自定義審核規(guī)則,打造了全新的文檔一體化處理系統(tǒng),支持自動抽取文檔的關(guān)鍵信息、對比文檔之間的差異、審核文檔潛在風(fēng)險、識別提取文檔中的表格等功能,由淺入深的全面審閱文檔,降低人工審閱紕漏。
目前,達觀IDP智能文檔審閱系統(tǒng)已廣泛應(yīng)用于銀行、證券、保險、制造、通信、法律、審計、媒體、政府等多種文字密集型行業(yè),累計服務(wù)數(shù)百家企業(yè),覆蓋金融文本信息審核、證券基金合同審核、信貸文檔審批、法律行業(yè)案例分析等80余種文檔類型場景,積累了金融、法律、工業(yè)制造等多個語料庫,全方位賦能企業(yè)文檔流程化、自動化、智能化處理。