色屁屁www影院免费观看入口,欧美性猛交ⅹxxx乱大交妖精,欧美激情第5页,欧美性猛交xxxx三人,欧美一a级做爰片大开眼界

達(dá)觀動(dòng)態(tài)

達(dá)觀愿與業(yè)內(nèi)同行分享 助力各企業(yè)在大數(shù)據(jù)浪潮來臨之際一起破浪前行

達(dá)觀數(shù)據(jù)券商文本質(zhì)控系統(tǒng):AI驅(qū)動(dòng),3分鐘審核債券募集說明書常見5類錯(cuò)誤

人工智能在金融領(lǐng)域的應(yīng)用集中在客戶營銷、智能對(duì)話、資本運(yùn)營、市場(chǎng)分析、智能投顧、風(fēng)險(xiǎn)審核、輿情分析等場(chǎng)景,本文將主要圍繞人工智能NLP技術(shù)在債券募集說明書審核上的應(yīng)用展開,談一談人工智能在這些場(chǎng)景中的應(yīng)用、價(jià)值和發(fā)展。

文章中所有募集書數(shù)據(jù)皆來源于公開披露信息。

引言

人工智能是本世紀(jì)科技上的重大突破,是新一輪科技革命及產(chǎn)業(yè)革命重要的著力點(diǎn),稱它為第四次工業(yè)革命的代表也不為過。人工智能的發(fā)展對(duì)國家經(jīng)濟(jì)結(jié)構(gòu)的轉(zhuǎn)型和升級(jí)有著重要的意義。自2017年7月20日,國務(wù)院印發(fā)《新一代人工智能發(fā)展規(guī)劃》后,人工智能得到了快速發(fā)展,各種AI公司雨后春筍般的跳出來,一同研究人工智能在各個(gè)領(lǐng)域的應(yīng)用,期望通過人工智能技術(shù)賦能企業(yè),旨在提高企業(yè)工作效率,進(jìn)而提升企業(yè)競(jìng)爭力,達(dá)到降本增收目的。

其中金融領(lǐng)域是人工智能應(yīng)用最好的領(lǐng)域之一。其數(shù)據(jù)量大,技術(shù)最前沿 ,技術(shù)變革需求最迫切,為人工智能在金融領(lǐng)域的大展拳腳提供了有利條件。在金融領(lǐng)域中,人工智能技術(shù)被廣泛研究和創(chuàng)新,應(yīng)用于智能客服、客戶營銷智能分析、智能投顧、智能審核等各業(yè)務(wù)場(chǎng)景,并且都取得了長足的進(jìn)步。下面我們來談一談,人工智能是如何賦能金融企業(yè),推動(dòng)企業(yè)技術(shù)變革的。

人工智能在智能化文檔審核上的應(yīng)用

眾所周知,在銀行、保險(xiǎn)、證券、基金等金融企業(yè)中,審核工作頗為重要。從內(nèi)容上看審核可以分為圖片審核、視頻審核、音頻審核、文本審核4類,其中對(duì)文本的審核工作最為困難。因?yàn)槲谋玖糠浅4螅掖嬖诤芏喾墙Y(jié)構(gòu)化的文檔,審核起來頗為麻煩。我們今天主要講人工智能在文本審核上的應(yīng)用。

01 企業(yè)文檔審核現(xiàn)狀

企業(yè)中含大量的文本數(shù)據(jù),這些文本數(shù)據(jù)大部分都是非結(jié)構(gòu)化或半結(jié)構(gòu)化數(shù)據(jù),有word版、PDF版本、PPT、Excel、TXT、CSV、圖片、掃描件等形態(tài),例如合同文檔、工單數(shù)據(jù)、企業(yè)研報(bào)、年報(bào)、招股書、募集書等文檔,企業(yè)中有大量的這類文檔,僅僅靠人來審核是力所不及的?,F(xiàn)狀是審核人員少,審核工作量大,業(yè)務(wù)員為了完成任務(wù),加班加點(diǎn),但也只能望洋興嘆,退而求其次,挑重點(diǎn)內(nèi)容進(jìn)行審核。這樣做不但效率不高,人員壓力大,而且審核有盲點(diǎn)!

下面就為大家介紹下,如何通過自然語言處理(NLP)技術(shù)解決人工審核文檔難的問題。

02 募集書審核場(chǎng)景

券商、基金公司一直是個(gè)多金的行業(yè),但從業(yè)人員的工作壓力也非常大。日常文檔編寫、文檔修改、文檔審核工作占大量時(shí)間,且有時(shí)也無法顧及周全。以券商中債券業(yè)務(wù)為例,債券業(yè)務(wù)一般可分為承攬、承做、承銷三個(gè)階段。承做階段的文檔審核工作尤其重要,債券募集說明書是重中之重。文檔質(zhì)量影響著券商的口碑,口碑則關(guān)系到券商評(píng)級(jí),進(jìn)而影響到能接到多少項(xiàng)目。所以募集書這類申報(bào)文件應(yīng)高度重視。

現(xiàn)狀是,業(yè)務(wù)組接到項(xiàng)目后,開始準(zhǔn)備項(xiàng)目材料,編寫募集書,在編寫募集書時(shí),有些發(fā)行人是非首次發(fā)行募集書,所以可以參考?xì)v史的材料來修改。編寫過程中,主要工作就是增、刪、改,過程中業(yè)務(wù)組反復(fù)檢查募集書內(nèi)容,對(duì)上下文的一致性以及財(cái)務(wù)勾稽關(guān)系重點(diǎn)檢查,自認(rèn)無誤后提交質(zhì)控組領(lǐng)導(dǎo)審核。一份募集書大概有200頁上下,字?jǐn)?shù)在10萬字左右,據(jù)專業(yè)統(tǒng)計(jì),人的閱讀速度平均500字/分鐘,僅僅讀完一份募集書都需要200分鐘(3小時(shí)+),中間如果再思考、檢查,審核文檔的時(shí)間將會(huì)更長。

業(yè)務(wù)組和質(zhì)控組的審核壓力都非常大,且項(xiàng)目常常非常急,審核員審核的重點(diǎn)常常是風(fēng)險(xiǎn)類和經(jīng)驗(yàn)類的審核,導(dǎo)致像文字錯(cuò)誤、單位錯(cuò)誤、上下文一致性的低級(jí)錯(cuò)誤會(huì)漏審。

pic_001

人工智能如何助力文檔審核工作?下面將結(jié)合達(dá)觀數(shù)據(jù)自研文檔智能審閱系統(tǒng),助理金融領(lǐng)域從業(yè)專家的日常文檔審核工作。

03 募集書AI智能審核

首先結(jié)合業(yè)務(wù)審核點(diǎn)進(jìn)行梳理。通常我們對(duì)文檔有錯(cuò)字、漏字、疊字/詞、形近字、音近字、數(shù)字格式、表格單位等進(jìn)行審核,這是對(duì)文檔的最基本的審核訴求。此外,因?yàn)樨?cái)務(wù)科目之間有勾稽關(guān)系,需要對(duì)募集書中的財(cái)務(wù)勾稽關(guān)系進(jìn)行審核,例如表表審核(同一科目在不同表中的一致性)、表內(nèi)審核(表內(nèi)合計(jì))、表文審核(正文與表格的一致性審核)。

pic_002AI智能文本審核流程

以募集說明書智能審核為例,AI智能審核流程如下:

1.文件解析

通過文檔處理引擎對(duì)募集書(word、pdf)進(jìn)行解析,生成攜帶各種元信息的文本數(shù)據(jù)。常見的元信息包括:文件md5,原始文檔中每個(gè)字的字體、大小、坐標(biāo),募集書的篇章、段落、句子結(jié)構(gòu)信息、表格信息等,為文本語義分析提供支持。

2.文本預(yù)處理

主要含格式轉(zhuǎn)換、編碼轉(zhuǎn)換、文本歸一化處理。其中文本歸一化指對(duì)原始標(biāo)注文本進(jìn)行歸一化處理,包括去掉一些空白字符,大小寫數(shù)字、日期、全半角歸一等處理。例如原始文本中的日期描述有多種類型:“2020年2月1日”、“2020/2/1”、“2020-2-1”,機(jī)器為了計(jì)算和比較時(shí)方便,可以統(tǒng)一將日期歸一化成“2020-2-1”。

3.基礎(chǔ)語義分析

基于1、2步驟的處理結(jié)果對(duì)文本語義進(jìn)行分析。主要有中文分詞、詞性標(biāo)注、專有名詞識(shí)別、同義詞分析、句法語義分析、詞向量分析。

pic_003

其中專有名詞識(shí)別指對(duì)人名、機(jī)構(gòu)名、地名、時(shí)間、日期、貨幣和百分比等名稱進(jìn)行實(shí)體識(shí)別。募集書的專有名詞比較多,像財(cái)務(wù)披露內(nèi)容中的每一個(gè)財(cái)務(wù)科目(營業(yè)收入、短期借款、流動(dòng)資產(chǎn)等等),都屬于專有名詞范疇。

為了理清上下文的指代關(guān)系,需要有同義詞梳理,在募集書中假如發(fā)行人是達(dá)觀數(shù)據(jù),那么這篇募集書中,主體就是達(dá)觀數(shù)據(jù),只要提到發(fā)行人就一定是指達(dá)觀數(shù)據(jù),達(dá)觀數(shù)據(jù)一定就是指發(fā)行人。同義詞分析我們會(huì)結(jié)合業(yè)務(wù)專業(yè)知識(shí)、百度詞典、金山詞典、維基百科等進(jìn)行提取和挖掘。

4.機(jī)器學(xué)習(xí)核心算法引擎

經(jīng)過前三步的工作,拿到模型訓(xùn)練的“素材”,例如表格結(jié)構(gòu)、實(shí)體信息(科目、發(fā)行人、報(bào)告期等信息、段落結(jié)構(gòu)、實(shí)體的上下文指代關(guān)系等,接下來就是模型加工處理。對(duì)文本特征(n-gram + 深度學(xué)習(xí)算法等技術(shù))進(jìn)行特征提取,結(jié)合業(yè)務(wù)規(guī)則,輸出文本抽取結(jié)果。

5.應(yīng)用算法引擎

應(yīng)用算法引擎泛指上層應(yīng)用,它服務(wù)于業(yè)務(wù)需求。在募集書審核上,應(yīng)用算法引擎就是指針對(duì)文字糾錯(cuò)、表格糾錯(cuò)、財(cái)務(wù)勾稽關(guān)系校驗(yàn)功能進(jìn)行算法設(shè)計(jì)和加工,每個(gè)功能點(diǎn)有獨(dú)立的算法和規(guī)則。再具象一點(diǎn)解釋就是,應(yīng)用算法引擎輸出的結(jié)果就是審核結(jié)果,例如具體的某個(gè)錯(cuò)字、錯(cuò)詞、哪個(gè)表格單位有缺失、哪個(gè)財(cái)務(wù)科目上下文不一致等等。

下面結(jié)合在實(shí)際中比較常出現(xiàn)的錯(cuò)誤舉例說明:如下圖中,左側(cè)是募集書原文,右側(cè)是機(jī)器審核結(jié)果。募集書中描述的“發(fā)行人目前資產(chǎn)質(zhì)量和流動(dòng)性良好,營利能力和現(xiàn)金獲取能力較好,截至本……”其中“營利”一詞屬于同音字錯(cuò)誤,應(yīng)改為“盈利”。通過糾錯(cuò)系統(tǒng),可以自動(dòng)識(shí)別錯(cuò)誤,并高亮原文,機(jī)器給出修改建議“盈利”。

pic_004

編寫募集書過程中,可能因復(fù)制粘貼導(dǎo)致文中出現(xiàn)多字/疊字錯(cuò)誤例子,如下圖。

pic_005
AI審核系統(tǒng)除對(duì)文字層面做糾錯(cuò)審核外,還支持對(duì)表格格式的規(guī)范性審核。例如表格單位重復(fù)、單位缺失,如下圖所示:

pic_006 pic_007 pic_008

財(cái)務(wù)披露是募集書中的重中之重,所以對(duì)財(cái)務(wù)勾稽關(guān)系的檢查也尤為重要。財(cái)務(wù)數(shù)字繁多,勾稽關(guān)系也規(guī)范化,可以用機(jī)器來自動(dòng)審核。上下文同一科目有多處披露的情況要審核一致性、單表內(nèi)合計(jì)的正確性、表與表之間同一科目一致性審核、表文同一科目的一致性審核、以及科目占比、逐年變化趨勢(shì)等隱形勾稽關(guān)系,都可以用機(jī)器來規(guī)范化審核。

如下圖中,2015年發(fā)行人【應(yīng)收賬款】科目,在原文中披露過3處,披露值分別是88,814.53萬元、8,814.53萬元、8,814.53萬元,這種錯(cuò)誤導(dǎo)致的數(shù)值偏差會(huì)嚴(yán)重影響發(fā)行人財(cái)務(wù)數(shù)據(jù)披露真實(shí)性和有效性,人的肉眼很難發(fā)現(xiàn)這種上下文不一致的錯(cuò)誤。

pic_009 pic_010

AI審核結(jié)果可視化(AI平臺(tái))

AI平臺(tái)就是最終產(chǎn)品形態(tài)。在這個(gè)平臺(tái)上,你上傳文件后,就可以得到文件的審核結(jié)果。在審核結(jié)果上,可以人工復(fù)核。平臺(tái)結(jié)合實(shí)際使用場(chǎng)景,設(shè)計(jì)了更多人性化的功能:

  1. 支持導(dǎo)出批注版募集書文件,方便線下修改錯(cuò)誤;
  2. 支持在線修改內(nèi)容,導(dǎo)出修改好的募集書文件,方便直接使用;
  3. 支持人工復(fù)核,修改機(jī)器誤判的case;可以接受和拒絕審核結(jié)果;
  4. 支持新增錯(cuò)誤項(xiàng),方便人工復(fù)核時(shí),發(fā)現(xiàn)了錯(cuò)誤可以及時(shí)添加錯(cuò)誤;
  5. 支持API對(duì)接審核結(jié)果,方便與內(nèi)部系統(tǒng)集成;
  6. 支持移動(dòng)端查看審核結(jié)果

pic_011

移動(dòng)端實(shí)際效果圖除此之外,智能審核在合同類文檔中也有較多應(yīng)用,如對(duì)合同的一致性和必備條款的審核。

04 合同類文檔審核

人審的方式:快速閱讀合同內(nèi)容,挑選重點(diǎn)信息,如甲乙方、合同金額、賬號(hào)信息、違約條款、爭議解決、支付方式、維保期承諾等進(jìn)行審核。審核點(diǎn)主要體現(xiàn)在以下幾個(gè)方面:

一致性審核

識(shí)別甲方名稱是否與正文表單中主體一致,識(shí)別合同附件中營業(yè)執(zhí)照、報(bào)價(jià)單中的乙方名稱是否與合同正文乙方主體一致,合同金額大小寫是否一致,乙方賬戶的上下文一致性審核,若不一致需提示檢查乙方賬戶信息。對(duì)于合同中含附件營業(yè)執(zhí)照、報(bào)價(jià)單等內(nèi)容時(shí),要校驗(yàn)合同正文于合同附件中提到信息的一致性,例如營業(yè)執(zhí)照中的公司名稱與乙方名稱是否一致等。

pic_012

必備條款審核

價(jià)格包含范圍說明,爭議解決方式說明,供應(yīng)商資質(zhì)保證,以及支付方式、質(zhì)保期/維保期說明、違約責(zé)任、保密條款、乙方名稱、乙方賬戶、合同有效期等必備條款審核。必備條款的審核科認(rèn)為是合同完備性審核。違約責(zé)任審核,例如:甲方付款逾期,逾期7天后方可計(jì)算違約金,如直接約定自逾期之日起算的,提示修改。違約金支付比例,如高于未支付比例0.1%/每天,提示調(diào)低;乙方賬戶為必備條款,若缺失應(yīng)提示補(bǔ)充乙方賬戶信息。

以上審核點(diǎn)只是針對(duì)合同中常見的審核點(diǎn),合同文檔相對(duì)一般幾頁到幾十頁不等。人工檢查合同時(shí),會(huì)相當(dāng)耗時(shí)耗力,工作量大時(shí),甚至可能會(huì)導(dǎo)致漏審或錯(cuò)審的情況,得不償失。
上述內(nèi)容信息量較大,但審核流程非常簡單,對(duì)于系統(tǒng)應(yīng)用者來說,實(shí)際使用AI智能文本審核系統(tǒng)時(shí)只有三個(gè)步驟:

  1. 上傳目標(biāo)文件(如募集書、合同、招股書等);
  2. AI自動(dòng)解析審核并將結(jié)果可視化;
  3. 人工復(fù)核,導(dǎo)出修正后文件;

3 結(jié)束語

在文本處理場(chǎng)景中,達(dá)觀數(shù)據(jù)已積累大量的項(xiàng)目經(jīng)驗(yàn)和案例,但在人工智能這條路上我們認(rèn)為還比較年輕,我們期待與更多的業(yè)務(wù)專家研究探討,希望通過人工智能來解決實(shí)際工作中的困難,讓機(jī)器協(xié)助人來做基礎(chǔ)工作,解放人力去做更高價(jià)值的事情。讓每個(gè)人的工作變得更高效、輕松。