自然語(yǔ)言處理(Natural Language Processing,以下簡(jiǎn)稱 NLP),是計(jì)算機(jī)科學(xué)領(lǐng)域與人工智能領(lǐng)域中的重要發(fā)展方向,隨著科技進(jìn)步,自然語(yǔ)言處理技術(shù)亦越發(fā)成熟。微軟 CEO 比爾·蓋茨曾說(shuō)過(guò),“語(yǔ)言理解是人工智能皇冠上的明珠”,NLP 技術(shù)的進(jìn)步勢(shì)必會(huì)推動(dòng)人工智能整體進(jìn)展。在銀行領(lǐng)域,數(shù)據(jù)分析大多集中在客戶行為分析、營(yíng)銷預(yù)測(cè)、風(fēng)險(xiǎn)管理等數(shù)值分析方面,對(duì)于文本處理相對(duì)較少。隨著 AI 技術(shù)平臺(tái)的日趨完善,NLP 技術(shù)在銀行領(lǐng)域的應(yīng)用也逐漸嶄露頭角。
自然語(yǔ)言處理的應(yīng)用
行業(yè)背景
銀行業(yè)日趨激烈的競(jìng)爭(zhēng),也促使銀行各部門(mén)業(yè)務(wù)人員將精力更多地聚焦在數(shù)據(jù)價(jià)值的挖掘上,例如信貸發(fā)卡精準(zhǔn)營(yíng)銷預(yù)測(cè),使得年新增發(fā)卡量?jī)赡攴艘环?;基于大?shù)據(jù)的行內(nèi)評(píng)分模型,使得信貸新增不良率降低45%。在這些數(shù)據(jù)分析挖掘模型落地實(shí)施的帶動(dòng)下,業(yè)務(wù)紛紛轉(zhuǎn)向 NLP 領(lǐng)域,期待轉(zhuǎn)型帶來(lái)的新突破。在技術(shù)的推動(dòng)下,業(yè)務(wù)對(duì)數(shù)據(jù)分析挖掘的需求量呈井噴式增長(zhǎng),要求也越來(lái)越高,特別是非結(jié)構(gòu)化文本數(shù)據(jù)的處理需求。以往的數(shù)據(jù)分析大多集中在客戶行為分析、營(yíng)銷預(yù)測(cè)、風(fēng)險(xiǎn)管理等數(shù)值分析方面,對(duì)于文本處理相對(duì)較少。為了支撐業(yè)務(wù)對(duì)非結(jié)構(gòu)化文本分析的需求,NLP 平臺(tái)應(yīng)運(yùn)而生。基于 NLP 平臺(tái),能夠使非結(jié)構(gòu)化文本的處理的問(wèn)題得以高效解決。
廈門(mén)國(guó)際銀行推動(dòng)數(shù)字化轉(zhuǎn)型,在業(yè)務(wù)飛速發(fā)展的過(guò)程中沉淀了海量數(shù)據(jù)。因此,加大數(shù)據(jù)領(lǐng)域探索,深入挖掘海量數(shù)據(jù)所蘊(yùn)含的巨大潛在價(jià)值,成為國(guó)際銀行當(dāng)下的主要規(guī)劃。為貫徹落實(shí)《中國(guó)制造 2025》和《新一代人工智能發(fā)展規(guī)劃》,中華人民共和國(guó)工業(yè)和信息化部印發(fā)了《促進(jìn)新一代人工智能產(chǎn)業(yè)發(fā)展三年行動(dòng)計(jì)劃(2018-2020 年)》的通知,通知中把 NLP 定位成基礎(chǔ)領(lǐng)域需要著重率先取得突破的技術(shù)。以先進(jìn)同業(yè)為例,同業(yè)將人工智能放在三大戰(zhàn)略中的核心驅(qū)動(dòng)位置,現(xiàn)階段正逐步發(fā)力于通過(guò)使用 NLP 技術(shù),分析企業(yè)公開(kāi)信息,在知識(shí)圖譜、業(yè)務(wù)流程自動(dòng)化、智能風(fēng)控、營(yíng)銷推薦等場(chǎng)景得到應(yīng)用;通過(guò) NLP 的命名實(shí)體識(shí)別、文本關(guān)系抽取、實(shí)體鏈接等能力,實(shí)現(xiàn)知識(shí)圖譜的計(jì)算能力與智能推薦、智能解釋、人機(jī)交互、深度關(guān)系推理等功能;通過(guò) NLP 的文本分類、實(shí)體提取、語(yǔ)義相似度分析等能力,一定程度上減輕業(yè)務(wù)流程中人工流程的壓力;通過(guò)基于 NLP 技術(shù)的風(fēng)險(xiǎn)信息提取,自動(dòng)作為風(fēng)險(xiǎn)預(yù)警及風(fēng)險(xiǎn)建模的特征輸入。
業(yè)務(wù)痛點(diǎn)及解決方案
根據(jù)廈門(mén)國(guó)際銀行業(yè)務(wù)現(xiàn)狀及行內(nèi)業(yè)務(wù)痛點(diǎn),發(fā)現(xiàn)?NLP 技術(shù)在銀行流水、公司章程智能解析、智能運(yùn)營(yíng)和智能稽核四方面能夠產(chǎn)生很大的業(yè)務(wù)價(jià)值。
第一,信貸審核業(yè)務(wù)人員日常工作中對(duì)一張客戶銀行流水錄入審核的過(guò)程中通常需要幾十分鐘乃至 1 個(gè)小時(shí),每天工作量巨大,業(yè)務(wù)人員花費(fèi)大量時(shí)間在重復(fù)的解析、錄入和校驗(yàn)等工作上,而引入人工智能 NLP 技術(shù)的識(shí)別結(jié)果審核加上人工復(fù)審則只需要幾分鐘,可以大幅提升信貸審批效率;
第二,對(duì)公信貸材料審查業(yè)務(wù)人員處理一份公司章程需要半小時(shí)以上,花費(fèi)大量時(shí)間在重復(fù)的信息查找和判斷決策機(jī)構(gòu)層級(jí)等工作上,而引入人工智能 NLP 技術(shù)的識(shí)別判斷結(jié)果可將業(yè)務(wù)流程優(yōu)化至十幾分鐘內(nèi),大幅提升業(yè)務(wù)效率和智能化水平;
第三,一份零售條線線上貸款申請(qǐng)材料審核一般會(huì)花費(fèi)業(yè)務(wù)老師一個(gè)小時(shí)乃至更長(zhǎng)的時(shí)間,引入NLP 技術(shù)輔助業(yè)務(wù)人員審查可以大大減少人工工作量;
第四,內(nèi)部稽核部門(mén)日常工作需要處理分析大量非結(jié)構(gòu)化數(shù)據(jù),人工處理會(huì)導(dǎo)致銀行人力物力的大量浪費(fèi)。目前在理財(cái)銷售話術(shù)合規(guī)性、貸后走訪報(bào)告以及客戶銀行流水中的稽核工作中采用的是人工抽查的模式,得出的稽核結(jié)果存在一定的局限性,不能枚舉所有業(yè)務(wù)場(chǎng)景,無(wú)法對(duì)客戶經(jīng)理交易行為進(jìn)行全面覆蓋,引入?NLP 技術(shù)即可實(shí)現(xiàn)稽核材料的全量核查,節(jié)省業(yè)務(wù)大量時(shí)間。
基于此廈門(mén)國(guó)際銀行攜手達(dá)觀數(shù)據(jù),圍繞銀行流水智能解析、公司章程智能解析、智能運(yùn)營(yíng)和智能稽核四大業(yè)務(wù)需求開(kāi)展合作,搭建自然語(yǔ)言處理平臺(tái)。
智能文檔審閱平臺(tái)
廈門(mén)國(guó)際銀行對(duì)NLP 平臺(tái)的總體規(guī)劃是建設(shè)一套統(tǒng)一、簡(jiǎn)單、高效的 NLP 解決方案,為 NLP 開(kāi)發(fā)人員提供 NLP 和深度學(xué)習(xí)全流程服務(wù)的開(kāi)發(fā)平臺(tái),將 NLP 開(kāi)發(fā)流程平臺(tái)化、工具化,提供從數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理、模型訓(xùn)練、模型評(píng)估在內(nèi)的完整開(kāi)發(fā)過(guò)程,支持模型部署、模型監(jiān)控和模型管理等。
達(dá)觀數(shù)據(jù)NLP平臺(tái)集成一整套自底向上的豐富、高效、高精度的中文自然語(yǔ)言處理模塊,涵蓋文本分析全鏈條,提供正文抽取、句子切分、分詞、詞性標(biāo)注、命名實(shí)體識(shí)別、依存句法、語(yǔ)法分析、文本分類、情感分析、信息抽取、實(shí)體消歧、文本聚類等文本分析組件。適用于智能搜索引擎、情報(bào)分析、泛媒體分析、知識(shí)管理等各個(gè)領(lǐng)域。通過(guò)自動(dòng)建模、分布式算法庫(kù)及模型訓(xùn)練接口,打通模型從訓(xùn)練、發(fā)布到集中運(yùn)行的全流程,可輕松構(gòu)建模型,快速實(shí)現(xiàn) NLP 的落地應(yīng)用,快速提升業(yè)務(wù)價(jià)值。
隨著 落地業(yè)務(wù)的不斷擴(kuò)展,達(dá)觀數(shù)據(jù)NLP平臺(tái)的語(yǔ)料庫(kù)、算法庫(kù)、模型 庫(kù)不斷增長(zhǎng)完善,NLP 落地業(yè)務(wù)可擴(kuò)展至 LIB、CYB 內(nèi)部,通過(guò)增加 LIB、CYB 業(yè)務(wù)數(shù)據(jù)微調(diào)已有的 NLP 智能模型,可實(shí)現(xiàn) LIB、CYB業(yè)務(wù)快速部署、快速落地。