在當(dāng)前的企業(yè)環(huán)境中,內(nèi)部審計(jì)面臨著數(shù)據(jù)量大、業(yè)務(wù)復(fù)雜度高等挑戰(zhàn)。隨著人工智能技術(shù)的發(fā)展,特別是大語言模型(LLM)的應(yīng)用,企業(yè)內(nèi)部審計(jì)的實(shí)踐正在經(jīng)歷一場革命性的變化。以下是對大語言模型在企業(yè)內(nèi)部審計(jì)中應(yīng)用的深度剖析。
技術(shù)概覽與應(yīng)用場景
大語言模型,以其強(qiáng)大的文本處理能力和深度學(xué)習(xí)算法,正在被廣泛應(yīng)用于企業(yè)內(nèi)部審計(jì)的多個(gè)方面:
- 審計(jì)知識智能問答:通過構(gòu)建審計(jì)知識庫,大模型可以快速準(zhǔn)確地回答審計(jì)人員的問題,提供業(yè)務(wù)知識、經(jīng)驗(yàn)、法規(guī)等信息。
- 審計(jì)文書智能編寫:利用大模型的文本生成能力,可以自動生成審計(jì)通知書、實(shí)施方案、取證單、底稿和報(bào)告等文書,提高審計(jì)效率。
- SQL分析模型智能生成:大模型能夠根據(jù)審計(jì)需求自動生成SQL語句,幫助審計(jì)人員進(jìn)行數(shù)據(jù)分析,無需深入了解SQL語法和數(shù)據(jù)庫技術(shù)。
- 審計(jì)方案智能設(shè)計(jì):大模型可以根據(jù)歷史審計(jì)經(jīng)驗(yàn)和知識庫,自動提供審計(jì)思路和數(shù)據(jù)分析方案,提升審計(jì)效率。
- 審計(jì)信息化智能教育培訓(xùn):大模型可以智能生成審計(jì)信息化教育培訓(xùn)所需的測試題庫,提供個(gè)性化的課程知識分析與指導(dǎo)。
審計(jì)知識智能問答搜索實(shí)踐案例
在銀行的審計(jì)工作中,存在大量非結(jié)構(gòu)化文本數(shù)據(jù),涵蓋了業(yè)務(wù)數(shù)據(jù)取證分析等方面,但缺乏一個(gè)統(tǒng)一的管理平臺,依賴于人工經(jīng)驗(yàn)進(jìn)行工作。圍繞文本數(shù)據(jù)治理,達(dá)觀數(shù)據(jù)為銀行審計(jì)部開展智能審計(jì)項(xiàng)目建設(shè)——搭建統(tǒng)一的搜索應(yīng)用平臺,從非結(jié)構(gòu)化文本數(shù)據(jù)出發(fā),通過自然語言處理、光學(xué)字符識別等先進(jìn)AI技術(shù),可對復(fù)雜、分散存儲的多源異構(gòu)數(shù)據(jù)進(jìn)行文檔歸集、內(nèi)容解析、比對等,同時(shí),它還配備了強(qiáng)大的語義級別垂直領(lǐng)域搜索引擎,以便更好地管理智能化搜索,有效地解決審計(jì)工作中存在的信息庫建設(shè)、信息檢索、信息溯源等問題,從而提高提高整體審計(jì)業(yè)務(wù)能力,并向全行共享,有助于推動全行的合規(guī)建設(shè),進(jìn)而提升應(yīng)用的價(jià)值。
審計(jì)業(yè)務(wù)面臨數(shù)據(jù)信息和系統(tǒng)架構(gòu)的分散性、異構(gòu)性和復(fù)雜性,深挖各類數(shù)據(jù)的價(jià)值一直是挑戰(zhàn),銀行內(nèi)部數(shù)據(jù)的有效利用率并不高,尤其是審計(jì)部門內(nèi)部大量文本數(shù)據(jù)未形成資產(chǎn)。問題很多:
難點(diǎn)1:非結(jié)構(gòu)化數(shù)據(jù)治理,數(shù)據(jù)多源異構(gòu),審計(jì)文檔多為過程性文檔,文檔類型十分多樣(PPT、Excel、Word、PDF、圖片),文字解析難度大
難點(diǎn)2:搭建統(tǒng)一搜索平臺,關(guān)鍵詞搜索召回效果不達(dá)預(yù)期,上游數(shù)據(jù)推送不穩(wěn)定導(dǎo)致搜索數(shù)據(jù)不完整、不準(zhǔn)確
難點(diǎn)3:數(shù)據(jù)不規(guī)范,知識圖譜三元組構(gòu)建遇到阻礙,知識圖譜的數(shù)據(jù)更新需要保證準(zhǔn)確性、及時(shí)性
難點(diǎn)4:審計(jì)知識文本和筆記較為敏感,需要設(shè)計(jì)嚴(yán)密的權(quán)限體系
達(dá)觀數(shù)據(jù)建設(shè)了智能審計(jì)知識庫項(xiàng)目,一是實(shí)現(xiàn)數(shù)萬份的多系統(tǒng)內(nèi)部文檔、數(shù)十萬份外部監(jiān)管政策文檔等海量異構(gòu)數(shù)據(jù)存儲與分析。且圖片、文檔、表格解析率超95%,可實(shí)現(xiàn)圖片、文檔、表格中所有文字可搜,滿足一站式搜索服務(wù);二是搜索速度快,標(biāo)題和全文檢索速度為毫秒級別;三是搜索智能化,搜索服務(wù)中已上線了超數(shù)十種NLP模型算法用于增強(qiáng)對搜索詞的語義理解,實(shí)現(xiàn)了 意圖識別、模糊搜索、和搜索詞糾錯(cuò)、標(biāo)簽提取等功能。成為審計(jì)人員日常必不可少的內(nèi)外部數(shù)據(jù)快速獲取、信息關(guān)聯(lián) 的數(shù)智平臺 。一方面為常態(tài)化內(nèi)控評估與審計(jì)評價(jià)夯實(shí)技術(shù)支持,另一方面探索實(shí)現(xiàn)審計(jì)能力內(nèi)部輸出,助力一道和二道防線的內(nèi)控建設(shè)。
本案例所用達(dá)觀數(shù)據(jù)新一代大模型智能知識管理系統(tǒng),它以達(dá)觀自主開發(fā)的“曹植”大語言模型為基座,堅(jiān)持訓(xùn)練數(shù)據(jù)與算法模型自主可控,為銀行提供了“算力+模型”的全套國產(chǎn)化信創(chuàng)方案。
該案例數(shù)據(jù)治理成果顯著,為銀行審計(jì)部門激活了大量歷史文檔并轉(zhuǎn)化為數(shù)據(jù)資產(chǎn)。該方案面向?qū)徲?jì)部門內(nèi)部、銀行內(nèi)部提供服務(wù),被廣泛應(yīng)用,可于工作全流程提升信息獲取速度,且提升50%以上。其中,智能審計(jì)知識庫項(xiàng)目月活部門占比率最高超80%。立足內(nèi)部審計(jì)、內(nèi)控合規(guī)等領(lǐng)域建設(shè),接入數(shù)十萬份非結(jié)構(gòu)化文件;保障跨系統(tǒng)對接數(shù)據(jù)的實(shí)時(shí)性、穩(wěn)定性;應(yīng)用數(shù)十種NLP模型;為審計(jì)項(xiàng)目、業(yè)務(wù)合規(guī)自查提供支持,促進(jìn)業(yè)務(wù)合規(guī)穩(wěn)健發(fā)展。