近日,由中國電科團(tuán)委、中國司法大數(shù)據(jù)研究院和中國中文信息學(xué)會共同主辦的首屆“中國法研杯”司法人工智能挑戰(zhàn)賽頒獎典禮暨學(xué)術(shù)交流研討會在北京召開。經(jīng)過近半年的比賽角逐,達(dá)觀數(shù)據(jù)從1000多名參賽選手中脫穎而出,榮獲刑期預(yù)測單項季軍的好成績。達(dá)觀數(shù)據(jù)副總裁王文廣受邀出席會議,并與在場嘉賓及同仁分享技術(shù)心得和經(jīng)驗。
?
本次大賽共吸引了全球120家高校,11家司法單位和138家企業(yè)參加,其中既有來自北大、清華等國內(nèi)外頂尖學(xué)術(shù)機構(gòu)的科研人員,也有來自微軟、谷歌的優(yōu)秀工程師。不同背景的選手在一起碰撞交流,共同促進(jìn)法律智能相關(guān)技術(shù)的發(fā)展。
本次比賽以刑事案件量刑為背景,設(shè)置了罪名預(yù)測、法律條款推薦和刑期預(yù)測三個任務(wù)。通過封閉評測的方式,選手們運用人工智能領(lǐng)域的多種技術(shù)組建參賽模型,對“中國裁判文書網(wǎng)”公開的刑事法律文書數(shù)據(jù)進(jìn)行算法模擬,并對待測裁判文書可能涉及的罪名、適用法條、刑期長短進(jìn)行預(yù)測,選手的預(yù)測結(jié)果將與真實的裁判結(jié)果進(jìn)行比較,二者越接近,則分?jǐn)?shù)越高。達(dá)觀數(shù)據(jù)在刑期預(yù)測任務(wù)中奪得季軍。
達(dá)觀數(shù)據(jù)榮獲任務(wù)三(刑期預(yù)測)第三名
本次法研杯比賽的成果也得到了最高人民法院的高度認(rèn)可。中國中文信息學(xué)會秘書長孫樂和最高人民法院信息中心副主任孫福輝蒞臨頒獎現(xiàn)場并先后發(fā)言,表達(dá)了對比賽的高度肯定,闡述了人工智能技術(shù)的發(fā)展方向。
最高人民法院信息中心孫福輝副主任為獲獎選手頒獎
?
?
達(dá)觀數(shù)據(jù)副總裁王文廣現(xiàn)場和大家分享了在本次比賽中采用的技術(shù)路線和心得體會。
?
從總體架構(gòu)上,達(dá)觀數(shù)據(jù)的整個系統(tǒng)包括了專家系統(tǒng),自然語言處理和深度學(xué)習(xí)三個大的方面。結(jié)合者三個大的方面也是達(dá)觀數(shù)據(jù)在多個其他系統(tǒng)中所使用的技術(shù)組合。
達(dá)觀數(shù)據(jù)副總裁王文廣和現(xiàn)場嘉賓進(jìn)行技術(shù)分享交流
?
王文廣介紹,深度學(xué)習(xí)是對結(jié)果產(chǎn)生影響最大的一塊。整個過程實驗了多種深度網(wǎng)絡(luò)結(jié)構(gòu),在對最終結(jié)果產(chǎn)生重要影響的是HAN(層次注意力模型)和DPCNN(金字塔CNN)。對這者兩個模型進(jìn)行深度的挖掘,結(jié)合不同的embedding,實驗了多種參數(shù)。最終也使用了這兩種模型的結(jié)合,即用一個全連接網(wǎng)絡(luò)對著兩個模型進(jìn)行ensemble,形成了一個超級復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu)。
?
作為中國知名的文本智能處理企業(yè),達(dá)觀數(shù)據(jù)利用先進(jìn)的文字語義自動分析技術(shù),為企業(yè)提供文本自動抽取、審核、糾錯、搜索、推薦、寫作等智能軟件系統(tǒng)。目前已經(jīng)成功為華為,海爾,長虹,iCourt、威科先行、京東,招商銀行,華泰證券等眾多知名金融、法律、制造企業(yè)提供了技術(shù)服務(wù)。
本次比賽與眾多來自司法機構(gòu)和高校的選手們同臺競技,取得季軍的容易實屬不易。除了達(dá)觀專業(yè)的技術(shù)積累,也離不開參賽人員的技術(shù)熱情與全情投入。
達(dá)觀數(shù)據(jù)副總裁王文廣回憶:“成績的取得離不開團(tuán)隊成員的努力和投入,比賽過程中每周重置次數(shù)是中午2點左右,有一次是當(dāng)天12點多提交了模型,提交后大家去吃飯,飯中發(fā)現(xiàn)提交的模型測試失敗,當(dāng)天下著大雨,直接打電話讓團(tuán)隊另一成員打著傘拿著兩個筆記本跑到飯館當(dāng)場debug,然后通過4G流量提交。整個過程在飯館老板看了簡直是個瘋子,我們卻也樂在其中。”
本次在中國法研杯司法人工智能挑戰(zhàn)賽中取得的成績是達(dá)觀數(shù)據(jù)在司法行業(yè)中的又一次進(jìn)步。隨著深度學(xué)習(xí)和自然語言處理為代表的人工智能技術(shù)取得的不斷突破,司法行業(yè)文本處理更加智能化、自動化也將成為智慧司法的發(fā)展方向。
?