9月 21 日,2019 “達(dá)觀杯”文本智能信息抽取挑戰(zhàn)賽在北京長(zhǎng)峰假日酒店順利舉行。經(jīng)過(guò)兩個(gè)月的激烈角逐,實(shí)力卓群的 10 強(qiáng)決賽隊(duì)伍從近3000名參賽選手中脫穎而出并在頒獎(jiǎng)典禮上進(jìn)行了方案匯報(bào),最終由tonyxu戰(zhàn)隊(duì)來(lái)自南京的算法工程師徐恒,贏得冠軍,獲得三萬(wàn)元現(xiàn)金大獎(jiǎng)等豐厚獎(jiǎng)勵(lì)。
?
大賽背景
自2017年以來(lái),由達(dá)觀數(shù)據(jù)主辦的“達(dá)觀杯”系列算法大賽至今已經(jīng)舉辦了三屆,在全國(guó)范圍內(nèi)引起極大關(guān)注的同時(shí)也陪伴和見(jiàn)證了中國(guó)NLP愛(ài)好者們的成長(zhǎng)。第一屆的賽題為“個(gè)性化推薦”,第二屆的賽題為“文本分類(lèi)”;今年的“達(dá)觀杯”文本智能信息抽取挑戰(zhàn)賽以“信息抽取”為題,賽題同樣來(lái)源于達(dá)觀的真實(shí)業(yè)務(wù)數(shù)據(jù)。比賽給定一定數(shù)量的標(biāo)注語(yǔ)料以及海量的未標(biāo)注語(yǔ)料,評(píng)估選手在預(yù)測(cè)集上識(shí)別三個(gè)字段的能力。
?
信息抽取是目前人工智能領(lǐng)域許多應(yīng)用的基石,對(duì)產(chǎn)業(yè)界有著重要的實(shí)用意義。達(dá)觀數(shù)據(jù)作為中文自然語(yǔ)言處理的領(lǐng)軍企業(yè),已經(jīng)將信息抽取技術(shù)應(yīng)用于金融、制造、通信、法律、審計(jì)、媒體、政府等多種文字密集型行業(yè)。
?
通過(guò)提供業(yè)務(wù)場(chǎng)景、真實(shí)數(shù)據(jù)、專(zhuān)家指導(dǎo),達(dá)觀數(shù)據(jù)秉承初衷,期待能通過(guò)每年一屆的“達(dá)觀杯”算法大賽帶動(dòng)產(chǎn)學(xué)研融合,為業(yè)界選拔和培養(yǎng)更多卓越人才,見(jiàn)證更多的前沿研究成果落地。
?
大賽自6月28日在Biendata平臺(tái)上線以來(lái),共吸引選手近3000人,組成1258支隊(duì)伍參賽。參賽選手來(lái)自國(guó)內(nèi)外各大高校、科研機(jī)構(gòu)及企業(yè),其中來(lái)自985、211的選手占報(bào)名人數(shù)的40%,BAT等多個(gè)知名企業(yè)均有代表參與。
?
頒獎(jiǎng)現(xiàn)場(chǎng)
一等獎(jiǎng)
【tonyxu】??來(lái)自南京的徐恒以單人身份參賽,憑借出色的技術(shù)和106次提交的毅力斬獲冠軍榮譽(yù)。
二等獎(jiǎng)
【xlx_444444】??以單人身份參賽的徐曉亮是湖南大學(xué)碩士研究生,目前主要從事文本分類(lèi)、機(jī)器翻譯、實(shí)體識(shí)別等nlp相關(guān)工作。
【sixcluster】??這是一只來(lái)自浙江大學(xué)的戰(zhàn)隊(duì),由在讀及已畢業(yè)的五位博士及碩士研究生組成,他們是:姜興華、黃穎驊、嚴(yán)雨姍、錢(qián)煒、諸凱麗。
三等獎(jiǎng)
【whaido】??目前就職于太平洋保險(xiǎn)集團(tuán)的盧凌云,致力于NLP相關(guān)技術(shù)的研究及創(chuàng)新項(xiàng)目的孵化工作。
【poorman】??團(tuán)隊(duì)成員馬文翔、王慧、付斌斌分別來(lái)自山東大學(xué)、中山大學(xué)和華南理工大學(xué)。“達(dá)觀杯”是這支團(tuán)隊(duì)第一次參加算法競(jìng)賽。
【西南交大一枝花】??是來(lái)自于西南交通大學(xué)信息科學(xué)與技術(shù)學(xué)院,計(jì)算機(jī)科學(xué)與技術(shù)專(zhuān)業(yè)的一支研究生團(tuán)隊(duì),成員有:劉赟、別勇、羅友恒、曾崳、馬敏博五人。
優(yōu)勝獎(jiǎng)
【Arrow】??羅懷芍是一名西南交通大學(xué)研究生。他的研究方向是情感分析,機(jī)器閱讀理解。
【大白】??團(tuán)隊(duì)由梁少?gòu)?qiáng)、田佳來(lái)、魏強(qiáng)、王煦中四名隊(duì)員組成,在許多競(jìng)賽中都有出色表現(xiàn),這是本支隊(duì)伍第二次參加“達(dá)觀杯”并獲獎(jiǎng)。
【sk2】??劉偉棠在日常工作中主要從事文本、警情、筆錄等公安行業(yè)文本挖掘工作。
【deja vu】??團(tuán)隊(duì)的主要成員來(lái)自微軟,從事人工智能領(lǐng)域的相關(guān)工作,成員三人:黎彬、劉淑雯、崔慶才。
?大咖對(duì)話
達(dá)觀數(shù)據(jù)創(chuàng)始人兼CEO陳運(yùn)文博士,達(dá)觀數(shù)據(jù)聯(lián)合創(chuàng)始人、本屆“達(dá)觀杯”文本信息智能抽取挑戰(zhàn)賽命題人高翔,達(dá)觀數(shù)據(jù)華北區(qū)總經(jīng)理徐紅,大賽合作伙伴浦軟孵化器、浦軟創(chuàng)投項(xiàng)目部負(fù)責(zé)人易歡,以及在自然語(yǔ)言處理領(lǐng)域享有盛譽(yù)的學(xué)術(shù)界權(quán)威——清華大學(xué)長(zhǎng)聘教授、博士生導(dǎo)師、中國(guó)中文信息學(xué)會(huì)語(yǔ)言與知識(shí)計(jì)算專(zhuān)委會(huì)主任李涓子應(yīng)邀作為頒獎(jiǎng)嘉賓并出席了本次活動(dòng)。
達(dá)觀數(shù)據(jù)創(chuàng)始人陳運(yùn)文發(fā)表開(kāi)場(chǎng)致辭時(shí)表示,希望通過(guò)達(dá)觀杯比賽讓年輕朋友增長(zhǎng)見(jiàn)識(shí)、積累經(jīng)驗(yàn),在未來(lái)的職業(yè)發(fā)展當(dāng)中取得越來(lái)越好的成績(jī)。未來(lái)NLP是大有可為的,達(dá)觀數(shù)據(jù)作為行業(yè)的領(lǐng)軍者,希望能夠聚攏大家、發(fā)揮智慧、共同攻克難題,相信未來(lái)會(huì)有越來(lái)越多的智能化系統(tǒng)發(fā)揮作用,改變?nèi)藗兊墓ぷ鞣绞胶蜕罘绞健?/span>
?
本次活動(dòng)同樣是一場(chǎng)學(xué)術(shù)界與產(chǎn)業(yè)界思想交流的盛宴,會(huì)上清華大學(xué)李涓子教授發(fā)表了題為《知識(shí)圖譜與表示學(xué)習(xí)》的演講,從第三代人工智能和知識(shí)圖譜的關(guān)系出發(fā),為現(xiàn)場(chǎng)來(lái)賓和參賽選手分享了團(tuán)隊(duì)研究領(lǐng)域的前沿成果。并介紹了在”數(shù)據(jù)-信息-知識(shí)-智能”的時(shí)期,知識(shí)圖譜作為實(shí)現(xiàn)智能系統(tǒng)的一個(gè)基礎(chǔ)設(shè)施,如何通過(guò)知識(shí)引擎,去構(gòu)建從數(shù)據(jù)到知識(shí)的轉(zhuǎn)化,實(shí)現(xiàn)機(jī)器智能的研究進(jìn)展。
?
達(dá)觀數(shù)據(jù)技術(shù)帶頭人之一,本屆“達(dá)觀杯”出題人高翔帶來(lái)了《自然語(yǔ)言處理的應(yīng)用和實(shí)踐》主題演講,與現(xiàn)場(chǎng)眾多的年輕參賽者進(jìn)行了交流。在分享中,高翔對(duì)賽題和智能文本信息抽取技術(shù)進(jìn)行了深入解讀,總結(jié)并點(diǎn)評(píng)了獲獎(jiǎng)選手的方案選用策略。最后,他結(jié)合實(shí)際工作場(chǎng)景分享了算法選擇建議。他強(qiáng)調(diào),技術(shù)的價(jià)值在于服務(wù)客戶(hù),無(wú)論小業(yè)務(wù)還是大場(chǎng)景,無(wú)論是底層還是上層,信息抽取技術(shù)都是無(wú)法繞開(kāi)的重要環(huán)節(jié),對(duì)產(chǎn)業(yè)界有重要的意義。
下一屆達(dá)觀杯,明年我們?cè)僖?jiàn)!
現(xiàn)場(chǎng)回顧