第二十一屆中國計算語言學(xué)大會(The 21st China National Conference on Computational Linguistics, CCL 2022) 將于2022年10月14-16日在江西省南昌市舉行。由中國中文信息學(xué)會計算語言學(xué)專業(yè)委員會負責(zé)組織。CCL作為中國中文信息學(xué)會(CIPS)的旗艦會議,經(jīng)過三十年的發(fā)展被廣泛認為是最權(quán)威的,全國最具影響力、規(guī)模最大的NLP會議。CCL著重于中國境內(nèi)各類語言的計算處理,為傳播計算語言學(xué)最新的學(xué)術(shù)和技術(shù)成果提供了廣泛的交流平臺。
達觀數(shù)據(jù)作為一家專注于文本智能處理技術(shù)的國家高新技術(shù)企業(yè),先后舉辦了五次自然語言處理相關(guān)競賽,目前已累計16000+選手參賽,獲得業(yè)界專家、技術(shù)媒體、科研院校等廣泛支持。2022年達觀數(shù)據(jù)很榮幸將以金牌贊助商的身份參與CCL大會匯報,并開展“達觀杯”汽車工業(yè)故障模式關(guān)系抽取評測任務(wù)。
認知智能是人工智能技術(shù)發(fā)展的高級階段,旨在賦予機器數(shù)據(jù)理解、知識表達、邏輯推理、自主學(xué)習(xí)的能力,使機器能夠擁有類似人類的智慧,甚至具備各個行業(yè)領(lǐng)域?qū)<业闹R積累和運用的能力。知識圖譜與自然語言處理技術(shù)對人工智能起到引領(lǐng)性的作用。
達觀數(shù)據(jù)利用領(lǐng)先的自然語言處理技術(shù)和知識圖譜技術(shù)構(gòu)建汽車故障知識圖譜,將知識和經(jīng)驗從固化、不便于應(yīng)用的形式轉(zhuǎn)化為更細粒度、多維度互相關(guān)聯(lián)的知識片段,通過故障案例、產(chǎn)品、設(shè)備、工藝、故障類型、故障原因、解決措施等知識互相關(guān)聯(lián),建立起邏輯關(guān)系網(wǎng)絡(luò),讓散落的知識和經(jīng)驗得以更靈活地傳遞、共享及更新。
賽事介紹
任務(wù)背景
汽車工業(yè)故障知識圖譜幫助汽車及零部件廠商構(gòu)建質(zhì)量管控知識庫,整合知識經(jīng)驗,輔助質(zhì)量工程師高效、全面地分析故障。匯聚所有專家的智慧,降低對工程師自身經(jīng)驗的依賴,讓資歷較淺的工程師也能做好故障分析工作,大幅提升故障分析效率,加速工程師成長。既降低故障發(fā)生的幾率,也減少故障發(fā)生的損失,實現(xiàn)降本增效,提升企業(yè)競爭力。
任務(wù)介紹
實體抽取和關(guān)系抽取是信息抽取的基礎(chǔ)任務(wù),面向汽車故障領(lǐng)域的信息抽取對于實現(xiàn)智能化檢修和診斷具有重大意義。汽車故障領(lǐng)域案例文本是由維修從業(yè)人員撰寫的描述汽車功能異常、排查步驟的記錄,該記錄包括故障現(xiàn)象、故障原因以及排故過程等,故障案例知識的重復(fù)利用受到數(shù)據(jù)結(jié)構(gòu)化程度的影響,因而識別數(shù)據(jù)中的部件單元、性能表征、故障狀態(tài)等核心實體及其組合的故障模式關(guān)系至關(guān)重要。
通過從大量故障案例文本抽取出部件單元、性能表征、故障狀態(tài)等實體及其故障模式,可以為后續(xù)故障知識圖譜構(gòu)建和故障智能檢修和實時診斷打下堅實基礎(chǔ)。本任務(wù)需要從故障案例文本自動抽取2種類型的關(guān)系和3種類型的實體。關(guān)系類型為:部件單元的故障狀態(tài)、性能表征的故障狀態(tài)。
組織者和聯(lián)系人
任務(wù)組織者:陳運文、文輝、王文廣(達觀數(shù)據(jù) );王昊奮(同濟大學(xué))
任務(wù)聯(lián)系人:王小荻
(wangxiaodi@datagrand.com)
評測賽程
報名截止時間:2022年6月30號
提交截止時間:2022年8月31號
公布結(jié)果時間:2022年9月30號
評測獎勵
本測評總獎金2萬元:
一等獎 (一名) 8000
二等獎 (兩名) 4500
三等獎 (三名) 1000
額外獎勵:
- 中國中文信息學(xué)會提供的榮譽證書
- 達觀授予的精美參賽獎牌、證書
-
比賽排名前 20 的選手將獲得達觀數(shù)據(jù)提供的全職(面向在職)和實習(xí)(面向在校生)的 VIP 通道,通過面試優(yōu)先錄用。
掃碼報名
“達觀杯”汽車工業(yè)故障模式關(guān)系抽取評測任務(wù)