傳統(tǒng)汽車知識(shí)問答場(chǎng)景中,通常采用問答對(duì)或者搜索的方案,但問答對(duì)存在維護(hù)成本高、知識(shí)無法細(xì)粒度沉淀,檢索匹配關(guān)鍵詞問答精度不足,用戶體驗(yàn)差等痛點(diǎn),無法很好的適用于C端自然場(chǎng)景下的流暢交互。
達(dá)觀數(shù)據(jù)近期與福特中國車聯(lián)網(wǎng)研發(fā)團(tuán)隊(duì)共同完成汽車知識(shí)問答技術(shù)新升級(jí),首次引入概念圖譜,并結(jié)合語義泛化模型,成功落地汽車車載問答場(chǎng)景中,以汽車使用手冊(cè)為內(nèi)置基礎(chǔ)知識(shí),流暢回復(fù)用戶使用問題,精準(zhǔn)給出使用指導(dǎo)。除了KBQA(基于知識(shí)圖譜的問答)的技術(shù)升級(jí)外針對(duì)同步采用多層級(jí)問答策略,KBQA、閱讀理解問答、信息檢索問答相結(jié)合,從而確保方案的完備性及穩(wěn)定性。
概念圖譜對(duì)概念和知識(shí)重新組織
知識(shí)問答(KBQA)的前提都是構(gòu)建圖譜,通常垂直領(lǐng)域一般構(gòu)建實(shí)體圖譜,每個(gè)實(shí)體表示具體的事物,概念圖譜與實(shí)體圖譜不同,他的實(shí)體是由一個(gè)個(gè)概念組成的,相應(yīng)的概念和概念之間存在一定的語義關(guān)系。對(duì)于制度、手冊(cè)類的場(chǎng)景,層次分明但很難提煉具體實(shí)例的場(chǎng)景比較適合構(gòu)建概念圖譜。
概念圖譜是將隱形的知識(shí)體系化、鮮明化,更好地捕捉到用戶搜索的隱含意圖,從而達(dá)到更精準(zhǔn)反饋用戶想要知識(shí)的目的。如下是將汽車使用手冊(cè)拆分成分類層、原始概念、組合概念、意圖層,實(shí)現(xiàn)知識(shí)最小粒度拆分的同時(shí),滿足復(fù)雜組合的意圖解析。最后通過達(dá)觀自然語言處理技術(shù)將手冊(cè)進(jìn)行知識(shí)結(jié)構(gòu)化,并構(gòu)建知識(shí)圖譜。
圖:概念知識(shí)圖譜組合表示
圖:汽車概念圖譜
知識(shí)問答精準(zhǔn)獲取圖譜答案
在知識(shí)問答處理過程中,根據(jù)用戶輸入問句,解析原子級(jí)最小顆粒度的概念,逐層推理出最可能的組合概念,也就是用戶的真實(shí)意圖,從而實(shí)現(xiàn)更加精準(zhǔn)的意圖分析。與此同時(shí),由于自然對(duì)話場(chǎng)景中,基本是口語化、短文本的描述,因此語義泛化至關(guān)重要,我們選擇目前工業(yè)領(lǐng)域落地成熟的融合檢索的SimBERT模型,可以準(zhǔn)確高效實(shí)現(xiàn)語義相似度計(jì)算,理解口語化背后的意圖,從而實(shí)現(xiàn)更加精準(zhǔn)的回復(fù)及相關(guān)的推薦。
圖:手冊(cè)常識(shí)問答助手
達(dá)觀數(shù)據(jù)致力于提供適合場(chǎng)景的優(yōu)質(zhì)知識(shí)圖譜解決方案,深耕知識(shí)圖譜相關(guān)應(yīng)用,在知識(shí)結(jié)構(gòu)化和應(yīng)用領(lǐng)域擁有很多案例積累與技術(shù)自研探索,不同場(chǎng)景適配不同的組合方案,滿足自然場(chǎng)景下的多源化需求,幫助企業(yè)實(shí)現(xiàn)知識(shí)沉淀的同時(shí),助力企業(yè)數(shù)據(jù)應(yīng)用聚變式科技再創(chuàng)新。
最后,特別感謝福特中國車聯(lián)網(wǎng)研發(fā)團(tuán)隊(duì)產(chǎn)品經(jīng)理衛(wèi)星娜、研發(fā)經(jīng)理彭飛、技術(shù)專家蔣彪在項(xiàng)目設(shè)計(jì)和研發(fā)過程中的大力支持。