知識圖譜及其構(gòu)建相關(guān)技術(shù)
知識圖譜是機器實現(xiàn)“認(rèn)知智能”的關(guān)鍵技術(shù),為了在工業(yè)領(lǐng)域的機器能夠?qū)崿F(xiàn)“認(rèn)知”能力,我們賦予機器領(lǐng)域知識和工業(yè)領(lǐng)域的專家經(jīng)驗。這也是我們做知識圖譜研究或應(yīng)用的最主要目的——讓機器像人類一樣擁有知識,能夠像人類領(lǐng)域?qū)<乙粯幼鲋R型的工作。
達(dá)觀數(shù)據(jù)是一家面向To B行業(yè)人工智能領(lǐng)域的企業(yè),在日常工作中,王文廣能接觸和了解到不同行業(yè)不同公司對知識圖譜方面的需求,也有機會與相應(yīng)領(lǐng)域的業(yè)務(wù)或IT人員溝通了解相關(guān)方面的情況。他總結(jié)出對認(rèn)知智能和知識圖譜應(yīng)用和利用的三個階段:接受,行動和成熟。




知識圖譜賦能智能制造
智能制造是大勢所趨,從國家戰(zhàn)略、行業(yè)競爭、企業(yè)變革、技術(shù)條件等不同維度都可以得看出?,F(xiàn)在頭部的一些制造型企業(yè)非常關(guān)注新技術(shù)的應(yīng)用來提升效率,提升在產(chǎn)品研發(fā)、質(zhì)量控制、生產(chǎn)制造過程的競爭力。
智能制造本身是以知識和技術(shù)為基礎(chǔ),把生產(chǎn)制造過程跟虛擬系統(tǒng)或其他技術(shù)融合,來實現(xiàn)制造過程的感知、決策、執(zhí)行和演化的過程。那么在這個過程中,知識圖譜能夠做什么呢?
其實智能制造中是非常依賴工人或者工程師的經(jīng)驗的。大家都知道臺積電跟中興國際所使用的機器設(shè)備、原材料等是一樣的,但他們對先進(jìn)制程的把握卻是不一樣的,從而導(dǎo)致了生產(chǎn)中的不同的“良率”,這里面的差別就是制造和生產(chǎn)過程中的“領(lǐng)域知識和專家經(jīng)驗”。王文廣表示“知識圖譜最核心的關(guān)注點就是知識以及知識的應(yīng)用,這正是知識圖譜賦能智能制造的關(guān)鍵所在,也是能夠在未來極大的提升制造業(yè)智能化水平的關(guān)鍵途徑之一。”
這個圖總結(jié)了知識圖譜賦能智能制造的全貌。首先是制造業(yè)非常需要沉淀和傳承知識,比如可以將生產(chǎn)線里的經(jīng)驗總結(jié)出來并沉淀到圖譜里來,這樣就可以幫助不那么資深的人解決問題。并且當(dāng)有人離職,這些經(jīng)驗也將留存下來,為接任者提供幫助,這正是知識的傳承。在賦能智能制造中,有非常多場景都是知識圖譜可以實現(xiàn)的。這里面有一個非常重要的點是“融入業(yè)務(wù)”,王文廣說“在落地過程中,我們非常強調(diào)融入業(yè)務(wù),在盡量不改變現(xiàn)有的工作流程來實現(xiàn)知識圖譜和AI的賦能。”在此之外,還有就是賦能過程中的可解釋性和可運營性。
可解釋性就是指不能只告訴使用者怎么做,還要告訴他整個流程是什么,并且在利用知識圖譜分析問題時,把分析過程也展現(xiàn)出來。
可運營性則是因為數(shù)據(jù)、經(jīng)驗和知識是會演變的。比如一條產(chǎn)線的機器升級后,其知識和經(jīng)驗跟舊機器是有差別的,如何將這些不同經(jīng)驗在知識圖譜中及時更新是非常重要的,這就是可運營性的關(guān)鍵。

工業(yè)質(zhì)量體系中的知識圖譜應(yīng)用
工業(yè)中產(chǎn)品的質(zhì)量是產(chǎn)品的生命線,在產(chǎn)品的生命周期中可以劃分為四大塊:產(chǎn)品規(guī)劃、產(chǎn)品設(shè)計開發(fā)、產(chǎn)品生產(chǎn)制造、客戶反饋。舉個例子:手機在生產(chǎn)之前要做產(chǎn)品規(guī)劃,可能要提前2年甚至更長時間,得到認(rèn)可之后才會進(jìn)行產(chǎn)品的設(shè)計開發(fā),設(shè)計開發(fā)的過程不僅包括產(chǎn)品本身的設(shè)計和開發(fā),還有生產(chǎn)工藝和過程的開發(fā),這個過程完成之后才能讓產(chǎn)品真正進(jìn)入生產(chǎn)制造環(huán)節(jié),之后還要根據(jù)不斷的客戶反饋進(jìn)行產(chǎn)品優(yōu)化。
每一個過程都和“失效分析”有關(guān),當(dāng)一個產(chǎn)品沒有達(dá)到預(yù)期的情況下會產(chǎn)生失效。大多數(shù)情況下失效就是故障,但有些故障不僅是因為物理失效,還包括人為操作的錯誤(比如精度不達(dá)標(biāo),測量儀器出問題等),這種錯誤會導(dǎo)致產(chǎn)品本身沒有問題,但是測量的結(jié)果有誤,類似的故障都是失效。
在工業(yè)質(zhì)量體系中,失效和產(chǎn)品質(zhì)量具有非常強的關(guān)聯(lián),解決失效的過程就是產(chǎn)品質(zhì)量和可靠性提升的過程。跟人們經(jīng)常遇到的疾病一樣,有疫苗來防止生病,而當(dāng)生病了之后,有特效藥來治病。失效也一樣,有事前預(yù)防失效發(fā)生的FMEA,有失效發(fā)生后進(jìn)行“治療”的FA。
FMEA,即潛在失效模式及其效果分析,它是為了預(yù)防失效產(chǎn)生,通常是在生產(chǎn)制造之前預(yù)先想好各種可能發(fā)生失效的地方,并提前做好相應(yīng)的預(yù)案來防止失效的發(fā)生。
FA,即失效分析,它是在失效產(chǎn)生后,用來定位原因,找到解決的方法,并提出改善措施來杜絕未來再次發(fā)生。
為了做好工業(yè)質(zhì)量體系中的賦能,基于淵海知識圖譜平臺,王文廣帶領(lǐng)的團(tuán)隊開發(fā)出了針對性的產(chǎn)品“失效模式知識圖譜平臺”,針對工業(yè)質(zhì)量體系的特點,將失效知識的沉淀、加工、連接、融合和追溯融入到知識圖譜平臺中,形成對質(zhì)量體系過程中的失效分析報告FA、失效分析樹FTA以及FMEA等知識和經(jīng)驗的圖譜化。這里面涉及到非常復(fù)雜的系統(tǒng)性工程,包括:
- 資料收集:使用爬蟲、數(shù)據(jù)庫對接、RPA、消息隊列等;
- 知識加工:包括實體抽取、領(lǐng)域詞的識別與管理,采用了前沿的NLP技術(shù),包括句法分析、事件識別等;
- 連接:實現(xiàn)了關(guān)系和屬性的識別,規(guī)則引擎、分類和聚類算法來協(xié)助業(yè)務(wù)人員進(jìn)行人機協(xié)同,事理邏輯的識別;
- 融合:充分利用了SOTA的知識融合算法,包括圖的表示學(xué)習(xí)、圖神經(jīng)網(wǎng)絡(luò)等,同時也支持人機交互,充分考慮了人機協(xié)同的友好性;
- 追溯:知識圖譜中的每一條知識,都支持追溯到原始的出處,即方便驗證數(shù)據(jù)本身的可靠性,也能夠進(jìn)行有效的權(quán)限管理,還有助于實現(xiàn)知識的更新。
在應(yīng)用方面,達(dá)觀失效模式知識圖譜平臺實現(xiàn)了八大核心應(yīng)用來幫助智能制造企業(yè)賦能質(zhì)量體系,提升其產(chǎn)品的競爭力:
針對達(dá)觀失效模式知識圖譜平臺這個產(chǎn)品,負(fù)責(zé)人王文廣這樣說:“失效模式知識圖譜對智能制造企業(yè)的FA、FTA和FMEA等各類知識進(jìn)行圖譜構(gòu)建,對人機料法環(huán)測充分挖掘,建立起失效知識之間、失效知識與人之間、失效知識在時間上的演化等多維度的連接。這樣構(gòu)建出來的失效知識圖譜能夠有效支撐八大應(yīng)用,并將其融入到質(zhì)量體系中與失效相關(guān)的各個流程,發(fā)揮出企業(yè)所積累起來的知識的價值。”
這些知識的價值,也就是知識圖譜賦能智能制造企業(yè)所帶來的價值,總結(jié)來說有兩方面:一方面可以降低工程師在做失效分析時的經(jīng)驗要求,幫助初級的工作人員能夠?qū)崿F(xiàn)專家級別的失效分析的水平;另一方面是可以更好的培養(yǎng)新員工,使得員工成長到同等水平的培養(yǎng)周期更短。
在此之外,王文廣還說“更為根本的是,企業(yè)的知識財富不再遺失,得以積累。這些不斷積累的知識財富就如同金錢財富一樣能夠帶來復(fù)利,假以時日將能夠擴(kuò)大企業(yè)的競爭力,拉大與競爭對手的優(yōu)勢。”
最后,達(dá)觀知識圖譜團(tuán)隊負(fù)責(zé)人王文廣這樣總結(jié):“我們希望利用自然語言處理、知識圖譜以及一切前沿的人工智能技術(shù),幫助智能制造企業(yè)充分利用好企業(yè)的知識財富。我們從知識的積淀、加工、連接、融合、應(yīng)用、溯源等全方位提供賦能。我們幫助企業(yè)降低對領(lǐng)域知識和專家經(jīng)驗的獲得和利用的成本,并使得智能制造企業(yè)的優(yōu)秀和資深員工能夠不再為瑣碎的事情環(huán)繞,而能夠?qū)W⒂趧?chuàng)新上,為企業(yè)帶來更大的價值,也為中國智能制造產(chǎn)業(yè)升級助力?!?/p>