WAIC精華回放 | 上??拼笥嶏w邵文明:認(rèn)知技術(shù)突破及科大訊飛的行業(yè)應(yīng)用實(shí)踐
在2020年世界人工智能大會(huì)云端峰會(huì)中,達(dá)觀數(shù)據(jù)與浦東青聯(lián)聯(lián)合舉辦了“智能時(shí)代,語你同行”行業(yè)論壇,圍繞語言智能,與多位行業(yè)專家與學(xué)者展開了一場精彩線上交流盛宴。
上海科大訊飛副總經(jīng)理邵文明在論壇上進(jìn)行了《認(rèn)知技術(shù)突破及科大訊飛的行業(yè)應(yīng)用實(shí)踐》的主題分享,以下為演講內(nèi)容精華整理,觀看大會(huì)回放可直接下拉最下方二維碼進(jìn)行精彩回顧。
- 認(rèn)知技術(shù)當(dāng)前進(jìn)展
- 語義理解、機(jī)器翻譯、對話系統(tǒng)以及知識(shí)圖譜四個(gè)領(lǐng)域目前的應(yīng)用。
認(rèn)知技術(shù)當(dāng)前進(jìn)展
人工智能的發(fā)展,將其分為三個(gè)階段:
- 第一階段為運(yùn)算智能,基于超千臺(tái)服務(wù)器的異構(gòu)神經(jīng)網(wǎng)絡(luò)超算平臺(tái),其存儲(chǔ)和計(jì)算能力非常強(qiáng)大。幾年前阿爾法狗的獲勝開啟了人工智能新一浪潮,也代表著運(yùn)算智能的新高度。
- 第二階段為感知智能,感知智能像人一樣有各種感知,像人一樣聽、說、看。這些方面機(jī)器從速度和準(zhǔn)確率方面都達(dá)到了非常高的水準(zhǔn),甚至部分領(lǐng)域已經(jīng)超過人類。
- 第三階段是認(rèn)知智能,讓機(jī)器會(huì)思考、能理解,像人一樣具備大腦功能,不僅能夠聽到人說的,還能知道說什么,并可以準(zhǔn)確反饋。認(rèn)知技術(shù)是人工智能在未來取得更大突破和更廣泛應(yīng)用的關(guān)鍵瓶頸。
認(rèn)知智能包括的領(lǐng)域很廣,當(dāng)前認(rèn)知技術(shù)面臨一些問題,也是目前在整個(gè)人工智能發(fā)展中存在的困境。
- 封閉環(huán)境VS開放環(huán)境:目前每一個(gè)任務(wù)的性能是在封閉測試的環(huán)境下得到的,如果在開放環(huán)境下進(jìn)行,性能將會(huì)大大下降。所以聚焦特定領(lǐng)域、特定子任務(wù),確定技術(shù)路線,才會(huì)達(dá)到實(shí)用性能。封閉環(huán)境下的人工智能稱之為弱人工智能,如果在開放環(huán)境要想得到很好的應(yīng)用,需要把弱人工智能上升到強(qiáng)人工智能,即通用型全腦型的人工智能。
- 模式識(shí)別VS真正理解:目前智能的本質(zhì)是模式識(shí)別,大量的常識(shí)知識(shí)、世界知識(shí)還沒能很好與神經(jīng)網(wǎng)絡(luò)結(jié)合起來。未來我們希望通過大量的常識(shí)、各類的知識(shí)與神經(jīng)網(wǎng)絡(luò)相結(jié)合,讓機(jī)器把專家知識(shí)真正變?yōu)樽约旱闹R(shí),同時(shí)將推理加入到學(xué)習(xí)體系中。這樣機(jī)器才能變成真正具有自我推理能力。
- 大數(shù)據(jù)的依賴性:目前成功的方法大多嚴(yán)重依賴標(biāo)記語料集合,需要在強(qiáng)監(jiān)督大樣本訓(xùn)練之下,機(jī)器才能逐步提升。未來我們需要突破讓智能不再依賴數(shù)據(jù),持續(xù)在無監(jiān)督、小樣本算法突破,同時(shí)通過應(yīng)用獲得真實(shí)的數(shù)據(jù)、用戶的反饋,然后改進(jìn)系統(tǒng),并把可解釋性融入到神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)體系。
- 當(dāng)前人工智能對于噪音敏感度不強(qiáng):當(dāng)機(jī)器碰到干擾、或使用場景不匹配時(shí),準(zhǔn)確率或反應(yīng)會(huì)立刻大幅下降。未來我們需要把自然語言理解,語義模型對于噪音敏感度加大。
在未來的人工智能時(shí)代,人工智能需要三方面核心支撐能力。首先通過小樣本學(xué)習(xí)、無監(jiān)督學(xué)習(xí)、遷移學(xué)習(xí)、常識(shí)的了解,讓人機(jī)交互更加普遍和準(zhǔn)確,由圖象、語言、語音作為入口,結(jié)合推理學(xué)習(xí)將帶來認(rèn)知智能的革命。
人工智能認(rèn)知階段的當(dāng)前實(shí)際應(yīng)用具體在自然語言理解(NLP),它也是新一代計(jì)算機(jī)必須研究的課題。 它的主要目的是克服人機(jī)對話中的各種限制, 使用戶能用自己的語言與計(jì)算機(jī)對話。
自然語言理解包含基礎(chǔ)技術(shù)、高級(jí)技術(shù)和應(yīng)用技術(shù)?;A(chǔ)技術(shù)可分為詞法與句法分析,語義分析和語篇分析。高級(jí)技術(shù)包含知識(shí)圖譜、語言認(rèn)知模型、語言知識(shí)表示與深度學(xué)習(xí)。應(yīng)用技術(shù)包含常見的機(jī)器翻譯、信息抽取、自動(dòng)問答、文字識(shí)別、自動(dòng)摘要等多個(gè)領(lǐng)域。
語義學(xué)習(xí)的機(jī)制是根據(jù)上下文來找相似的語義。比如,我們說話的時(shí)聽到上下文會(huì)知道它的語境,會(huì)猜測它的意思。在詞語的表達(dá)上,過去用一個(gè)單向的向量,但這有一個(gè)很大的問題,所有的詞語都是不同的向量,很難分清詞語之間的關(guān)系。當(dāng)前在神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)的時(shí)代,用嵌入式的舉證向量表示詞語,這樣可以更好地了解到一個(gè)詞語包含的內(nèi)涵,近義詞在哪一個(gè)語境圈。
過去靜態(tài)詞表達(dá)無法解釋一詞多義的現(xiàn)象?!拔蚁矚g土豆,不喜歡西紅柿?!碑?dāng)聽到上下文我知道,這個(gè)土豆是指蔬菜;另一句話,“我喜歡土豆,不喜歡優(yōu)酷。”聽到下半句的時(shí)候知道這個(gè)土豆是視頻網(wǎng)站土豆,而不是蔬菜。這是因?yàn)殪o態(tài)句子中往往難以充分表達(dá)出含義,而動(dòng)態(tài)詞表達(dá)每一個(gè)向量與上下文環(huán)境相關(guān)。
自然語言的復(fù)雜性往往被低估,人們平時(shí)說話時(shí),會(huì)不自覺將進(jìn)行背景和語義的聯(lián)想。例如:
人和人交互的時(shí)候一方說到肯德基,另一方就知道肯德基里有洗手間,這是人的常識(shí)。但是當(dāng)跟機(jī)器人說前面有個(gè)肯德基,沒有常識(shí)的機(jī)器,不會(huì)知道肯德基和洗手間之間的關(guān)系。常識(shí)場景下對各類問題的智能理解、分析及推理是人類智能的重要組成部分,這背后需要大量常識(shí)知識(shí)作為基礎(chǔ),以此我們才能理解和交互對方真正的意圖。
科大訊飛1999年成立,科大訊飛的認(rèn)知之路經(jīng)歷了幾個(gè)階段。從在教育領(lǐng)域的嘗試到前些年機(jī)器翻譯大規(guī)模盛行和應(yīng)用,到醫(yī)療、金融、司法等專業(yè)行業(yè)都有了應(yīng)用。
人工智能領(lǐng)域典型應(yīng)用
下面為大家介紹在人工智能領(lǐng)域幾個(gè)典型應(yīng)用。
語義理解
機(jī)器如何理解簡單句子“幫我查一下明天從合肥到北京的航班”?
中文每個(gè)句子里字和字之間沒有空格,詞與詞之間沒有明顯界限。所以機(jī)器首先切分出詞語,同時(shí)從詞語之間找到表達(dá)的關(guān)健詞。這個(gè)句字關(guān)健詞,時(shí)間——明天;地點(diǎn)——合肥到北京,查的內(nèi)容——航班。這是機(jī)器在背后默默運(yùn)算的功能。
對于語義的抽取,如何抽取其中的關(guān)鍵內(nèi)容?在數(shù)學(xué)上通過變量的形式來表達(dá)。語義理解除了廣度外還有深度,同一個(gè)句子有多種方法表達(dá),機(jī)器如何表達(dá)多種含義的知識(shí)?這是我們對機(jī)器很重要的要求。
機(jī)器翻譯
機(jī)器翻譯是利用計(jì)算機(jī)把一種自然語言翻譯成另一種自然語言的過程。機(jī)器翻譯首先通過文字序列進(jìn)行預(yù)處理,分詞也是預(yù)處理中的一部分。分詞后進(jìn)行核心的翻譯,翻譯后進(jìn)行后處理,最后輸出文字的序列。
機(jī)器的翻譯并不僅只把詞語一對一的翻譯出來,那樣會(huì)顯得很生硬,甚至有語義錯(cuò)誤。我們希望它能像人一樣做到信達(dá)雅,準(zhǔn)確,表達(dá)精準(zhǔn),還能體現(xiàn)出其中很地道的表達(dá)和典故。
機(jī)器翻譯的過程原理,有一個(gè)小案例,當(dāng)它輸入一段中文后,要切分成詞語,每個(gè)詞有對應(yīng)的英文進(jìn)行替換翻譯,翻譯后根據(jù)英語不同的記法進(jìn)行調(diào)整,比如進(jìn)行倒裝或者反問等。
深度學(xué)習(xí)在機(jī)器翻譯過程中起了非常決定性作用,2010年后,基于深度學(xué)習(xí)我們將深度神經(jīng)網(wǎng)絡(luò)用于端到端翻譯,讓機(jī)器人翻譯質(zhì)量得到了大幅度的提高。
機(jī)器翻譯目前在各行各業(yè)也有了廣泛的應(yīng)用,例如用機(jī)器翻譯獲取外文信息;通過機(jī)器翻譯在聊天軟件上跟國外好友進(jìn)行聊天;以機(jī)器翻譯進(jìn)行日常交流和旅游,我們的翻譯機(jī)已經(jīng)成為成熟的小產(chǎn)品,目前翻譯機(jī)可翻譯57種不同語言。
對話系統(tǒng)
多人對話系統(tǒng)的場景,例如,手機(jī)上的虛擬機(jī)器人與人進(jìn)行對話。對話系統(tǒng)處理時(shí)也有這樣幾個(gè)過程,先將表達(dá)的內(nèi)容進(jìn)行分類和抽取,提取后來預(yù)測想表達(dá)什么內(nèi)容,該怎么回應(yīng)。最后進(jìn)行這個(gè)領(lǐng)域的問答知識(shí)庫匹配,同時(shí)表達(dá)出來。
對話生成技術(shù)也是用很多詞向量,句子對話庫進(jìn)行匹配和預(yù)測。這是一個(gè)案例的流程,基于無監(jiān)督的語義模型進(jìn)行問題擴(kuò)充,基于上下問得到準(zhǔn)確的答案生成。
對話系統(tǒng)在當(dāng)前的時(shí)代也有很多應(yīng)用,例如家庭智能音箱,在幾米之外呼喚一聲也能聽到;對于帶口音和常見方言的句子機(jī)器也能識(shí)別;不用話語全部說完才能說下一句,可以中途交錯(cuò)打斷,或者跳轉(zhuǎn)其他語境中。
語義命令可以用于家庭音箱、汽車導(dǎo)航來提高安全性,也可以用于老百姓的辦事大廳,不用很復(fù)雜的找到對應(yīng)的人。例如在汽車上通過語音助理,幫助實(shí)現(xiàn)找加油站、停車等功能;在金融和運(yùn)營商行業(yè),已經(jīng)很好地運(yùn)用智能語音的技術(shù)幫我們更快速的實(shí)現(xiàn)打電話、接電話、提高效率。
知識(shí)圖譜及應(yīng)用
最后介紹一下知識(shí)圖譜及應(yīng)用。什么是圖譜?從一個(gè)因材施教的案例來理解。
一個(gè)班級(jí)有三四十名同學(xué)一起上課,因?yàn)槔蠋煹木τ邢?,無法為每一個(gè)同學(xué)量身打造應(yīng)該做什么內(nèi)容進(jìn)行鞏固學(xué)習(xí)。每個(gè)人都是同樣的卷子,這樣傳統(tǒng)的方式是千人一面,沒有個(gè)性化的精準(zhǔn)學(xué)習(xí)。
通過知識(shí)圖譜的方式,我們結(jié)合了智能批改,對每個(gè)同學(xué)進(jìn)行精準(zhǔn)分析,得出個(gè)性評價(jià),進(jìn)行精準(zhǔn)的教學(xué)。
這是某年級(jí)某一門學(xué)科,把所有的知識(shí)做成這樣的圖譜,同時(shí)用各種顏色的亮點(diǎn)表示,綠色表示這位同學(xué)在這個(gè)學(xué)科中這個(gè)知識(shí)點(diǎn)掌握非常好,黃色表示掌握一般,紅色表示基礎(chǔ)比較薄弱。這樣的知識(shí)圖譜就能充分為每一個(gè)同學(xué)的知識(shí)學(xué)習(xí)情況進(jìn)行畫像,從而為他來打造一個(gè)量身定制的教學(xué)環(huán)境。
老師基于知識(shí)圖譜布置作業(yè),可以根據(jù)每一個(gè)同學(xué)的薄弱點(diǎn),專門為他出題,找到他的薄弱點(diǎn)進(jìn)行強(qiáng)化練習(xí),對于他已經(jīng)掌握好的可以溫故而知新。
對于試卷批改,可通過機(jī)器批改的輔助方式快速改作業(yè),更好地幫助老師修改作業(yè),讓學(xué)生成功進(jìn)行知識(shí)沉淀,讓老師從簡單重復(fù)的工作中解放出來。
對于每個(gè)同學(xué)來說,可以建立個(gè)性化錯(cuò)題本,有了機(jī)器輔助可以幫助每一個(gè)同學(xué)自動(dòng)生成錯(cuò)題本,從而推薦每個(gè)人不熟悉的或者錯(cuò)誤較多的題目反復(fù)練習(xí)。
除了以上幾個(gè)應(yīng)用領(lǐng)域外,在智能服務(wù)領(lǐng)域、會(huì)議領(lǐng)域、辦公領(lǐng)域等將有人工智能應(yīng)用的前景和空間。
未來三年,對人工智能的應(yīng)用有3點(diǎn)展望:
- 核心技術(shù)上,無監(jiān)督小樣本學(xué)習(xí)取得突破,人機(jī)耦合效能提升10倍,領(lǐng)域知識(shí)推理達(dá)到實(shí)用;
- 應(yīng)用場景上,認(rèn)知智能將觸及到50%以上的行業(yè),形成規(guī)?;膽?yīng)用場景;
- 行業(yè)趨勢上,先行企業(yè)將陸續(xù)建成覆蓋行業(yè)知識(shí)和業(yè)務(wù)場景的“認(rèn)知中臺(tái)”,支撐和打造“行業(yè)超腦”。