人工智能(Artificial Intelligence,簡稱AI),是研究、開發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué)。既然是期望讓計算機(jī)智能系統(tǒng)來代替人的腦力勞動,自動化的從事的各項工作,那么如何來衡量人工智能的實際水平呢?
無論是人工智能還是人類的腦力活動,所要面對的問題的難易程度各不相同;針對不同的應(yīng)用場景,現(xiàn)在業(yè)界所掌握的人工智能技術(shù)的實際應(yīng)用水平高低也各不相同。在選擇劃分人工智能水平的標(biāo)準(zhǔn)上,國際著名的人工智能專家Sandeep Rajani教授,在《人工智能:人或機(jī)器》(Artificial Intelligence-Man or Machine)一文中,將人工智能的水平和人類能力進(jìn)行橫向?qū)Ρ?,劃分成四個不同的等級:
- 巔峰級——已經(jīng)實現(xiàn)了無法超越的最優(yōu)能力
- 超越人類級——比所有人類的能力都要強(qiáng)
- 強(qiáng)人類級——比大多數(shù)人類的能力要強(qiáng)
- 弱人類級——比大多數(shù)人類的能力要弱
在介紹計算機(jī)算法和數(shù)據(jù)挖掘技術(shù)的教科書《智能Web算法》(第二版)中,達(dá)觀數(shù)據(jù)CEO陳運文將Rajani教授的上述劃分方法作了翻譯和介紹,這里再做一些展開闡述。在當(dāng)今時代背景下,現(xiàn)有各個不同應(yīng)用領(lǐng)域里人工智能技術(shù)的水平高低情況和已經(jīng)達(dá)成的水平如下:
巔峰級水平:
在一些規(guī)則完備、策略空間較小的應(yīng)用場景下,例如在19*19的棋盤里下五子棋,如今的計算機(jī)技術(shù)已經(jīng)可以窮舉所有可能的對弈情況,確保與人類在任意對弈的情況下都可以實現(xiàn)最優(yōu)的方案。同樣在Tic-Tac-Toe(一種簡單的井字棋游戲)、跳棋等領(lǐng)域,以及數(shù)據(jù)統(tǒng)計等工程應(yīng)用方面計算機(jī)已經(jīng)是巔峰級水平了。
超越人類級:
AlphaGo和柯潔的圍棋對戰(zhàn),以及IBM深藍(lán)(DeepBlue)戰(zhàn)勝國際象棋冠軍卡斯帕羅夫,都展示了在這些復(fù)雜的棋類游戲上人工智能已經(jīng)達(dá)到了超越人類級。在一些具體的應(yīng)用領(lǐng)域,如指紋識別、虹膜識別等領(lǐng)域,技術(shù)也已經(jīng)非常成熟,同樣實現(xiàn)了超越人類的能力。
強(qiáng)人類級:
有些智力活動需要深入的領(lǐng)域經(jīng)驗,計算機(jī)相比少量的專業(yè)人士能力還有差距,但是比一般大眾的能力要強(qiáng)。例如在德州撲克、橋牌等領(lǐng)域,計算機(jī)已經(jīng)強(qiáng)過大部分普通人類了,在一些專用領(lǐng)域,例如在良好條件的人臉識別(沒有不良的遮擋、光照、角度問題)、良好條件的語音識別(沒有特殊地域口音、復(fù)雜環(huán)境噪聲)等領(lǐng)域里,花卉植物種類的識別等領(lǐng)域,計算機(jī)的能力也已經(jīng)達(dá)到了強(qiáng)人類級。
弱人類級:
有很多技能大多數(shù)普通人類掌握起來并不難,例如駕駛汽車,但是對計算機(jī)系統(tǒng)來說,因為要采集的信號以及分析的數(shù)據(jù)情況非常復(fù)雜,目前還難以達(dá)到普通人類的水平,處于弱人類級。常見的還包括寫作文章、閱讀理解、人類語言翻譯等領(lǐng)域。
上述介紹里,人工智能的水平從弱人類級到巔峰級水平高低各不相同。之所以人工智能在不同領(lǐng)域的發(fā)展水平不一致,主要是受三個因素影響,具體包括:
因素1 規(guī)則和評價方法的明確程度
越是簡單明確、并且計算機(jī)可以量化評估的問題,通過人工智能來實現(xiàn)的代價越小,例如棋牌類游戲,計算機(jī)可以發(fā)揮的作用很大。
但是不確定因素越多的問題,計算機(jī)來學(xué)習(xí)時就會碰到很多麻煩。例如駕駛車輛,駕駛方法和路況變化很多,并沒有非常嚴(yán)格而明確的“勝/負(fù)”、“好/壞”的駕駛方式;又例如麻將或撲克,有很多隨機(jī)性因素,甚至有運氣成分,處理條件并不嚴(yán)格一致,此時也會給人工智能更好的處理帶來挑戰(zhàn)(陳運文達(dá)觀數(shù)據(jù))。
因此,規(guī)則越明確、評判好壞的標(biāo)準(zhǔn)越客觀的應(yīng)用場景,目前人工智能技術(shù)的實踐效果越好。
因素2 特殊情況出現(xiàn)頻率的高低
很多應(yīng)用問題,在典型場景下的處理和在包含各種特殊異常情況下處理,其難度差異非常大。
以人臉識別問題為例,在人臉拍攝條件良好、角度對正且無遮擋的情況下,現(xiàn)有機(jī)器學(xué)習(xí)技術(shù)完成人臉檢測、識別的精度已經(jīng)非常高。但是在實際應(yīng)用時,會遇到相當(dāng)多特殊情況,例如由于受到光照、角度等客觀因素的影響,加上被拍攝者存在化妝、佩戴飾品、局部遮擋、年齡變化等各種情況,甚至少量情況下還存在被拍攝者試圖通過整容或偽裝方式,故意干擾計算機(jī)的識別過程,這些因素都會非常嚴(yán)重的影響實際使用的效果。
自動駕駛技術(shù)也同樣存在大量的問題,例如正常晴好天氣,和雨雪等惡劣天氣,對解決問題來說難度的差別非常大。各種各樣的路況情況,也對自動駕駛的實用化帶來很大的挑戰(zhàn)。
現(xiàn)有的大量人工智能應(yīng)用,在實驗室條件下很多已經(jīng)達(dá)到了非常好的成績,但是在工業(yè)化應(yīng)用中,由于使用條件比實驗室環(huán)境要復(fù)雜和惡劣的多,需要處理各種異常和干擾因素,因此很多應(yīng)用的實際水平,還徘徊在強(qiáng)人類級和弱人類級之間。(陳運文達(dá)觀數(shù)據(jù))
目前人工智能的技術(shù),從實驗室走向?qū)嶋H應(yīng)用,需要克服的問題很多,還有很長的路要走。在實際落地的時候,務(wù)實的做法是先限制具體的場景,盡量排除掉不確定性因素,簡化問題。例如在自動駕駛技術(shù)的研發(fā)中,如果限制為固定線路之間、或者封閉道路內(nèi)的應(yīng)用,技術(shù)難度就會大大簡化,此時往往就能從弱人類級往上提升1-2個級別,達(dá)到實際可用的程度。在文字閱讀理解時,如果限制文本的行業(yè)、類型和理解內(nèi)容時,也能大大的提升系統(tǒng)的準(zhǔn)確率,達(dá)到可以實用化的地步。
因素3 積累的訓(xùn)練數(shù)據(jù)的規(guī)模
我們都知道,“大數(shù)據(jù)+算法模型=人工智能”,由此不難看出,人工智能的關(guān)鍵性的基礎(chǔ)是大數(shù)據(jù)。俗話說,巧婦難為無米之炊,只有積累了海量的訓(xùn)練數(shù)據(jù),才能將人工智能的水平向上提升。AlphaGo也是通過積累了數(shù)千萬盤圍棋對戰(zhàn)棋譜數(shù)據(jù),并進(jìn)行充分的模型訓(xùn)練后,才打敗了人類頂尖棋手的。
在每一個人工智能的應(yīng)用場景里,數(shù)據(jù)積累程度的高低,直接影響該領(lǐng)域里人工智能的應(yīng)用水平。然而現(xiàn)實領(lǐng)域里,很多訓(xùn)練數(shù)據(jù)的積累工作才剛剛開始。尤其是監(jiān)督式學(xué)習(xí)所需要的“標(biāo)注數(shù)據(jù)(Labeled Data)”的積累,往往需要大量的人工參與,成本很高,大大制約了人工智能在相關(guān)領(lǐng)域里水平的提升。另外有一些領(lǐng)域的數(shù)據(jù)因為受到一些政策因素的限制,例如醫(yī)療數(shù)據(jù),或者有些數(shù)據(jù)被部分行業(yè)企業(yè)壟斷,這些都導(dǎo)致數(shù)據(jù)難以流通,人工智能的水平提升也就比較緩慢。
隨著近年來計算機(jī)硬件存儲成本的迅速降低,云計算的逐步普及,數(shù)據(jù)積累工作的硬件環(huán)境迅速改善。數(shù)據(jù)采集的意識也逐步覺醒,希望在應(yīng)用需求的推動下,有越來越多的數(shù)據(jù)被數(shù)字化,并記錄下來,訓(xùn)練出優(yōu)秀的算法模型來提升效果。
從弱人類級起步,到強(qiáng)人類級、超越人類級、巔峰級,任重道遠(yuǎn)??茖W(xué)發(fā)展的腳步通常都是先易后難、化繁為簡。隨著技術(shù)不斷的積累與進(jìn)步,相信未來在越來越多的應(yīng)用領(lǐng)域里,人工智能技術(shù)都能代替人類,來完成越來越多有價值的工作。