近日,專注于推動產(chǎn)業(yè)互聯(lián)網(wǎng)科技創(chuàng)新的知名商業(yè)媒體——品途集團(tuán)主辦的2018 NBI 夏季創(chuàng)新峰會在北京舉行。本次峰會以“與創(chuàng)新節(jié)律同步”為主題,聚集了國內(nèi)外投資人、優(yōu)秀創(chuàng)業(yè)者、企業(yè)家、思想領(lǐng)袖等5000余人。
達(dá)觀數(shù)據(jù)創(chuàng)始人陳運(yùn)文領(lǐng)獎(左二)
創(chuàng)新是企業(yè)發(fā)展中的生命力所在,本次峰會主辦方表彰了在企業(yè)服務(wù)領(lǐng)域發(fā)展過中國內(nèi)最具有創(chuàng)新基因和優(yōu)秀實力的企業(yè),中國文本智能處理專家達(dá)觀數(shù)據(jù)榮登“2018年企業(yè)服務(wù)創(chuàng)新20強(qiáng)”。
在隨后關(guān)于《新企業(yè)服務(wù)的“做局”與“破局”》的企業(yè)服務(wù)專場中,達(dá)觀數(shù)據(jù)創(chuàng)始人兼CEO陳運(yùn)文發(fā)表了題為《文本智能處理在企業(yè)的應(yīng)用實踐》的主題演講,并指出:重復(fù)性的和對準(zhǔn)確率要求特別高的兩個場景,都很適合讓計算機(jī)代替人工做文字閱讀工作。
? 從人工智能角度來說,文本自動處理屬于人工智能的三大領(lǐng)域之一,包含圖像、文本、語音,文本這一個領(lǐng)域應(yīng)用面最廣闊。? 任何工作都離不開文檔的處理,而這些處理工作可以讓計算機(jī)來代替。人腦處理過程和計算機(jī)處理過程類似,計算機(jī)的閱讀量是人的數(shù)以萬計,一旦計算機(jī)訓(xùn)練好,它能夠做的事情其實跟人一樣甚至比人做的更好。
? 在企業(yè)服務(wù)探索的過程中達(dá)觀數(shù)據(jù)發(fā)現(xiàn)有兩類場景特別適合讓計算機(jī)來做,第一類是特別枯燥、繁瑣和重復(fù)的事情,比如說審? 計業(yè)務(wù)。第二類是關(guān)鍵性、嚴(yán)肅性的文檔,不希望出任何細(xì)小的錯誤。
目前為止,絕大部分中國企業(yè)仍然是靠大量勞動力日復(fù)一日的處理這類文檔資料,未來都可以逐步讓計算機(jī)代替來完成。很多行業(yè)都有這楊的需求,金融、媒體、互聯(lián)網(wǎng)、政府、法律、大型企業(yè)等。
如果從計算機(jī)技術(shù)的角度來看,大概分三個層次,字體級、段落級和篇章級。比如讓計算機(jī)從視頻的文本中提取文字,做一個概要的簡寫、進(jìn)行分類、對語義觀點正負(fù)面進(jìn)行判斷,這一些靠人反復(fù)閱讀才能完成的工作,計算機(jī)在一秒鐘就可以完成。
計算機(jī)的應(yīng)用面很多,像抽取、分類、審核、糾錯這些企業(yè)運(yùn)營過程中常見的操作方式都可以交給計算機(jī)完成。
除此之外,審閱是更加常見的一個需求。大量的審核需求通過人工來做很難沒有問題和遺漏。因為人的大腦連續(xù)工作半個小時以上就會疲勞,計算機(jī)7×24小時工作,它能把所有要找的東西原原本本找到,不管是上下文一致性、找錯別字、檢查不合規(guī)的內(nèi)容,計算機(jī)可以瞬間發(fā)現(xiàn)。
知識圖譜技術(shù)將大量結(jié)構(gòu)化的信息和非結(jié)構(gòu)化的信息結(jié)合在一起,能實現(xiàn)智能推薦,互聯(lián)網(wǎng)時代大量APP在給用戶提供更好的用戶體驗時,都傾向于采用信息流的方式。其背后就是一套智能推薦的引擎,只有對內(nèi)容有深度的理解,才能夠真正的把握用戶的興趣點。
陳運(yùn)文認(rèn)為企業(yè)服務(wù)沒有捷徑可走,與面向消費者的2C不同,更是一個慢工出細(xì)活的事情,靠兢兢業(yè)業(yè)的給行業(yè)客戶提供服務(wù),才能夠把這企業(yè)服務(wù)這一件事情做好。中國的企業(yè)在從傳統(tǒng)粗放式的經(jīng)營轉(zhuǎn)變成精細(xì)化的經(jīng)營方式,精細(xì)化運(yùn)營需要像達(dá)觀這樣的服務(wù)公司,以技術(shù)的智能化方式去完成大量的文字工作。
達(dá)觀數(shù)據(jù)認(rèn)為十年以后計算機(jī)將負(fù)責(zé)超過一半的文字處理工作。各類企業(yè)都將具備相關(guān)的計算機(jī)軟件系統(tǒng),期待智能化那天的到來。