雖然是一家創(chuàng)業(yè)型公司,因團(tuán)隊在盛大、騰訊等公司所有的深厚積累,達(dá)觀數(shù)據(jù)備受市場青睞。
目前,公司的主營業(yè)務(wù)在于非結(jié)構(gòu)化數(shù)據(jù)處理中的文本處理。2017年,公司營收同比增長3-4倍,達(dá)到盈虧平衡。
作為數(shù)據(jù)界的“復(fù)旦系”,達(dá)觀數(shù)據(jù)是如何立足于數(shù)據(jù)市場的?
致力于非結(jié)構(gòu)化數(shù)據(jù)文本智能審閱市場
“雖然是一家創(chuàng)業(yè)型的公司,但在專業(yè)領(lǐng)域,達(dá)觀數(shù)據(jù)已經(jīng)有了深厚的積累。創(chuàng)始人陳運文博士,最早在盛大文學(xué),當(dāng)時全國百分之七八十的小說文學(xué)網(wǎng)站數(shù)據(jù)體系搭建都是由陳博團(tuán)隊所主導(dǎo)的,后來也成為騰訊文學(xué)的前身。在意識到文本挖掘和智能化處理的價值時,陳運文帶領(lǐng)著團(tuán)隊一同創(chuàng)辦了達(dá)觀數(shù)據(jù)。所以,雖然作為創(chuàng)業(yè)型公司,我們在專業(yè)的文字挖掘上有豐厚的經(jīng)驗?!标P(guān)于達(dá)觀數(shù)據(jù)的創(chuàng)立背景,市場總監(jiān)孫亞彬如是說。
目前,達(dá)觀數(shù)據(jù)的業(yè)務(wù)主要在于非結(jié)構(gòu)化的文本數(shù)據(jù)處理。對于何謂非結(jié)構(gòu)化文本,孫亞彬解釋道:
“我們通常所理解的數(shù)據(jù)分析公司,大部分是處理結(jié)構(gòu)化的數(shù)據(jù)。但事實上還有占到總量60%以上的非結(jié)構(gòu)化數(shù)據(jù)。文本是非結(jié)構(gòu)化數(shù)據(jù)中的一種。目前市場上大部分產(chǎn)品的處理能力還比較弱,所以還沒能把它很好的挖掘出來?!?/p>
舉例來說,在銀行的信貸部門,當(dāng)消費者申請借款,無論是提交申請報告,還是簽訂銀行合同,都需要進(jìn)行大量的審計。用人工進(jìn)行審核會耗費大量的時間和精力。人的精力是有限的,一旦工作效率的降低,審計的準(zhǔn)確率也隨之降低。但對于基于數(shù)據(jù)處理的機(jī)器來說,完全可以避免這樣的問題。機(jī)器的效率會快的多,準(zhǔn)確率也可以達(dá)到更高的水平。在達(dá)觀為國內(nèi)知名保險公司提供的財務(wù)審閱系統(tǒng)中,財務(wù)信息提取準(zhǔn)確率達(dá)高到98%。
“所以,我們提供的系統(tǒng)就是代替人做機(jī)械化和重復(fù)性的工作。機(jī)器可以自動閱讀文檔內(nèi)容、閱讀合同,并把關(guān)鍵核心信息進(jìn)行提取,把可能存在的錯誤內(nèi)容標(biāo)識出來。這樣審核人員就不需要檢查整個文檔,只要看標(biāo)注出來的可能存在的錯誤信息便可,大大減少了人員的處理時間,也提升了整個的工作流程效率?!?/p>
基于以上業(yè)務(wù),達(dá)觀數(shù)據(jù)的文檔智能審閱系統(tǒng)可協(xié)助金融、制造、通信、法律、審計、媒體、政府多個行業(yè)的文字密集企業(yè)完成文檔審閱工作。
數(shù)據(jù)界的“復(fù)旦系”
在業(yè)務(wù)能力的背后,是核心技術(shù)的支持?;谧匀徽Z言處理能力,達(dá)觀數(shù)據(jù)搭建了NLP文本智能處理平臺。在平臺之上,進(jìn)一步衍生出三大引擎,包括文本挖掘引擎、垂直搜索引擎,以及智能推薦引擎。
上月,國內(nèi)知名自然語言處理領(lǐng)軍專家、復(fù)旦大學(xué)計算機(jī)教授黃萱菁博士正式受聘為達(dá)觀數(shù)據(jù)高級顧問。此前,復(fù)旦大學(xué)計算機(jī)學(xué)院教授、知識工廠實驗室創(chuàng)始人、國內(nèi)最早從事知識圖譜研究的學(xué)者肖仰華博士受聘擔(dān)任達(dá)觀數(shù)據(jù)高級顧問。
除了聘請復(fù)旦學(xué)者,達(dá)觀數(shù)據(jù)的創(chuàng)立發(fā)展和復(fù)旦大學(xué)頗有淵源。不僅創(chuàng)始人陳運文博士在此畢業(yè),公司的許多技術(shù)核心人員皆是復(fù)旦大學(xué)出身。
“在自然語言處理領(lǐng)域,分為北派和南派,北派的代表是哈工大、清華,在自然語言處理方面全國名列前茅。南派領(lǐng)頭的包括復(fù)旦大學(xué)、東南大學(xué)。”孫亞彬繼續(xù)表示,因為和復(fù)旦大學(xué)的淵源,公司與其一同創(chuàng)建了聯(lián)合實驗室,此次與黃萱菁教授合作也是在實驗室的基礎(chǔ)上進(jìn)一步深化。
在國內(nèi)語言處理領(lǐng)域,黃萱菁是泰斗級人物。作為國內(nèi)早期從事人工智能、自然語言處理和信息檢索的學(xué)者,已經(jīng)在SIGIR、IEEE TKDE、ACL、ICML、IJCAI、AAAI、SCIS、CIKM、ISWC、 EMNLP、WSDM和COLING等多個高水平國際學(xué)術(shù)期刊和會議上發(fā)表了近百篇論文,負(fù)責(zé)的多個科研項目受到國家自然科學(xué)基金、科技部、教育部、上海市科委的支持。
與學(xué)界的合作,對于達(dá)觀數(shù)據(jù)提升自身的自然語言處理技術(shù)能力來說無疑幫助巨大。
資本加持 未來營收盈利能力向好
而除了自身的業(yè)務(wù)能力,以及與學(xué)界合作之外,達(dá)觀數(shù)據(jù)之所以獲得業(yè)界關(guān)注還與被資本看好有關(guān)。
自2015年創(chuàng)立,“企業(yè)大數(shù)據(jù)”市場的不斷向好,達(dá)觀數(shù)據(jù)備受資本青睞。先是在2016年1月獲得來自真格基金領(lǐng)投的1000萬元人民幣天使輪融資。2017年4月,進(jìn)一步獲得由軟銀賽富領(lǐng)投,方廣資本跟投的5000萬元A輪融資。
對于這次投資,軟銀賽富一方面看好挖掘和分析數(shù)據(jù)對提升經(jīng)營效率上的幫助,據(jù)素有國內(nèi)投資界“教父”軟銀賽富管理合伙人閻焱表示:“中國企業(yè)普遍掌握了很多數(shù)據(jù)和資料,挖掘和利用好這些數(shù)據(jù),對提升經(jīng)營效率有很大的幫助?!迸c此同時,也表示了對達(dá)觀數(shù)據(jù)的肯定。據(jù)該司執(zhí)行董事Jacky表示,達(dá)觀團(tuán)隊在文本語義理解方面有深厚技術(shù)積累,擅長算法研發(fā)并多次獲獎,在服務(wù)的企業(yè)也均獲得了很好的口碑,他看好達(dá)觀成為企業(yè)文本挖掘和搜索推薦領(lǐng)域的領(lǐng)頭羊。
據(jù)孫亞彬介紹,2017年達(dá)觀數(shù)據(jù)的銷售達(dá)數(shù)千萬,相較于16年實現(xiàn)了3-4倍的增長,基本實現(xiàn)盈虧平衡。
業(yè)績的倍增與客戶開拓戰(zhàn)略密不可分,公司在成立早期,主要還是以Saas類型的客戶為主要服務(wù)對象,大多是互聯(lián)網(wǎng)中部的企業(yè)。17年之后,逐漸發(fā)現(xiàn)很多傳統(tǒng)的大型企業(yè)對于文字的需求越來越強(qiáng)烈,像華為、招行都主動與達(dá)觀數(shù)據(jù)進(jìn)行業(yè)務(wù)合作。市場需求擴(kuò)大后,達(dá)觀數(shù)據(jù)開始針對大客戶開發(fā)定制的標(biāo)準(zhǔn)化產(chǎn)品。
截至目前,公司已積累華為、京東、海爾、長虹、中國移動、順豐、中國平安、招商銀行、浦發(fā)銀行、華泰證券等數(shù)百家企業(yè)客戶的成功服務(wù)經(jīng)驗,覆蓋金融、科技、制造、法律、電商、視頻、傳媒等行業(yè)。