色屁屁www影院免费观看入口,欧美性猛交ⅹxxx乱大交妖精,欧美激情第5页,欧美性猛交xxxx三人,欧美一a级做爰片大开眼界

達(dá)觀動(dòng)態(tài)

達(dá)觀愿與業(yè)內(nèi)同行分享 助力各企業(yè)在大數(shù)據(jù)浪潮來(lái)臨之際一起破浪前行

達(dá)觀數(shù)據(jù)副總裁賈學(xué)鋒:基于文本智能技術(shù)的AI產(chǎn)品設(shè)計(jì)實(shí)踐

10月24日,達(dá)觀數(shù)據(jù)副總裁賈學(xué)鋒受起點(diǎn)學(xué)院邀請(qǐng),作《基于文本智能技術(shù)的AI產(chǎn)品設(shè)計(jì)實(shí)踐》直播,上線當(dāng)天700多人報(bào)名,廣受好評(píng)。

本文根據(jù)直播錄音整理,內(nèi)容略有刪減。

人工智能的浪潮遍及各行各業(yè),隨著自然語(yǔ)言處理技術(shù)的發(fā)展,計(jì)算機(jī)對(duì)文字的處理也進(jìn)展到了一個(gè)新的層次,什么是文本智能?怎樣在產(chǎn)品中找到人工智能可賦能的場(chǎng)景?當(dāng)ai遇上產(chǎn)品設(shè)計(jì),又將碰撞出怎樣的火花?

什么是文本智能

幻燈片3

文本智能通俗來(lái)講,是計(jì)算機(jī)像人類一樣理解自然語(yǔ)言。

“冬天,能穿多少穿多少。夏天,能穿多少穿多少?!?/span>

“中國(guó)足球隊(duì),誰(shuí)都打不過。中國(guó)乒乓球隊(duì),誰(shuí)都打不過”。

人類看一眼就知道什么意思,對(duì)計(jì)算機(jī)來(lái)說(shuō)則困難重重。因?yàn)?strong>人的表達(dá)方式千變?nèi)f化,短詞匯可以傳達(dá)非常寬泛的語(yǔ)義信息。幻燈片4

現(xiàn)在的文本智能處在什么層面?

人工智能的分類層次,第一層“運(yùn)算智能”。計(jì)算是計(jì)算機(jī)的強(qiáng)項(xiàng),通過分布式系統(tǒng)及高性能的CPU、GPU可以很好解決。

第二層“感知智能”。感知是在更多聽覺、視覺、觸覺等方面的創(chuàng)新。

文本智能處于第三層:認(rèn)知智能。研究如何進(jìn)行自然語(yǔ)言理解、知識(shí)的構(gòu)建和邏輯推理。

第四層“創(chuàng)建智能”,是人工智能行業(yè)終極目標(biāo)。

文本也可以分成兩種類型,一種是書面文本,承載的形式為網(wǎng)頁(yè)、word、txt或pdf。 另外一種則是日常交流的口語(yǔ)形式。達(dá)觀專注于第一種。

一份簡(jiǎn)歷、一份合同、一份上市公司的債券募集說(shuō)明書、一條評(píng)論都可以算書面文本。

面對(duì)一篇文本,我們能做什么呢?

幻燈片5

一,拆解。像庖丁解牛一樣把文檔結(jié)構(gòu)化。

簡(jiǎn)歷的姓名、照片、工作經(jīng)歷、教育背景;合同中交易的甲乙方、合同標(biāo)的物、付款方式、條款;新聞的標(biāo)題、摘要、來(lái)源、正文、關(guān)鍵人物、事件,組織機(jī)構(gòu)名稱,都是對(duì)文本拆解后抽取到的信息。

抽取是文本處理中最重要和實(shí)用的技術(shù)。抽取出合同中的“付款方式”之后,業(yè)務(wù)方才能夠去進(jìn)一步審核“付款方式”是否符合法律法規(guī)。

二,聯(lián)接。對(duì)多個(gè)文本進(jìn)行庖丁解牛式的拆解,相關(guān)知識(shí)就能聯(lián)接形成一個(gè)巨大的知識(shí)網(wǎng)。

對(duì)標(biāo)到知識(shí)圖譜,新聞中的人、事、物、關(guān)系,公司年報(bào)中的出現(xiàn)的公司名稱及關(guān)系都可以作為文本智能處理的大腦和背景知識(shí),在知識(shí)網(wǎng)絡(luò)上進(jìn)行邏輯推理和判斷。

三,生成。生成是學(xué)術(shù)界研究的熱點(diǎn),在當(dāng)前階段是非常困難的事情。騰訊的Dreamwriter,今日頭條的xiaomingbot都在嘗試用機(jī)器創(chuàng)作短新聞。

接下來(lái)我們具體看一些文本智能的例子。幻燈片6

根據(jù)一篇新聞資訊,生成不同長(zhǎng)度的摘要,主要有兩種技術(shù)手段:抽取式和生成式。

給定一個(gè)用戶評(píng)論,提取出標(biāo)簽信息和觀點(diǎn),屬于一個(gè)短文本處理

文本分類和情感識(shí)別:在文本質(zhì)量管控和輿情分析方面使用較多。

文本審核也是分類的一種,涉黃涉政及判斷是否是廣告,是每一個(gè)做互聯(lián)網(wǎng)產(chǎn)品的公司比較頭疼的事。

下面是金融行業(yè)的債券募集說(shuō)明書。幻燈片7

這樣一個(gè)文檔中,行業(yè)研究人員比較關(guān)注公司高管信息,比如姓名、公司職位。在債券募集說(shuō)明書中收購(gòu)標(biāo)的是哪些,包括資產(chǎn)、標(biāo)的業(yè)務(wù)、標(biāo)的所在行業(yè)是否涉外、交易對(duì)手是否涉外、各類財(cái)務(wù)指標(biāo)等。

一般債券募集說(shuō)明書從100到500頁(yè)不等,讓人從這么長(zhǎng)的文檔中找到這些關(guān)鍵信息,非常容易出錯(cuò)。

在公開的金融資訊網(wǎng)站上,債券募集說(shuō)明書非常多,一個(gè)金融從業(yè)人員不可能在短時(shí)間內(nèi)把每篇文章內(nèi)的信息都抽取出來(lái)。

所以在整個(gè)領(lǐng)域來(lái)說(shuō),文本智能處理出現(xiàn)了非常大的機(jī)會(huì)。這也受益于算法的進(jìn)步,特別是深度神經(jīng)網(wǎng)絡(luò)從圖片識(shí)別領(lǐng)域到文本處理的遷移。

促成文本智能處理飛速發(fā)展的原因很多。

最近Google 的bert模型刷遍AI界朋友圈:NLP歷史突破,谷歌BERT模型狂破11項(xiàng)記錄,全面超越人類。算法層面一直在不斷取得很大的創(chuàng)新和進(jìn)步是主要因素。

第二因素是計(jì)算能力,如分布式系統(tǒng),GPU等應(yīng)用。

第三因素是語(yǔ)料庫(kù)的積累,互聯(lián)網(wǎng)行業(yè),可以通過多種手段迅速積累語(yǔ)料庫(kù),傳統(tǒng)企業(yè)也有資料積累,但量級(jí)無(wú)法與互聯(lián)網(wǎng)比。幻燈片8

文本智能處理的需求遍及各行各業(yè)。只要存在文字處理工作的行業(yè),都有文本智能處理的需求,金融、法律、政府行業(yè),媒體、互聯(lián)網(wǎng),大型企業(yè)等。幻燈片9

設(shè)計(jì)思維和機(jī)器學(xué)習(xí)

幻燈片10

掌握AI算法和基于AI算法設(shè)計(jì)產(chǎn)品之間的距離是非常大的,如同從火藥到火藥槍、從鈾到核炸彈、從硝化甘油到C4的區(qū)別。

幻燈片11

怎樣才能基于這個(gè)AI算法設(shè)計(jì)產(chǎn)品呢?

要給客戶解決什么問題、目標(biāo)客戶如何刻畫、客戶在什么樣的場(chǎng)景下會(huì)使用我們的產(chǎn)品、怎么用一系列問題,需要產(chǎn)品系統(tǒng)的思考。幻燈片12

設(shè)計(jì)思維的六個(gè)步驟重點(diǎn)包括:啟發(fā)、構(gòu)思和實(shí)施。

機(jī)器學(xué)習(xí)的流程,是對(duì)要解決的問題定義好后,對(duì)數(shù)據(jù)加工處理,提取特征,進(jìn)行算法選擇,從而確定可使用的模型。

當(dāng)這些模型滿足上線要求或業(yè)務(wù)要求以后,我們把模型放到線上系統(tǒng)中。當(dāng)新接受到的數(shù)據(jù)進(jìn)行同樣的處理后,用訓(xùn)練出來(lái)的模型來(lái)判斷是否屬于垃圾郵件。

算法接受不同的數(shù)據(jù)可以訓(xùn)練出不同的模型。整個(gè)過程是迭代優(yōu)化,因?yàn)?strong>數(shù)據(jù)的分布和蘊(yùn)含的特征可能隨著業(yè)務(wù)的不斷發(fā)展在產(chǎn)生改變。幻燈片13

設(shè)計(jì)思維是以用戶為中心,強(qiáng)調(diào)敏捷開發(fā)、快速迭代。

機(jī)器學(xué)習(xí)是以數(shù)據(jù)為中心,強(qiáng)調(diào)數(shù)據(jù)+模型閉環(huán)驅(qū)動(dòng)。

兩者怎么樣進(jìn)行深度的融合,是在人工智能時(shí)代下對(duì)產(chǎn)品經(jīng)理能力模型的要求。幻燈片14

這兩年AI的宣傳,特別是AlphaGO的普及作用,我們感受到每一個(gè)行業(yè)都會(huì)被人工智能技術(shù)所影響,任何職業(yè)都會(huì)受到影響。

但AI到了無(wú)所不能的地步嗎?

顯然不是。幻燈片15

AI對(duì)行業(yè)或職業(yè)影響的有多大,很大程度上,是取決于這個(gè)領(lǐng)域技術(shù)的成熟度和邊界在哪。幻燈片16

比如文本處理領(lǐng)域,針對(duì)文本處理技術(shù)評(píng)估可以分為3類:可用 、基本可用、難以應(yīng)用。

達(dá)到人類水準(zhǔn)的有垃圾內(nèi)容的檢測(cè)、主題分類、文本相似度分析、對(duì)詞性進(jìn)行標(biāo)注。

基本可用但仍存在缺陷的,比如關(guān)鍵短語(yǔ)生成、實(shí)體鏈接、機(jī)器翻譯、語(yǔ)義消歧。

難以應(yīng)用,包括多輪對(duì)話、QA問答、內(nèi)容改寫等。

當(dāng)產(chǎn)品經(jīng)理在設(shè)計(jì)一個(gè)基于文本智能的產(chǎn)品時(shí),要考慮這項(xiàng)技術(shù)處于什么類別。類別決定技術(shù)用到最真實(shí)場(chǎng)景時(shí)、場(chǎng)景對(duì)準(zhǔn)確度的要求。

例如自動(dòng)駕駛或無(wú)人駕駛,場(chǎng)景容錯(cuò)率是零,因?yàn)檩p則車毀,重則人亡。

保守一點(diǎn)講,我們還處于AI的初級(jí)階段,AI的常識(shí)邏輯和邏輯推理能力都還很弱。但在日常生活中人類已經(jīng)享受到了AI帶來(lái)的價(jià)值。幻燈片17

?

如何找到AI賦能的場(chǎng)景

幻燈片18那么,該如何找到AI賦能的場(chǎng)景,讓算法專家、行業(yè)專家和應(yīng)用開發(fā)專家三種角色的合作使人工智能落地呢?

找到這個(gè)場(chǎng)景的前提是需要思考,運(yùn)用AI產(chǎn)品和解決方案的本質(zhì)什么。

幻燈片19

首先,應(yīng)用可以分為兩類:互聯(lián)網(wǎng)行業(yè)應(yīng)用企業(yè)級(jí)應(yīng)用。

在互聯(lián)網(wǎng)行業(yè)應(yīng)用,無(wú)論是搜索、推薦系統(tǒng)、廣告,提升的是過程中信息傳遞的效率。在企業(yè)級(jí)應(yīng)用上,主要是提升生產(chǎn)效率和創(chuàng)造新價(jià)值。

提到AI產(chǎn)品和解決方案,當(dāng)我們將它們服務(wù)于我們企業(yè)級(jí)場(chǎng)景的時(shí)候,它的核心是在提升生產(chǎn)效率。

產(chǎn)品需要找到在當(dāng)前的業(yè)務(wù)流程中,生產(chǎn)效率到底出現(xiàn)什么問題,或哪個(gè)環(huán)節(jié)希望借助AI技術(shù)進(jìn)行生產(chǎn)效率的提升、節(jié)省人力。幻燈片20

這些可以分四個(gè)步驟做,算法開發(fā)人員也是站在這四步實(shí)現(xiàn)代碼:

1)流程拆解

對(duì)當(dāng)前的工作流程或業(yè)務(wù)場(chǎng)景進(jìn)行詳細(xì)拆解,診斷阻礙生產(chǎn)效率的最大問題,對(duì)核心問題進(jìn)行拆解。

2)數(shù)據(jù)評(píng)估

如果想解決問題,公司的哪些數(shù)據(jù)是跟這個(gè)問題相關(guān)的;有沒有數(shù)據(jù);如果有數(shù)據(jù),這些數(shù)據(jù)的質(zhì)量怎樣;缺不缺數(shù)據(jù),如果缺數(shù)據(jù),這部分?jǐn)?shù)據(jù)可不可以通過外部采購(gòu),或跟其他的應(yīng)用、產(chǎn)品進(jìn)行連接后獲得。這些都是在數(shù)據(jù)評(píng)估階段要考慮的問題。

? 3)方案設(shè)計(jì)

方案設(shè)計(jì)是針對(duì)當(dāng)前的數(shù)據(jù)現(xiàn)狀去完善基礎(chǔ)數(shù)據(jù),選擇可能存在的AI算法是什么。比如進(jìn)行垃圾分類,有很多分類算法可以采納:貝葉斯模型、SVM邏輯回歸。第三點(diǎn)比較重要,很多時(shí)候人不知道算法的效果怎樣,如果工具能夠幫助我們進(jìn)行快速的測(cè)試,會(huì)很快的驗(yàn)證和優(yōu)化方案。

4)有機(jī)整合

當(dāng)設(shè)計(jì)好解決方案以后,準(zhǔn)確率是可接受的,這時(shí)考慮這項(xiàng)服務(wù)或應(yīng)用怎么跟現(xiàn)有的系統(tǒng)進(jìn)行結(jié)合。

大體來(lái)看有兩種方式,一種方式基于AI,做獨(dú)立的產(chǎn)品,在這個(gè)產(chǎn)品中有這項(xiàng)功能;第二種是一種以API接口的方式和業(yè)務(wù)進(jìn)行打通。系統(tǒng)上線以后,怎么做模型升級(jí)、怎么做維護(hù),也是我們面臨的挑戰(zhàn)的問題。

概括來(lái)講,想找到AI能夠賦能或落地的場(chǎng)景,需要對(duì)流程進(jìn)行拆解,然后評(píng)估數(shù)據(jù),進(jìn)行AI方案的設(shè)計(jì),最后和系統(tǒng)進(jìn)行有機(jī)整合。幻燈片21

如果對(duì)差旅的報(bào)銷流程進(jìn)行梳理,共有五個(gè)環(huán)節(jié):

第一,整理出差待報(bào)銷的發(fā)票。第二,填寫報(bào)銷申請(qǐng)表。第三,上傳遞交的票據(jù) ,第四,財(cái)務(wù)部門進(jìn)行審核,第五,最終審核通過。

對(duì)流程進(jìn)行拆解,第一步,整理出差待報(bào)銷的發(fā)票。要先根據(jù)票據(jù)的類型進(jìn)行分類,分好類分別計(jì)算各個(gè)票據(jù)的金額,交通、住宿,進(jìn)行匯總。第四個(gè)環(huán)節(jié),財(cái)務(wù)部門要核對(duì)申請(qǐng)表上的金額與提交的紙質(zhì)票據(jù)的原件是否一致。

當(dāng)對(duì)流程進(jìn)行拆分以后,就可以進(jìn)行AI技術(shù)的評(píng)估。比如票據(jù)類型分類,能不能通過OCR技術(shù)。

當(dāng)對(duì)進(jìn)行各項(xiàng)金額計(jì)算時(shí),能否通過文本關(guān)鍵信息提取技術(shù)把金額自動(dòng)提取出來(lái),進(jìn)行匯總計(jì)算。填寫報(bào)銷申請(qǐng)表時(shí),能否根據(jù)數(shù)據(jù)接口的方式自動(dòng)傳達(dá)財(cái)務(wù)部門的審核系統(tǒng)中。同樣,通過文本內(nèi)容關(guān)鍵信息提取技術(shù),把提取出來(lái)的數(shù)字和用戶上傳過來(lái)的數(shù)字進(jìn)行復(fù)核,來(lái)判斷是否通過。

這幾項(xiàng)AI技術(shù)幫助賦能,在這個(gè)環(huán)節(jié)中,我們需要哪些數(shù)據(jù)?

第一環(huán)節(jié)需要報(bào)銷的原件,第四個(gè)環(huán)節(jié)既需要原件,又需要申請(qǐng)表。通過這樣的方式,我們找到了AI落地的場(chǎng)景點(diǎn),并明白了技術(shù)在里面可以做到什么程度,同時(shí)讓業(yè)務(wù)方也了解到了這項(xiàng)技術(shù)確實(shí)是可以落地的。

達(dá)觀數(shù)據(jù)做的智能文本審核系統(tǒng),也是按照同樣的方式,對(duì)從合同起草、初步審閱、迭代修改、合同履行、合同歸檔幾個(gè)步驟進(jìn)行詳細(xì)的拆解。幻燈片22

通過拆解可以發(fā)現(xiàn)三個(gè)場(chǎng)景充分利用文本智能技術(shù)

第一,合同的差異比對(duì)。合同有不同的版本,且不同的版本是內(nèi)部不同的人配合協(xié)作的,有時(shí)還涉及到外部的咨詢公司。

第二,合同條款的讀取。當(dāng)我們進(jìn)行審核時(shí),需要公司的法務(wù)人員對(duì)合同進(jìn)行閱讀,找出需要審核的條款進(jìn)行法律法規(guī)的判定。

第三,合同審核。

找到這三個(gè)點(diǎn)以后,明確了提供AI產(chǎn)品價(jià)值是提升效率,幫助法務(wù)部門控制風(fēng)險(xiǎn)。

當(dāng)我們找到可以AI賦能的場(chǎng)景后,我們需要遵循什么樣的原則去設(shè)計(jì)產(chǎn)品和解決方案呢?

AI產(chǎn)品設(shè)計(jì)原則

幻燈片23

我們先來(lái)看下傳統(tǒng)軟件設(shè)計(jì)AI驅(qū)動(dòng)軟件的差別。幻燈片24

傳統(tǒng)軟件設(shè)計(jì),設(shè)計(jì)過程注重的因果、邏輯。設(shè)計(jì)一個(gè)OA系統(tǒng),要考慮員工辦公流程、每個(gè)流程要達(dá)到的目標(biāo)是什么、功能實(shí)現(xiàn)最短路徑。如果有輸入不符合預(yù)期時(shí),傳統(tǒng)軟件產(chǎn)品時(shí),開發(fā)工程師比較容易重現(xiàn)BUG和解決問題。

AI驅(qū)動(dòng)的軟件,重點(diǎn)需要考慮的是結(jié)果不確定性、逼近優(yōu)化目標(biāo)。

比如合同條款讀取,通過歷史的合同數(shù)據(jù),已經(jīng)能夠訓(xùn)練出文本智能模型,可以對(duì)某些字段進(jìn)行抽取,假對(duì)某個(gè)字段的抽取準(zhǔn)確率是98%,在歷史合同數(shù)據(jù)中這個(gè)非常高的準(zhǔn)確率了,站在業(yè)務(wù)方來(lái)評(píng)估,也基本能夠滿足上線要求。但當(dāng)系統(tǒng)上線以后,對(duì)新的一份合同,也許沒有抽取出來(lái)。又來(lái)一份新的合同,也許就抽取正確了。

對(duì)AI算法來(lái)說(shuō),準(zhǔn)確率98%是站在數(shù)據(jù)集的角度考慮的,但真正把模型或產(chǎn)品應(yīng)用到業(yè)務(wù)系統(tǒng)中,業(yè)務(wù)人員面對(duì)的是一份一份的數(shù)據(jù)。

另外,優(yōu)化目標(biāo)是個(gè)逼近的過程,過程是上下起伏的,總效果是逼近目標(biāo)的。就像人喝醉酒后回家一樣,搖搖晃晃,有時(shí)多走了幾步,但是還是往家的方向走。

可這種情況,對(duì)產(chǎn)品的使用者怎么辦?

使用者知道產(chǎn)品在優(yōu)化,但使用過程中還是會(huì)出現(xiàn)錯(cuò)誤。優(yōu)化的過程有起伏,使用者被告知針對(duì)目前的問題,上了一個(gè)新的版本,新版本的準(zhǔn)確率由98%提升到99%,可在真正使用時(shí),可能發(fā)現(xiàn)連續(xù)3份合同抽取錯(cuò)誤了。這種情況下業(yè)務(wù)方很難接受,因?yàn)樗麄儗?duì)AI算法本身不是太理解。作為產(chǎn)品經(jīng)理,這是一個(gè)需要解決的問題。

對(duì)AI產(chǎn)品,大家總是期望主動(dòng)表現(xiàn)出智能型,對(duì)于這種需求,UI設(shè)計(jì)和功能設(shè)計(jì)都是可以起到作用的。對(duì)于功能性,有4點(diǎn)比較重要。

第一,怎么設(shè)計(jì)“消除不確定性”。AI算法的流程和處理方式就決定了它存在的不確定性。產(chǎn)品要通過各種方式來(lái)攤銷或消除不確定性,或存在不確定性時(shí)有合適的處理方式。

第二,“注重學(xué)習(xí)反饋”。算法的智能很大一部分來(lái)自數(shù)據(jù),也來(lái)自用戶的反饋。當(dāng)新的數(shù)據(jù)源源不斷進(jìn)來(lái)后,通過我們產(chǎn)品的界面設(shè)計(jì)糾正錯(cuò)誤后,產(chǎn)品怎么接受這種反饋,實(shí)現(xiàn)自我演化。

第三,“使用人機(jī)交互”。用戶的反饋通過怎么樣的交互方式來(lái)體現(xiàn)?可以讓用戶先試用一段時(shí)間,基于這段時(shí)間出一個(gè)報(bào)表,在報(bào)表把系統(tǒng)處理的各項(xiàng)錯(cuò)誤羅列出來(lái),用戶通過離線方式進(jìn)行批量的修改確認(rèn),把修改的結(jié)果導(dǎo)入到系統(tǒng)中重新訓(xùn)練模型,這是一種人機(jī)交互。能否在線實(shí)時(shí)處理掉,也是一個(gè)非常重要的問題。有時(shí)產(chǎn)品認(rèn)為用戶通過人機(jī)交互方式進(jìn)行了反饋,也許因?yàn)楫a(chǎn)品功能設(shè)計(jì)得不夠友好,用戶誤點(diǎn)了。要區(qū)分哪些真正有價(jià)值的反饋,哪些是需要消除的噪音。

第四,“注重檢測(cè)錯(cuò)誤”。準(zhǔn)確率不是100%的情況下,線上系統(tǒng)的錯(cuò)誤處理和運(yùn)維是非常具有挑戰(zhàn)的。尤其是當(dāng)線上數(shù)據(jù)具備高度機(jī)密性的情況下,線上系統(tǒng)處理的數(shù)據(jù)不可能導(dǎo)出到測(cè)試環(huán)境中讓AI人員去研究復(fù)現(xiàn)時(shí),怎么辦?幻燈片25

理想的結(jié)果是交付一個(gè)AI產(chǎn)品,可以不斷的優(yōu)化、迭代,越來(lái)越聰明,成為一個(gè)動(dòng)態(tài)的AI系統(tǒng),而不是靜態(tài)的。

?

AI也重新定義了產(chǎn)品設(shè)計(jì)開發(fā)流程。幻燈片26

圖的上面跟機(jī)器學(xué)習(xí)算法相關(guān),識(shí)別問題、獲取數(shù)據(jù),進(jìn)行模型訓(xùn)練、模型管理。模型之間有不斷的版本迭代,我們要進(jìn)行模型的部署,上線以后模型要去適應(yīng)新數(shù)據(jù)的變化。

下面是站在開發(fā)角度,怎樣去進(jìn)行需求建模、架構(gòu)設(shè)計(jì)、軟件設(shè)計(jì)、怎樣對(duì)AI產(chǎn)品進(jìn)行開發(fā)測(cè)試、上線以后的維護(hù)。

當(dāng)系統(tǒng)上線后,用戶就是用來(lái)處理數(shù)據(jù)的,新的數(shù)據(jù)源源不斷,可能會(huì)出錯(cuò),系統(tǒng)會(huì)產(chǎn)生行為的異常,用戶看到錯(cuò)誤時(shí)會(huì)跟系統(tǒng)進(jìn)行人機(jī)交互,把自己的反饋提出來(lái)。

有時(shí)用戶有自己的專業(yè)知識(shí)、行業(yè)知識(shí),把自己的行業(yè)知識(shí)傳授給AI系統(tǒng),讓它更加聰明。除了自我演化外,也通過接收外部信息的方式增強(qiáng)自己的智能。如果把這種視角加進(jìn)來(lái),可以讓AI產(chǎn)品站在宏觀角度把握各環(huán)節(jié),從而指導(dǎo)我們?cè)O(shè)計(jì)出更好的產(chǎn)品。

?

那么達(dá)觀的合同智能審核系統(tǒng)是包含哪些功能組件來(lái)逐步達(dá)成目標(biāo)的?

右邊是我們的功能圖,大概有8項(xiàng)功能、34個(gè)子功能,左邊對(duì)功能進(jìn)行了2個(gè)大的分類,上面是做信息抽取、版本比對(duì)、風(fēng)險(xiǎn)審核、糾錯(cuò)、合同分類、合同知識(shí)的搜索和推薦。下面還有強(qiáng)化的機(jī)器學(xué)習(xí)平臺(tái)、模型自主訓(xùn)練。幻燈片27

AI產(chǎn)品這兩種不同類型的功能結(jié)合在一起,有了下面這部分,技術(shù)提供方或客戶IT團(tuán)隊(duì),可以借助這個(gè)平臺(tái)讓AI系統(tǒng)進(jìn)行動(dòng)態(tài)演化。幻燈片28

舉兩個(gè)例子展示怎樣通過產(chǎn)品進(jìn)行合同條款的抽取和進(jìn)行規(guī)則審核。

場(chǎng)景一是合同關(guān)鍵信息的抽取。

共分為5步,前2步是預(yù)先做好的。根據(jù)客戶已有的歷史合同數(shù)據(jù)去訓(xùn)練AI模型,讓AI模型識(shí)別不同類型的合同,就不同類型合同中的關(guān)鍵要素進(jìn)行自動(dòng)抽取,做好這2步后預(yù)置到產(chǎn)品平臺(tái)中去。

對(duì)使用者來(lái)說(shuō),是三步完成:上傳到合同文檔、機(jī)器進(jìn)行自動(dòng)關(guān)鍵詞提取、提取結(jié)果呈現(xiàn)。形成這樣一個(gè)關(guān)鍵信息抽取的報(bào)告,法務(wù)人員可以對(duì)報(bào)告一目了然。幻燈片29

場(chǎng)景二是合同風(fēng)險(xiǎn)進(jìn)行審核。

前兩步也是預(yù)置到產(chǎn)品中,針對(duì)各個(gè)不同的合同類型,根據(jù)業(yè)務(wù)方設(shè)計(jì)合同審核項(xiàng),對(duì)每個(gè)合同類型的風(fēng)險(xiǎn)點(diǎn)都配置好,機(jī)器模型可以自主的進(jìn)行學(xué)習(xí)和訓(xùn)練。

業(yè)務(wù)方上傳合同文檔,機(jī)器可以進(jìn)行自動(dòng)處理,并給出些建議。

審核結(jié)果中包含針對(duì)這個(gè)合同,有哪些是必改問題、有哪些是缺失條款、有哪些是建議優(yōu)化的,都可以滿足。幻燈片30

這是我們產(chǎn)品的全景圖,展示了AI的幾個(gè)不可缺失的關(guān)鍵要素,只有保證這幾個(gè)要素后,提供的產(chǎn)品時(shí)才能夠消除由AI算法帶來(lái)的不確定性。幻燈片31

客戶是不可能為不確定性買單的。如果交付了一個(gè)產(chǎn)品,客戶問準(zhǔn)確率是多少,答“看數(shù)據(jù)情況吧”,客戶又問系統(tǒng)上線使用時(shí)撞戶率有多高,答“這個(gè)我也不清楚,需要新的線上數(shù)據(jù)判斷”,任何一個(gè)客戶都不會(huì)為不確定性的回答買單。

最后一部分,如何進(jìn)行產(chǎn)品價(jià)值的評(píng)估。

如何進(jìn)行產(chǎn)品價(jià)值評(píng)估?

幻燈片32

針對(duì)上面的合同智能處理,我們了解到:

對(duì)不同的合同,原本通過人工閱讀的方式進(jìn)行審核,處理時(shí)間基本是在小時(shí)級(jí)。引入智能合同審閱平臺(tái)以后,整個(gè)過程從待審閱合同、智能合同審閱到人工復(fù)查,從小時(shí)級(jí)變成分鐘級(jí)。幻燈片33

從價(jià)值來(lái)說(shuō),一,提升效率、降低成本。二,降低風(fēng)險(xiǎn)。三,把長(zhǎng)期非結(jié)構(gòu)化文檔的管理問題很好的管理起來(lái)。

合同評(píng)估對(duì)于AI產(chǎn)品有兩個(gè)層面:

一,算法層面的評(píng)估。更多的是面向AI算法和研發(fā)人員,比如準(zhǔn)確率、召回率,F(xiàn)1值。幻燈片34

機(jī)器翻譯、智能客服、多輪對(duì)話、搜索、推薦、文本抽取等在算法層面都有不同的指標(biāo),對(duì)業(yè)務(wù)方很難講明白準(zhǔn)確率是多少,用戶很難把準(zhǔn)確率和它的業(yè)務(wù)價(jià)值映射起來(lái)。

評(píng)價(jià)的維度也非常多,取決于業(yè)務(wù)方怎么看待這個(gè)產(chǎn)品以及通過這個(gè)產(chǎn)品達(dá)到什么目標(biāo)。

有時(shí)客戶的期望是通過AI的產(chǎn)品提升人員的工作效率、降低出錯(cuò)。有的客戶使用AI的產(chǎn)品專注在創(chuàng)新。幻燈片35

不管做to C還是to B都是圍繞用戶進(jìn)行服務(wù)的,有一個(gè)經(jīng)典的模型叫“AARRR”:怎么獲取用戶、激活、留存、商業(yè)變現(xiàn)、用戶幫助評(píng)估。

在這個(gè)場(chǎng)景實(shí)現(xiàn)AI落地,針對(duì)這幾個(gè)不同的環(huán)節(jié),到底帶來(lái)哪些業(yè)務(wù)價(jià)值上的提升:是新的獲客數(shù)量增加了、轉(zhuǎn)化率提升了,還是某項(xiàng)產(chǎn)品的營(yíng)業(yè)額收入增加了。

一,節(jié)省人力。二,創(chuàng)造新價(jià)值。這是我們希望AI產(chǎn)品能夠達(dá)到的理想目標(biāo)。

以上是我想給大家分享的多年做AI產(chǎn)品設(shè)計(jì)和項(xiàng)目交付的經(jīng)驗(yàn),謝謝大家!

 

作者:賈學(xué)鋒 達(dá)觀數(shù)據(jù)副總裁

負(fù)責(zé)AI解決方案及產(chǎn)品設(shè)計(jì)。復(fù)旦大學(xué)計(jì)算機(jī)系碩士畢業(yè),擁有10+年研發(fā)及AI產(chǎn)品設(shè)計(jì)經(jīng)驗(yàn)。復(fù)旦畢業(yè)后工作于SAP中國(guó)研究院擔(dān)任Design&NewApplication部門的高級(jí)研發(fā)經(jīng)理,帶領(lǐng)數(shù)據(jù)創(chuàng)新團(tuán)隊(duì)圍繞多個(gè)行業(yè)構(gòu)建了多個(gè)新一代企業(yè)級(jí)智能產(chǎn)品。

后加入阿里巴巴,擔(dān)任大數(shù)據(jù)創(chuàng)新產(chǎn)品負(fù)責(zé)人,參與“移動(dòng)互聯(lián)網(wǎng)+零售”新商業(yè)模式,基于阿里的海量數(shù)據(jù)構(gòu)建面向?qū)嶓w商業(yè)的營(yíng)銷平臺(tái)。

在加入達(dá)觀前,在萬(wàn)達(dá)網(wǎng)絡(luò)科技集團(tuán)擔(dān)任高級(jí)管理職務(wù)負(fù)責(zé)集團(tuán)資源的商業(yè)化,管理商業(yè)化產(chǎn)品和技術(shù)團(tuán)隊(duì),以消費(fèi)者為核心,利用數(shù)據(jù)和人工智能技術(shù)實(shí)現(xiàn)全場(chǎng)景營(yíng)銷平臺(tái)。