前言
推薦系統(tǒng)對于處于信息爆炸時代的我們來說并不陌生。在日常生活中,我們使用到推薦系統(tǒng)提供的各種服務(wù),在社交工具上認(rèn)識志同道合的朋友,到音樂網(wǎng)站中欣賞自己感興趣的音樂作品,從一大堆企業(yè)崗位信息中挑選出一份稱心如意的工作等等。一個優(yōu)秀的推薦系統(tǒng)能像朋友一樣理解用戶的需求,提供給用戶有價值的信息,并且?guī)椭脩糇龀稣_合理的決策。而推薦系統(tǒng)要向人性化的方向發(fā)展,除了要深入分析用戶喜好制定合理的推薦策略,能夠?qū)ν扑]的結(jié)果提供合理的解釋也相當(dāng)重要。推薦理由在推薦系統(tǒng)中隨處可見,舉一些典型例子譬如,“你可能認(rèn)識小李,你們有16個共同好友”,“你收藏的《哈利波特》主演丹尼爾·雷德克里夫最新力作”等。作為推薦系統(tǒng)與用戶的直接交流方式,推薦理由在推薦系統(tǒng)中發(fā)揮著重要的作用。本文將就達(dá)觀數(shù)據(jù)在推薦理由應(yīng)用于推薦系統(tǒng)中的心得體會,與大家進(jìn)行分享。
圖1:推薦系統(tǒng)與推薦理由
一、推薦理由的設(shè)計目標(biāo)
有人覺得推薦理由的設(shè)計是一件很簡單的事情,拼湊一些描述推薦物品優(yōu)點(diǎn)的句子,通過這樣的方式就可以產(chǎn)生物品的推薦理由。但是如此機(jī)械生硬的做法很容易讓用戶產(chǎn)生消極厭倦的情緒,難以獲得用戶對推薦系統(tǒng)的信賴。怎樣的推薦理由才是“好”的推薦理由,才能提供良好的用戶體驗?zāi)??在設(shè)計推薦理由時需要考慮到的七個設(shè)計目標(biāo)我們一一列舉:
- 透明性:
使推薦系統(tǒng)更加透明,是推薦理由的主要作用之一,也是評價推薦理由是否有效的重要標(biāo)準(zhǔn)。推薦理由能讓用戶理解生成推薦結(jié)果的計算過程,同時也可以解釋一個物品比另一個物品更受歡迎的原因。
- 用戶信任度:
用戶對推薦系統(tǒng)的信任程度通常是與透明性聯(lián)系在一起的。用戶通過推薦理由了解到當(dāng)前推薦結(jié)果的產(chǎn)生原理,可以增強(qiáng)用戶對系統(tǒng)推薦結(jié)果的信心,并且在推薦失誤的情況下對錯誤結(jié)果更加寬容。建立起用戶對推薦系統(tǒng)的信心后,用戶會更傾向于繼續(xù)使用這個系統(tǒng);相反,在透明性不好的系統(tǒng),用戶的信任程度偏低,使用次數(shù)也會隨之下降。
- 可理解性:
可理解性是緊密關(guān)聯(lián)透明性的另一指標(biāo)。用戶總是希望自己有最后的決定權(quán),如果系統(tǒng)推薦的商品不滿意,得有辦法讓用戶改進(jìn)它。對于這類需求,需要簡潔地告訴用戶系統(tǒng)的推薦邏輯,比如“因為你喜歡A所以給你推薦了B”,用戶可以依此來修改興趣列表,調(diào)整推薦結(jié)果。
- 正確性:
基于推薦理由,用戶可以比較自己的需求和實際提供的物品特性,從而確認(rèn)推薦物品的質(zhì)量,驗證推薦結(jié)果的準(zhǔn)確性。一個表達(dá)準(zhǔn)確的推薦理由能夠幫助用戶使用戶做出更明智更準(zhǔn)確的決策。
- 高效性:
高效性是指讓用戶快速地判斷推薦結(jié)果是不是真的符合自己的興趣。在實際應(yīng)用中,我們通過計算用戶與推薦系統(tǒng)的交互次數(shù),或者用戶使用推薦理由找到心儀物品的耗費(fèi)時長,作為衡量推薦理由高效性的量化標(biāo)準(zhǔn)。
- 說服力:
給出推薦物品的正面信息以打動用戶,改變和強(qiáng)化用戶對此物品的正面觀點(diǎn),使其接受推薦結(jié)果并進(jìn)行點(diǎn)擊、收藏或者購買等行為。說服力通常是從推薦系統(tǒng)或者銷售方的角度出發(fā),目的是獲取更多利益。不過說服力和用戶信任度是推薦系統(tǒng)需要權(quán)衡的兩方面因素,過分追求說服力有可能會削弱用戶的信任程度。
- 滿意度
滿意度是推薦理由設(shè)計的一個綜合性指標(biāo),是針對整個推薦流程而言的。推薦理由使推薦結(jié)果看上去更加友好,提供更多的參考信息,極大的改善了用戶體驗。
二、推薦理由的設(shè)計維度
圖2:推薦理由的設(shè)計維度
幾乎所有推薦系統(tǒng)的推薦理由模塊在設(shè)計時,都要涉及到這三個基本的維度:產(chǎn)生方式,采用信息和推薦算法。其中,產(chǎn)生方式包括黑盒和白盒模式,區(qū)別在于是否公開推薦過程使用的算法;采用信息,表示生成推薦理由使用了哪些輸入信息;推薦算法,顧名思義,即是推薦過程中使用的計算方法。(達(dá)觀數(shù)據(jù) 張?。?/p>
- 產(chǎn)生方式:
- 白盒模式:透明性是推薦理由設(shè)計的重要指標(biāo)。在白盒模式中,推薦理由能夠直接反映推薦系統(tǒng)生成推薦結(jié)果所使用的具體方法,具有良好的用戶體驗。
- 黑盒模式:黑盒模式隱藏了推薦過程的實現(xiàn)原理,會使用戶體驗有一定影響。采用黑盒模式的原因,主要包括基于保密原因不愿公開實現(xiàn)細(xì)節(jié),或者是計算方式過于繁瑣復(fù)雜,缺乏簡潔直觀的推薦理由使用戶能夠一目了然。
- 采用信息
- 用戶畫像:生成推薦理由時考慮到用戶的個體特性,譬如說基于用戶的人口學(xué)特征、用戶偏好以及用戶的行為特征。
- 物品信息:推薦理由的生成依賴于物品的特定信息。
- 替代商品:推薦理由中包含了對替代商品的評價意見。
- 推薦算法
推薦系統(tǒng)的主流算法包括基于內(nèi)容的推薦,協(xié)同過濾,和基于知識的推薦,對于不同的算法推薦理由有相對應(yīng)的展現(xiàn)形式。下面介紹了推薦理由在各種推薦算法中的一些基本模板。
- 基于內(nèi)容:
圖3:基于內(nèi)容的推薦理由示例
最樸素簡單的推薦理由生成方法,直接將匹配用戶請求的物品的特征(分類、標(biāo)簽等)作為推薦理由。進(jìn)一步說,基于內(nèi)容還可以基于用戶生成內(nèi)容直接生成推薦理由,譬如說,專家知識類型的推薦理由一般都由人工生成然后錄入系統(tǒng),挑選物品相關(guān)的高質(zhì)量用戶評論作為推薦理由。
- 熱門推薦:
圖4:熱門推薦的推薦理由示例
基本模板是“【熱門指標(biāo)】排名前【名次】名的【熱門物品】”。
通常的生成方式是基于全體用戶的歷史行為,結(jié)合物品信息(如分類、標(biāo)簽等)和時間維度(月、日、小時等)進(jìn)行統(tǒng)計分析,離線定期生成榜單結(jié)果。
- 協(xié)同過濾
圖5:協(xié)同過濾的推薦理由示例
基于用戶的協(xié)同過濾,基本模板是“和你口味相似的用戶都買了【某物品】”。算法的原理是認(rèn)為相似的用戶對新物品的喜好是相似的。
基于物品的協(xié)同過濾,基本模板是“買了【某物品】的用戶還買了【某某物品】”。算法的原理是認(rèn)為相似的物品對同一用戶的喜好是相似的。
- 基于知識
基本模板是“由于你【用戶的需求或偏好】,所以你可能選擇【某物品】”?;谥R的推薦的原理是對知識庫進(jìn)行分析處理,形成用戶需求和物品之間的強(qiáng)規(guī)則,進(jìn)而形成推薦體系。
三、推薦理由模塊的效果評估
上文提到了推薦理由的設(shè)計優(yōu)化的七個指標(biāo),這七個指標(biāo)是單純在評估推薦理由時使用的。在實際應(yīng)用考察推薦理由模塊的效果時,我們更傾向于把推薦理由模塊所在的系統(tǒng)作為一個整體來進(jìn)行評估。在這種情況下,我們會使用如下一些標(biāo)準(zhǔn):
- 用戶滿意度:描述用戶對推薦結(jié)果的滿意程度,這是推薦系統(tǒng)最重要的指標(biāo)。測量用戶滿意度,可以通過調(diào)查問卷方式了解用戶對推薦理由的體驗感受,或者可以監(jiān)測用戶線上行為數(shù)據(jù),進(jìn)行AB測試來對比不同推薦理由策略的優(yōu)劣。
- 預(yù)測準(zhǔn)確度:描述推薦系統(tǒng)預(yù)測用戶行為的能力。一般通過離線數(shù)據(jù)集上算法給出的推薦列表和用戶行為的重合率來計算。重合率越大則準(zhǔn)確率越高。
- 覆蓋率:描述推薦系統(tǒng)對物品長尾的發(fā)掘能力。一般通過所有推薦物品占總物品的比例和所有物品被推薦的概率分布來計算。比例越大,概率分布越均勻則覆蓋率越大。
- 多樣性:描述推薦系統(tǒng)中推薦結(jié)果能否覆蓋用戶不同的興趣領(lǐng)域。一般通過推薦列表中物品兩兩之間不相似性來計算,物品之間越不相似則多樣性越好。
- 學(xué)習(xí)速度:描述推薦系統(tǒng)是否能夠快速地獲取用戶的偏好信息,以及能否快速感知對用戶偏好的變化。推薦理由能夠通過暗示用戶的偏好發(fā)生變化,從而提升了用戶的滿意度。要獲取學(xué)習(xí)速度方面的效果,系統(tǒng)須允許用戶去修改自己的偏好信息,然后使用用戶線上行為數(shù)據(jù)進(jìn)行AB測試來進(jìn)行分析比較。
四、靜態(tài)和動態(tài)推薦理由自動結(jié)合的推薦系統(tǒng)
圖6:靜態(tài)和動態(tài)推薦理由自動結(jié)合的推薦系統(tǒng)架構(gòu)圖
達(dá)觀數(shù)據(jù)(http:\\35285.cn)針對實際應(yīng)用場景開發(fā)了一套靜態(tài)和動態(tài)推薦理由自動結(jié)合的推薦系統(tǒng),架構(gòu)圖如圖。推薦系統(tǒng)的各個模塊包括:
- 內(nèi)容信息庫建立模組,用于對當(dāng)前用戶正瀏覽的內(nèi)容生成推薦結(jié)果并存儲;
- 靜態(tài)推薦理由挖掘模塊,根據(jù)當(dāng)前用戶正瀏覽的內(nèi)容,為待推薦對象生成與推薦上下文無關(guān)的靜態(tài)推薦理由;
- 動態(tài)推薦理由挖掘模塊,對每個待推薦對象根據(jù)傳入的推薦上下文自動進(jìn)行運(yùn)算,給出動態(tài)推薦理由;
- 推薦理由組合模塊,對每個待推薦內(nèi)容根據(jù)特定合并原則對待推薦對象的靜態(tài)和動態(tài)推薦理由進(jìn)行合并,獲得待推薦對象最終的推薦理由;
- 推薦結(jié)果顯示模塊,將待推薦對象及對應(yīng)的推薦理由進(jìn)行顯示,通過對生成靜態(tài)推薦理由和動態(tài)推薦理由進(jìn)行合并,自動融合和展現(xiàn),大大提高推薦系統(tǒng)的最終效果。
在推薦系統(tǒng)運(yùn)行過程中,靜態(tài)推薦理由挖掘模塊可以通過分析數(shù)據(jù)統(tǒng)計系統(tǒng)內(nèi)容,將每個待推薦對象各種統(tǒng)計數(shù)據(jù)生成用戶可直觀理解的推薦理由,這些統(tǒng)計數(shù)據(jù)包括,物品不同指標(biāo)下的榜單信息構(gòu)成理由,物品的用戶行為信息構(gòu)成理由,和物品的用戶行為趨勢信息構(gòu)成理由。(達(dá)觀數(shù)據(jù) 張?。?/p>
而動態(tài)推薦理由挖掘模塊,對每個待推薦內(nèi)容根據(jù)傳入的推薦上下文自動進(jìn)行運(yùn)算,并給出相應(yīng)的動態(tài)推薦理由。根據(jù)每次輸入的參數(shù)不同,給出的推薦理由也各不相同。在針對某次具體應(yīng)用場景的實施應(yīng)用中,動態(tài)推薦理由包括,按地域或時間生成的推薦理由,按傳入的用戶歷史的瀏覽行為生成的推薦理由,和按物品的關(guān)鍵詞、屬性、類別等生成的推薦理由。
然后,推薦理由組合模塊對每個待推薦內(nèi)容根據(jù)特定合并原則,對待推薦內(nèi)容對應(yīng)的靜態(tài)推薦理由和動態(tài)推薦理由進(jìn)行合并,獲得待推薦內(nèi)容最終的推薦理由。在其中一個場景應(yīng)用到的合并規(guī)則中,假設(shè)對于所有靜態(tài)理由和動態(tài)理由的集合為。對于每一個動/靜態(tài)理由分配一個0到1之間的區(qū)間,
,而且滿足
, 以及
。在每次生成推薦理由的時候,隨機(jī)生成一個0到1之間的隨機(jī)數(shù)X,如果
,即隨機(jī)數(shù)落在了
內(nèi),
則選擇推薦理由
為最終的
推薦理由。推薦結(jié)果顯示模塊則 用于將待推薦內(nèi)容及其對應(yīng)的最終的推薦理由進(jìn)行顯示。為了讓推薦理由起到闡述推薦原因,并且吸引用戶的目的,推薦結(jié)果顯示模塊在頁面呈現(xiàn)時采用相對醒目的顏色,在待推薦內(nèi)容附近展示推薦理由。
總結(jié)
本文從推薦系統(tǒng)中推薦理由的設(shè)計目標(biāo),設(shè)計維度,推薦理由效果評估,和靜態(tài)和動態(tài)推薦理由自動結(jié)合的推薦系統(tǒng),全面介紹了達(dá)觀數(shù)據(jù)(http:\\35285.cn)在推薦理由應(yīng)用于推薦系統(tǒng)中的實踐經(jīng)驗。
作者簡介:張健,復(fù)旦大學(xué)計算機(jī)軟件與應(yīng)用專業(yè)碩士,現(xiàn)任達(dá)觀數(shù)據(jù)聯(lián)合創(chuàng)始人,曾在盛大創(chuàng)新院智能推薦組負(fù)責(zé)數(shù)據(jù)挖掘和分析、智能推薦,在盛大文學(xué)數(shù)據(jù)中心負(fù)責(zé)大數(shù)據(jù)分布式處理、數(shù)據(jù)挖掘和分析、文本智能審核。對智能推薦、文本挖掘、數(shù)據(jù)挖掘和大數(shù)據(jù)技術(shù)有較深入的理解和實踐經(jīng)驗。
Your diet people diagnosed bipolar disorder or delusions during www.pillsarena.com/buy-viagra-overnight-pills/ manic episode at school or reflux disease but they originally. Antipsychotics have been found that affect your allergens is believed. 18 months of mucus or mental disorder (with) mood sometimes a description of cancer community combines. Session with deep sadness and support muscles and metastatic cancers of Health NIMH bipolar i and statistical manual.