什么是推薦系統(tǒng)
推薦系統(tǒng)是計(jì)算機(jī)軟件工程的一個(gè)子領(lǐng)域,通過大數(shù)據(jù)、機(jī)器學(xué)習(xí)等技術(shù),在用戶使用產(chǎn)品的過程中,學(xué)習(xí)用戶的興趣偏好,主動(dòng)展示他可能喜歡的“物品”(這里的物品是指待推薦的東西,可以是商品、電影、視頻、文章、音樂、美食、景點(diǎn)、理財(cái)產(chǎn)品甚至是人,后面都用物品指代,不再說明),從而促成“消費(fèi)”,節(jié)省用戶時(shí)間,提升用戶體驗(yàn),優(yōu)化資源配置,最終為服務(wù)提供方、物品提供方創(chuàng)造商業(yè)價(jià)值。
上述定義有幾點(diǎn)需要說明,以便大家更好地理解推薦系統(tǒng)的特性與本質(zhì)。
- 推薦系統(tǒng)是一種軟件工程解決方案,通過代碼實(shí)現(xiàn)推薦能力,將為用戶推薦物品這一流程做到完全自動(dòng)化。
- 推薦系統(tǒng)是機(jī)器學(xué)習(xí)的一種應(yīng)用,通過學(xué)習(xí)用戶的行為數(shù)據(jù),構(gòu)建數(shù)學(xué)模型,預(yù)測(cè)用戶的興趣,最終為用戶推送其可能喜歡的物品,滿足用戶被動(dòng)的需求,提升用戶體驗(yàn)。
- 推薦系統(tǒng)是一項(xiàng)交互式產(chǎn)品功能,產(chǎn)品為推薦系統(tǒng)提供載體,用戶在使用產(chǎn)品的過程中觸發(fā)推薦系統(tǒng),推薦系統(tǒng)為用戶提供個(gè)性化的推薦。作為一個(gè)產(chǎn)品,物品怎么展示、如何與用戶交互、交互過程中可能遇到什么問題,這些都要考慮。
- 推薦系統(tǒng)是一項(xiàng)人機(jī)協(xié)同的(軟件)服務(wù),通過推薦系統(tǒng),用戶可以獲得符合自身興趣的物品推薦,滿足其個(gè)性化的、被動(dòng)的需求。任何服務(wù)都需要運(yùn)營(yíng),在服務(wù)過程中,服務(wù)的宣導(dǎo)、問題的解決等都需要借助人力。
- 推薦系統(tǒng)是一種過濾信息、匹配資源的手段,通過機(jī)器學(xué)習(xí)算法和軟件工程,推薦系統(tǒng)從海量信息中為用戶進(jìn)行篩選和過濾。
- 推薦系統(tǒng)最終的目標(biāo)是提升用戶體驗(yàn),為服務(wù)提供方和物品提供方創(chuàng)造商業(yè)價(jià)值。
從上面的說明可知,推薦系統(tǒng)是一個(gè)偏業(yè)務(wù)的交叉學(xué)科,需要綜合利用軟件工程、機(jī)器學(xué)習(xí)、產(chǎn)品設(shè)計(jì)、運(yùn)營(yíng)、大數(shù)據(jù)等跨學(xué)科的知識(shí),才可以構(gòu)建出滿足用戶需求、有商業(yè)價(jià)值的推薦系統(tǒng)。
推薦系統(tǒng)解決了哪些問題
推薦系統(tǒng)是互聯(lián)網(wǎng)(特別是移動(dòng)互聯(lián)網(wǎng))快速發(fā)展的產(chǎn)物。它本質(zhì)上是一種從海量信息中為用戶檢索其感興趣的信息的技術(shù)手段。推薦系統(tǒng)結(jié)合用戶信息(地域、年齡、性別等)、物品信息(名稱、價(jià)格、產(chǎn)地等)以及用戶行為(瀏覽、購(gòu)買、點(diǎn)擊、播放等),利用機(jī)器學(xué)習(xí)技術(shù)構(gòu)建用戶興趣模型,利用軟件工程技術(shù)實(shí)現(xiàn)軟件服務(wù),為用戶提供精準(zhǔn)的個(gè)性化推薦。
推薦系統(tǒng)能夠很好地滿足物品提供方、平臺(tái)方、用戶三方的需求。拿淘寶購(gòu)物舉例,物品提供方是成千上萬(wàn)的網(wǎng)店,平臺(tái)方是淘寶,用戶是在淘寶上購(gòu)物的自然人或企業(yè)。推薦系統(tǒng)可以更好地將物品曝光給有需要的用戶,提升用戶和物品的匹配效率。
從本質(zhì)上講,推薦系統(tǒng)解決的是資源配置問題。通過軟件、算法、工程手段,將供給端(物品提供方)和需求端(用戶)通過平臺(tái)(提供個(gè)性化推薦的產(chǎn)品,如淘寶)進(jìn)行匹配。推薦系統(tǒng)的目標(biāo)是提升資源的配置效率。
推薦系統(tǒng)的應(yīng)用領(lǐng)域
對(duì)于一款互聯(lián)網(wǎng)產(chǎn)品來說,只要平臺(tái)上存在“大量供用戶消費(fèi)的物品”,推薦系統(tǒng)就有用武之地。具體來說,推薦系統(tǒng)的應(yīng)用領(lǐng)域主要有如下幾類。
- 電商:淘寶、京東、亞馬遜等。
- 視頻:B 站、愛奇藝、抖音、快手等。
- 音樂:網(wǎng)易云音樂、酷狗音樂、QQ 音樂等。
- 資訊:微信公眾號(hào)、今日頭條、網(wǎng)易新聞等。
- 生活服務(wù):美團(tuán)、攜程、脈脈等。
可以說,只要是 to C 的互聯(lián)網(wǎng)產(chǎn)品,都能看到推薦系統(tǒng)的身影。隨著技術(shù)的發(fā)展、生活方式的改變,推薦系統(tǒng)更多的應(yīng)用場(chǎng)景正在不斷被挖掘和創(chuàng)造,比如無人駕駛汽車上的推薦、VR 設(shè)備上的推薦、線上線下融合推薦、跨品類的商品和服務(wù)推薦等。
常用的推薦算法
推薦系統(tǒng)大量使用機(jī)器學(xué)習(xí)技術(shù),機(jī)器學(xué)習(xí)技術(shù)是推薦系統(tǒng)中最核心的部分。推薦系統(tǒng)的常用算法,主要分為兩類:基于內(nèi)容的推薦算法和協(xié)同過濾算法。
- 基于內(nèi)容的推薦算法
推薦系統(tǒng)通過技術(shù)手段將物品與人關(guān)聯(lián)起來。物品自身包含很多屬性,這些屬性可以作為用戶偏好的標(biāo)簽。通過記錄用戶與物品的交互行為,我們可以挖掘出代表用戶對(duì)物品的偏好的標(biāo)簽,利用這些偏好標(biāo)簽為用戶進(jìn)行推薦,就是基于內(nèi)容的推薦算法。拿商品推薦來說,商品有品牌、品類、價(jià)格、產(chǎn)地等屬性,推薦系統(tǒng)可以根據(jù)用戶以前的購(gòu)買行為獲得他對(duì)商品品牌、品類、價(jià)格、產(chǎn)地等屬性的偏好,從而為他推薦可能感興趣的商品。比如用戶購(gòu)買過 iPhone 手機(jī),我們就可以根據(jù)這一行為挖掘出用戶對(duì)“蘋果”這個(gè)標(biāo)簽感興趣,進(jìn)而為用戶推薦蘋果電腦、蘋果手機(jī)殼、蘋果電源線等商品,如圖 1 所示。
圖1:基于內(nèi)容的推薦算法
- 協(xié)同過濾算法
通過記錄用戶在互聯(lián)網(wǎng)產(chǎn)品上的交互行為,可以利用“物以類聚,人以群分”的樸素思想來為用戶提供個(gè)性化推薦。具體來說,“物以類聚”是指如果有很多用戶對(duì)某兩個(gè)物品有相似的偏好,說明這兩個(gè)物品是“相似”的,我們可以給用戶推薦與其喜歡的物品“相似”的物品,這就是基于物品的(item-based)協(xié)同過濾算法?!叭艘匀悍帧本褪钦业脚c目標(biāo)用戶興趣相同的用戶(有過類似的行為),將他們?yōu)g覽過的內(nèi)容推薦給目標(biāo)用戶,這就是基于用戶的(user-based)協(xié)同過濾算法。如圖?2 展示了這兩類算法。
圖2:協(xié)同過濾算法
這里提到的協(xié)同過濾算法是最古老、最簡(jiǎn)單的協(xié)同過濾算法。我們熟知的基于社交關(guān)系的推薦其實(shí)也是一種協(xié)同過濾,比如微信公眾號(hào)將朋友點(diǎn)過“在看”的內(nèi)容推薦給你,如圖 3 所示。
圖3:基于社交關(guān)系的協(xié)同過濾推薦
這里提到的協(xié)同過濾是比較寬泛的概念,不局限于 user-based、item-based。只要利用群體行為構(gòu)建推薦算法模型,就屬于協(xié)同過濾的范疇。協(xié)同過濾的概念類似于生物學(xué)中的協(xié)同進(jìn)化,通過個(gè)體之間直接或者間接的相互作用,挖掘出個(gè)體之間隱含的聯(lián)系,由此推薦系統(tǒng)會(huì)越來越懂用戶的興趣偏好?;趦?nèi)容的推薦算法和協(xié)同過濾算法的差異。二者最本質(zhì)的區(qū)別是:基于內(nèi)容的推薦算法只使用用戶自身的行為信息(與別的用戶無關(guān))為其進(jìn)行推薦,而協(xié)同過濾需要利用群體的行為來為某個(gè)用戶進(jìn)行推薦(“協(xié)同”代表的是群體智慧)。在真實(shí)的推薦場(chǎng)景中,多種算法往往會(huì)混合使用,比如混合多種基于內(nèi)容的推薦算法,混合多種協(xié)同過濾算法,甚至將基于內(nèi)容的推薦算法和協(xié)同過濾算法混合。
另外,在商業(yè)應(yīng)用中,推薦算法一般包括召回和排序,召回是初篩的過程(利用多種策略、算法將用戶可能喜歡的物品篩選出來),排序是精準(zhǔn)打分的過程(構(gòu)建打分模型,將初選的、用戶可能感興趣的物品按照用戶興趣分?jǐn)?shù)降序排列),后續(xù)會(huì)詳細(xì)介紹。
如何學(xué)習(xí)推薦系統(tǒng)
《推薦系統(tǒng):算法、案例與大模型》
劉強(qiáng) | 著
為了解決推薦系統(tǒng)學(xué)習(xí)問題,這本書深入算法工程本質(zhì),手把手實(shí)操項(xiàng)目代碼。內(nèi)容源自達(dá)觀數(shù)據(jù)真實(shí)行業(yè)案例,為讀者呈現(xiàn) B 端高頻規(guī)則和策略。大模型時(shí)代下的推薦系統(tǒng)如何發(fā)展,推薦系統(tǒng)未來的發(fā)展趨勢(shì)本書都有說明。
本書學(xué)習(xí)路線
全書共 8 篇 24 章,從不同角度介紹了推薦系統(tǒng)構(gòu)建的理論、方法、策略、案例,圍繞推薦系統(tǒng)在企業(yè)(特別是 B 端行業(yè))中的應(yīng)用與實(shí)踐展開敘述。
第一部分,詳解推薦系統(tǒng)基礎(chǔ),清晰、全面的推薦基礎(chǔ)知識(shí)。第二部分,詳解推薦系統(tǒng)核心算法。
第三部分,工程實(shí)踐與代碼實(shí)戰(zhàn)。
第四部分,行業(yè)案例通過真實(shí)行業(yè)案例,呈現(xiàn) B 端高頻規(guī)則和策略。
最后一部分,ChatGPT、大模型與推薦系統(tǒng)篇,通過洞悉未來趨勢(shì),了解大模型時(shí)代下的推薦系統(tǒng)。
作者簡(jiǎn)介
達(dá)觀數(shù)據(jù)高級(jí)技術(shù)顧問劉強(qiáng),2009 年畢業(yè)于中國(guó)科學(xué)技術(shù)大學(xué),有 15 年大數(shù)據(jù)與 AI 相關(guān)實(shí)踐經(jīng)驗(yàn)。出版過暢銷書《構(gòu)建企業(yè)級(jí)推薦系統(tǒng)》,翻譯過《AI 革命》《認(rèn)識(shí) AI》《MongoDB性能調(diào)優(yōu)實(shí)戰(zhàn)》等優(yōu)秀作品,與達(dá)觀數(shù)據(jù)一同推動(dòng)推薦系統(tǒng)及大模型技術(shù)在行業(yè)的落地。
達(dá)觀數(shù)據(jù)智能推薦部也一同參與撰寫該書行業(yè)案例部分,所開發(fā)的智能推薦平臺(tái)采用業(yè)內(nèi)首創(chuàng)的“召回+排序+后處理+兜底”四段式推薦流程,提供了數(shù)百種內(nèi)置的召回策略、排序策略、推薦方案,同時(shí)支持策略、方案的自定義,滿足企業(yè)根據(jù)業(yè)務(wù)場(chǎng)景和規(guī)則自主配置推薦策略的需求,讓企業(yè)最大化實(shí)現(xiàn)自主可控的配置。實(shí)施案例豐富,廣泛服務(wù)于零售、金融、傳媒、政企、互聯(lián)網(wǎng)等行業(yè)的上千個(gè)客戶,在各行各業(yè)都有豐富的積累和實(shí)踐經(jīng)驗(yàn)。
大咖推薦
達(dá)觀數(shù)據(jù)持續(xù)鉆研推薦系統(tǒng)技術(shù),并為眾多企業(yè)成功部署了智能推薦系統(tǒng),大幅提升了企業(yè)的運(yùn)營(yíng)效果和用戶體驗(yàn),積累了很多實(shí)戰(zhàn)經(jīng)驗(yàn)。我很高興能向大家推薦這本著作,期望讀者能借此掌握企業(yè)級(jí)推薦系統(tǒng)的技術(shù)精髓,洞察推薦技術(shù)的未來演進(jìn)方向。
——陳運(yùn)文,達(dá)觀數(shù)據(jù)董事長(zhǎng),國(guó)家“萬(wàn)人計(jì)劃”專家
本書針對(duì)企業(yè)環(huán)境下的推薦系統(tǒng)技術(shù)與應(yīng)用展開了系統(tǒng)介紹,同時(shí)討論了 ChatGPT 等生成式大語(yǔ)言模型在企業(yè)推薦系統(tǒng)中的應(yīng)用,內(nèi)容豐富、案例翔實(shí),是有志于從事企業(yè)推薦系統(tǒng)建設(shè)的人員不可或缺的參考書。
——肖仰華,復(fù)旦大學(xué)教授,上海市數(shù)據(jù)科學(xué)重點(diǎn)實(shí)驗(yàn)室主任
本書圍繞推薦算法的工業(yè)化實(shí)踐展開深入討論,融入了作者多年的實(shí)踐經(jīng)驗(yàn)。作者結(jié)合真實(shí)應(yīng)用需求給出了算法設(shè)計(jì)與代碼實(shí)現(xiàn),推薦相關(guān)從業(yè)者閱讀。
——趙鑫,中國(guó)人民大學(xué)教授、博士生導(dǎo)師
本書以清晰而生動(dòng)的方式,介紹了推薦系統(tǒng)的基本概念、算法,以及與大模型結(jié)合的前沿應(yīng)用。無論你是從事學(xué)術(shù)研究,還是致力于工業(yè)實(shí)踐,本書都會(huì)為你提供寶貴的知識(shí)和實(shí)用的技巧。
——胡亮,同濟(jì)大學(xué)教授,國(guó)家基金委優(yōu)秀青年
本書包含對(duì)企業(yè)推薦系統(tǒng)全面翔實(shí)的技術(shù)講解、典型應(yīng)用案例和大模型前沿趨勢(shì)展望,特別是對(duì)未來技術(shù)的企業(yè)責(zé)任與人文關(guān)懷的思考,令人印象深刻。不管你是推薦系統(tǒng)從業(yè)者,還是運(yùn)營(yíng)管理者,抑或技術(shù)研究者,這都是一本探討推薦系統(tǒng)全面實(shí)戰(zhàn)的 SOT A 好書。
——盧暾,復(fù)旦大學(xué)教授、社會(huì)計(jì)算研究中心主任
本書從算法原理、工程實(shí)踐等方面系統(tǒng)剖析了推薦系統(tǒng)的技術(shù)與應(yīng)用,其行業(yè)應(yīng)用成功經(jīng)驗(yàn)極具參考價(jià)值,內(nèi)容翔實(shí),干貨滿滿,值得推薦。
——段雪濤,百度主任架構(gòu)師、Feed??架構(gòu)負(fù)責(zé)人
本書出于實(shí)踐,用于實(shí)戰(zhàn),內(nèi)容翔實(shí),案例豐富,貼合時(shí)代,符合實(shí)際,是一本值得精讀的推薦算法寶典。
——石霖,中國(guó)信息通信研究院人工智能中心智能安全部主任
本書不僅全面介紹了推薦技術(shù)的方方面面,而且包含很多行業(yè)的企業(yè)應(yīng)用案例,還有大模型在推薦系統(tǒng)中的應(yīng)用探索與思考,是一本兼具全面性、實(shí)戰(zhàn)性和前沿性的好書。
——陳華清,美團(tuán)機(jī)器學(xué)習(xí)專家
本書不同于市面上現(xiàn)有的推薦系統(tǒng)專題圖書,對(duì)經(jīng)典推薦問題的講解簡(jiǎn)潔,且有實(shí)際案例,尤其增加了現(xiàn)今最火熱的大模型與推薦系統(tǒng)結(jié)合的內(nèi)容,可見這個(gè)有二十多年企業(yè)實(shí)踐應(yīng)用歷史的話題,也正在煥發(fā)新的生命力。
——陳開江,貝殼網(wǎng)事業(yè)線產(chǎn)品技術(shù)中心負(fù)責(zé)人