達觀資訊推薦系統(tǒng)助力打造更懂用戶的新聞客戶端

互聯(lián)網(wǎng)環(huán)境下信息數(shù)量急速上升,資訊的更新極其頻繁,幾乎每時每刻都在產(chǎn)生資訊,但用戶的信息容量有限,使得大部分有價值的信息無法抵達用戶,從而造成信息過載;另一方面,如此種類繁多、數(shù)量龐大的新聞,大部分是冷門新聞,沒有曝光的機會,導(dǎo)致出現(xiàn)物品的“長尾問題”。
據(jù)統(tǒng)計,2020年中國手機新聞客戶端用戶規(guī)模達7.11億,如何打造一款主流的新聞客戶端,解決信息過載和長尾問題是關(guān)鍵。個性化推薦技術(shù)在解決這兩個問題中起著極其關(guān)鍵的作用。新聞資訊中的個性化推薦是根據(jù)用戶的歷史行為數(shù)據(jù)進行興趣點深度挖掘,從大量的新聞資訊中找出用戶最感興趣的進行推薦,從而不僅滿足了用戶本質(zhì)的信息訴求,改善了用戶體驗,且大量的新聞資訊也有了曝光的機會,有了適合的受眾群體,避免了資源浪費。
除了個性化推薦,相關(guān)推薦和熱門推薦也被廣泛應(yīng)用到新聞客戶端中,本文將對其將對這些推薦類型做詳細介紹。

資訊推薦可分為三大類,首先是資訊的個性化推薦,一般在app的首頁,根據(jù)不同用戶的喜好,為其提供“千人千面”的個性化內(nèi)容;
其次是熱門資訊推薦,結(jié)合海量用戶的行為數(shù)據(jù),計算當前熱門資訊內(nèi)容榜單;以及資訊詳情頁下方的相關(guān)推薦,通過內(nèi)容側(cè)和用戶側(cè)兩個維度計算資訊相似度進行推薦;
除此之外,在三大類型的推薦技術(shù)基礎(chǔ)上,可結(jié)合地域信息,為用戶推薦當?shù)氐馁Y訊。

資訊的個性化推薦一般有多個維度的召回策略,包括但不限于:
第一,通過協(xié)同過濾、UCB等推薦算法的召回策略;
第二,基于內(nèi)容的召回:利用達觀自研的NLP技術(shù),對資訊內(nèi)容中的標題、內(nèi)容等文本信息進行分析,通過標題、標簽相似進行召回;
第三,基于行為的召回:根據(jù)用戶的點擊、點贊、收藏、評論、深度閱讀等行為分析用戶興趣,基于用戶偏好召回;
第四,基于規(guī)則召回:為配合資訊的業(yè)務(wù)需求,一般可加入運營規(guī)則對召回策略進行干預(yù),例如:
- 時效性規(guī)則:只推薦1個月以內(nèi)的內(nèi)容,并且優(yōu)先推薦最新的資訊內(nèi)容。
- 多樣性規(guī)則:例如希望推薦內(nèi)容中,社會類、娛樂類、科普類呈多樣性分布。
- 打散規(guī)則:推薦內(nèi)容中,希望同一個類別,作者不連續(xù)呈現(xiàn)。
2.如何制定資訊相關(guān)推薦規(guī)則

第一,基于內(nèi)容側(cè)推薦,綜合資訊的標題、標簽、類別、作者等字段做相似性分析,推薦相似資訊。
第二,基于用戶側(cè)推薦,利用用戶的協(xié)同過濾和物品的協(xié)同過濾算法進行推薦。
第三,加入業(yè)務(wù)規(guī)則限制,例如控制新聞字段對相關(guān)推薦模型的權(quán)重,標簽>標題>類別>作者。

第一,根據(jù)海量用戶的點擊、點贊等行為數(shù)據(jù),計算新聞熱度,生成排行榜單進行推薦。
第二,根據(jù)時間維度,加大24小時內(nèi)的新聞的權(quán)重,保證最新的新聞的曝光率。
第三,合理調(diào)整熱門推薦刷新機制,如2-4小時計算一次熱門榜單。
第四,結(jié)合app定位,調(diào)整不同行為對熱門模型的權(quán)重影響,如加大深度閱讀行為或者分享行為的權(quán)重。
第五,行為對熱門模型的影響度按時間遞減,例如今天的點擊行為權(quán)重高于昨天的點擊行為權(quán)重。
目前,在媒體和資訊行業(yè)達觀已經(jīng)服務(wù)江蘇廣電、陜西廣電、深圳廣電、澎湃新聞、人民網(wǎng)、四川日報、廣而告之、WiFi萬能鑰匙、聚看點等幾十家知名客戶。在客戶服務(wù)過程中,達觀智能推薦團隊針對客戶應(yīng)用場景,從業(yè)務(wù)、監(jiān)管、特定推薦等角度,提供推薦模型的定制和優(yōu)化。
此外,達觀數(shù)據(jù)智能推薦產(chǎn)品在銀行業(yè)、視頻等各個領(lǐng)域進行應(yīng)用,客戶涵蓋招商銀行、浦發(fā)銀行、民生銀行、江蘇銀行、寧波銀行、中國移動、長虹、安利等近百家各行業(yè)龍頭企業(yè)。