古有“高山流水遇知音”,伯牙和鐘子期的故事耳熟能詳;今有“中國好聲音”、“我是歌手”等歌唱綜藝節(jié)目,市面上音樂APP花式百出。每年新歌的發(fā)布數(shù)量不計其數(shù),我們好像無時無刻不在跟音樂打交道。
我們在龐大的音樂庫中主動找一首自己滿意的歌曲,可能會花費很長時間,但當我們選擇推薦的方式“被動接收”音樂網(wǎng)站推給我們的歌曲時,往往會有意想不到的驚喜。
當你打開音樂APP,點開每日推薦時,是不是也曾發(fā)出過“這個APP很懂我愛聽什么歌”的感嘆呢?流行、搖滾、民謠、輕音樂各種風格應(yīng)有盡有,有沒有很好奇在海量音樂中,APP是如何找到符合自己口味的歌曲呢?下面我們就來認識下音樂推薦系統(tǒng)中最親密的“合作伙伴”。
目前常用的推薦方式
基于內(nèi)容的推薦
基于內(nèi)容的推薦原理簡單分為三步:
- 為每個物品構(gòu)建一個物品的屬性資料
- 為每個用戶構(gòu)建一個用戶的喜好資料
- 計算用戶喜好資料與物品屬性資料的相似度,相似度高意味著用戶可能喜歡這個物品。
在音樂行業(yè)中,基于內(nèi)容的推薦可以理解為根據(jù)用戶的聽歌時間、點擊次數(shù)、收藏、下載等行為,建立用戶畫像,并分析曲目的特征信息,對音樂數(shù)據(jù)庫進行遍歷搜索,根據(jù)兩者的相似程度,推薦合適的曲目給該用戶。這種推薦方法需要考慮到用戶的歷史數(shù)據(jù),在具體的推薦過程中,如果用戶的喜好資料發(fā)生變化,那么推薦出來的音樂類型也會發(fā)生改變。
所以這種方法的優(yōu)劣勢也非常明顯,首先這種方法不存在物品的冷啟動問題,對于一首全新的歌曲也可以得到一定程度的曝光,從而目標用戶接收的推薦曲目并不是單一的熱門歌曲;但是由于這種方法只考慮到目標用戶偏好與歌曲的相似度,判斷質(zhì)量的好壞就顯得比較困難,推薦出來的歌曲質(zhì)量可能不如人意。

基于協(xié)同過濾的推薦方法
基于協(xié)同過濾的推薦方法基本原理是根據(jù)用戶的偏好計算他們之間的相似度,確定與目標用戶相似值最高的用戶集合,并根據(jù)后者對產(chǎn)品的評價確定目標用戶偏好,再依此進行推薦。比如兩個聽歌品味相似的用戶,將其中一個用戶喜歡或者單曲循環(huán)的歌曲推薦給另一用戶。
相對基于內(nèi)容的推薦算法,這種推薦算法可能給用戶推薦出完全不同類型的歌曲,增添了驚喜性;除此之外,還可通過用戶群的集體行為來判斷歌曲質(zhì)量,從而一定程度上保證了推薦質(zhì)量。但是這種方法比較依賴于歷史數(shù)據(jù),因此不能很好的解決冷啟動問題。

目前很多音樂APP都支持給歌曲打標簽的功能,基于標簽的推薦即用標簽來表示音樂的內(nèi)容信息,根據(jù)用戶與標簽的關(guān)聯(lián)和音樂與標簽的關(guān)聯(lián)建立用戶-音樂模型,從而向目標用戶推薦音樂,基本流程分為以下三步:
- 根據(jù)大量用戶標注的標簽信息,統(tǒng)計出他們最常用的標簽
- 對其中的標簽,計算出標記此標簽次數(shù)最多的曲目
- 計算目標用戶使用頻率最高的標簽,基于這些標簽進行曲目推薦
這種推薦方法的準確率依賴于標簽的準確率,因為并不是所有的標簽都能夠反映用戶的興趣,所以需要對標簽取其精華、去其糟粕,篩選出有意義的優(yōu)質(zhì)標簽,往往能提升推薦的準確率。
一般而言,推薦方式都各有優(yōu)缺,很多時候會采用混合推薦的方法,分別進行不同推薦方法的預測,然后將他們組合起來,有時比單純一種推薦方法更準確。
對于一首歌曲來說,最重要的部分無非歌詞莫屬,透過歌詞,我們可以品出一段故事,甚至可以看到一個人生的縮影:
- 在“我知道,我一直有雙隱形的翅膀,帶我飛,飛過絕望”讀出了信仰
- 在“多少人曾愛你青春歡唱的時辰愛慕你的美麗、假意或真心只有一個人還愛你虔誠的靈魂愛你蒼老的臉上的皺紋”讀出了愛情的浪漫
- 在“往事不要再提,人生已多風雨,縱然記憶抹不去,愛與恨都還在心里”中讀出了悲傷
- ……
這些信息可以反映一首歌的感情趨勢,是不是也可以應(yīng)用到推薦系統(tǒng)中呢?
基于精彩評論或者歌詞的推薦方法
因為精彩評論和歌詞是文本的形式,可以通過將每一篇歌曲的歌詞和精選評論進行分詞處理,并去除掉沒有意義的詞語,篩選出一些特征詞,進而可以計算特征詞的權(quán)重,可以利用特征詞在文本中出現(xiàn)的次數(shù),或者TF-IDF的方式來確定權(quán)重,這個權(quán)重在一定程度上可以反映除歌曲的情感傾向和類型,作為向目標用戶推薦的依據(jù)。
達觀數(shù)據(jù)智能推薦

達觀數(shù)據(jù)擁有專業(yè)的NLP平臺,可以深度挖掘文本信息,在推薦過程中數(shù)據(jù)預處理這一步彰顯強大的優(yōu)勢,并且目前達觀智能推薦已服務(wù)于招商銀行、wifi萬能鑰匙、澎湃新聞、順豐大當家、英語趣配音、微鯉小說等多家各行業(yè)的杰出企業(yè),在推薦結(jié)果的召回、排序和業(yè)務(wù)規(guī)則后處理的進程中不僅有強大的算法支撐,還擁有豐富的行業(yè)經(jīng)驗,深度理解業(yè)務(wù)場景。
除此之外,達觀推薦系統(tǒng)支持產(chǎn)品編輯,自定義召回、排序、后處理策略和推薦方案、上線方案等,全方面配合企業(yè)運營需求。達觀智能推薦,推你所想,薦你所需,開啟企業(yè)更智能的產(chǎn)品運營時代。