在上篇文章中,筆者主要圍繞社會(huì)化聆聽(tīng)的概念、價(jià)值和開(kāi)展方法,下面,筆者將以一個(gè)汽車行業(yè)案例,來(lái)詳細(xì)講述上面關(guān)于社會(huì)化聆聽(tīng)步驟。
02 從凱迪拉克在汽車之家的口碑?dāng)?shù)據(jù)中挖掘出有價(jià)值的信息
在這一部分,筆者想通過(guò)一個(gè)完整的社會(huì)化聆聽(tīng)案例達(dá)到兩個(gè)目的:
1.通過(guò)“一條龍”式的全流程分析(為了保證讀者能夠清晰的了解社會(huì)化聆聽(tīng)的方法和技巧,筆者采用的是編程的手段,而不是直接使用工具),使讀者能了解社會(huì)化聆聽(tīng)的大致實(shí)施過(guò)程。
2.通過(guò)案例的講解,使讀者能夠掌握一些實(shí)用的社會(huì)化聆聽(tīng)分析方法。
2.1 數(shù)據(jù)獲取
本文的數(shù)據(jù)獲取來(lái)源為汽車之家。那為什么選擇汽車之家作為分析對(duì)象呢?
汽車之家成立于2005年6月,成立至今已有14年的歷史,它為汽車消費(fèi)者提供選車、買車、用車、換車等所有環(huán)節(jié)的全面、準(zhǔn)確、快捷的一站式服務(wù),是基于汽車專業(yè)內(nèi)容的垂直社區(qū),是全球訪問(wèn)量最大的汽車網(wǎng)站。因此,它上面能集中大量?jī)?yōu)質(zhì)的用戶UGC,可以“傾聽(tīng)”到用戶關(guān)于汽車及其品牌的“聲音”。
在這里,筆者獲取的是汽車之家上“口碑頻道”的數(shù)據(jù),是關(guān)于購(gòu)車消費(fèi)者買車后的評(píng)論。該頻道提供的數(shù)據(jù)維度豐富,包括汽車各方面的評(píng)分及其文字評(píng)論、曬圖,以及各帖子的互動(dòng)數(shù)據(jù)等。
下圖是一條口碑評(píng)論的截圖,可以看到一條口碑評(píng)論由許多結(jié)構(gòu)化和半結(jié)構(gòu)化的數(shù)據(jù)維度組成:
圖8? ?汽車之家口碑社區(qū)蘊(yùn)含有大量用戶關(guān)于產(chǎn)品的觀點(diǎn)、意見(jiàn)和情緒
筆者在這里進(jìn)行數(shù)據(jù)采集的根據(jù)是Python中的Scrapy,它是Python下的一個(gè)快速、高層次的web抓取框架,用于抓取web站點(diǎn)并從頁(yè)面中提取結(jié)構(gòu)化的數(shù)據(jù)。獲取的數(shù)據(jù)對(duì)用戶和帖子詳情信息做了處理,不涉及用戶隱私,且本分析不作商業(yè)用途,僅供學(xué)習(xí)探討。
獲取的口碑評(píng)論量為30w+,其中凱迪拉克下的評(píng)論有12,900條,存儲(chǔ)在SQL SERVERerver 2017Mongodb中。
2.2 分析目的
以下是筆者接下來(lái)分析挖掘的重點(diǎn)內(nèi)容,主要集中在凱迪拉克的產(chǎn)品反饋和品牌調(diào)性方面:
- 了解消費(fèi)者的購(gòu)車目的,從用途/使用場(chǎng)景角度進(jìn)行分析
- 了解消費(fèi)者的購(gòu)車原因,從汽車的幾個(gè)重要維度,如安全性,操控,動(dòng)力,油耗等
- 了解消費(fèi)者比較重要的購(gòu)車因素,即用戶比較關(guān)注哪些汽車功能或汽車器件
- 分析消費(fèi)者眼中的品牌調(diào)性,與事先設(shè)定的品牌調(diào)性有何差異
- 在上述分析中加入競(jìng)品分析,分析其異同點(diǎn)
2.3 數(shù)據(jù)特征及分類
現(xiàn)在,根據(jù)分析目的對(duì)獲取到的數(shù)據(jù)的字段進(jìn)行分類和挑揀,選擇部分可作為分析的數(shù)據(jù):(1) 評(píng)級(jí)類數(shù)據(jù):
- comfortableness_score(舒適性評(píng)分)
- internal_score(內(nèi)飾得分)
- maneuverability_score(操控性得分)
- oil_score(油耗評(píng)分)
- power_score(動(dòng)力評(píng)分)
- apperance_score(外觀評(píng)分)
- costefficient_score(性價(jià)比評(píng)分)
- space_score(空間評(píng)分)
- Satisfaction (滿意度)
(2)半結(jié)構(gòu)化數(shù)據(jù):
- purpose (購(gòu)車目的/用途)
- bought_Address(購(gòu)買地址)
- brand_name (品牌名稱)
- buy_date(購(gòu)買日期)
- buy_price(購(gòu)買價(jià)格)
- carowner_levels(車主等級(jí))
- prov_name(省份名稱)
- city_name(城市名稱)
- Comment_count(評(píng)論數(shù))
- Helpful_count(有用數(shù))
- Visit_count (瀏覽量)
- product_name(產(chǎn)品名稱)
- pub_date(發(fā)布日期)
(3)文本類數(shù)據(jù):
- apperance_feeling(外觀感受)
- comfortableness_feeling (舒適性感受)
- costefficient_feeling (性價(jià)比感受)
- maneuverability_feeling (操控性感受)
- internal_feeling (內(nèi)飾感受)
- power_feeling (動(dòng)力感受)
- oil_feeling (油耗感受)
- space_feeling(空間感受)
- car_defect(車輛缺陷)
- car_merit(車輛優(yōu)點(diǎn))
- review_summary (評(píng)論總結(jié))
- bought_reason (購(gòu)買原因)
本文分析所用到的數(shù)據(jù)主要是文本類數(shù)據(jù)和小部分的半結(jié)構(gòu)化數(shù)據(jù)。
2.4 消費(fèi)者購(gòu)車目的分析
在“消費(fèi)者目的”分析中,筆者選取了寶馬、捷豹、奔馳、凱迪拉克和路虎這5個(gè)汽車品牌作為分析對(duì)象,想要知曉消費(fèi)者在這5個(gè)汽車品牌的使用場(chǎng)景上有什么不同,這也是汽車廠商較為關(guān)注的方面 — 自己的產(chǎn)品定位與消費(fèi)者心智中的定位是否一致,宣傳策略是否需要強(qiáng)化或者調(diào)整。
在口碑頻道的評(píng)論中,存在“購(gòu)車目的”這一字段,是一個(gè)半結(jié)構(gòu)化的選項(xiàng),評(píng)論者可以選填自己喜歡購(gòu)買小車的應(yīng)用場(chǎng)景。
官方提供了10個(gè)候選項(xiàng):
- 購(gòu)物
- 接送小孩
- 拉貨
- 跑長(zhǎng)途
- 泡妞
- 賽車
- 商務(wù)接送
- 上下班
- 越野
- 自駕游
圖9? ?購(gòu)車目的是半結(jié)構(gòu)化的數(shù)據(jù)
從上圖中可以看到,消費(fèi)者可以同時(shí)填寫多個(gè)購(gòu)車目的標(biāo)簽。所以,在正式分析之前,需要對(duì)該標(biāo)簽數(shù)據(jù)進(jìn)行拆分,出現(xiàn)多個(gè)標(biāo)簽的行要拆解成多行,對(duì)結(jié)果進(jìn)行透視表統(tǒng)計(jì),最后整理成交叉列聯(lián)表。結(jié)果如下表所示:
圖10? ?5個(gè)汽車競(jìng)品的購(gòu)車目的交叉列聯(lián)統(tǒng)計(jì)表
從上面的表格中,我們可以看到,寶馬、捷豹、凱迪拉克和路虎這4個(gè)汽車品牌的主要購(gòu)車目的是“上下班”,用于上下班通勤,而奔馳的主要購(gòu)車目的集中在“泡妞”上,購(gòu)車目的不單純……
然而,上面的表格并沒(méi)有完全挖掘出多元關(guān)聯(lián)數(shù)據(jù)中的價(jià)值,此時(shí)該對(duì)應(yīng)分析(Correspondence Analysis)出馬了!
對(duì)應(yīng)分析(Correspondence Analysis)也稱關(guān)聯(lián)分析、R-Q型因子分析,是近年新發(fā)展起來(lái)的一種多元相依變量統(tǒng)計(jì)分析技術(shù),通過(guò)分析由定性變量構(gòu)成的交互匯總表(也就是上表)來(lái)揭示變量間的聯(lián)系,它可以揭示同一變量的各個(gè)類別之間的差異,以及不同變量各個(gè)類別之間的對(duì)應(yīng)關(guān)系,是一種強(qiáng)有力的數(shù)據(jù)可視化技術(shù) 。
對(duì)應(yīng)分析主要應(yīng)用在市場(chǎng)細(xì)分、產(chǎn)品定位、地質(zhì)研究以及計(jì)算機(jī)工程等領(lǐng)域中。原因在于,它是一種視覺(jué)化的數(shù)據(jù)分析方法,它能夠?qū)捉M看不出任何聯(lián)系的數(shù)據(jù),通過(guò)視覺(jué)上可以接受的定位圖展現(xiàn)出來(lái)。
對(duì)應(yīng)分析的基本思想是將一個(gè)列聯(lián)表的行和列中各元素的比例結(jié)構(gòu)以點(diǎn)的形式在較低維的空間中表示出來(lái)。它最大特點(diǎn)是能把眾多的樣例(這里是汽車品牌)和眾多的變量(這里是購(gòu)車目的)同時(shí)作到同一張圖解上,將樣例的大類及其屬性在圖上直觀而又簡(jiǎn)潔地表示出來(lái),具有直觀性。另外,它還省去了因子選擇和因子軸旋轉(zhuǎn)等復(fù)雜的數(shù)學(xué)運(yùn)算及中間過(guò)程,可以從因子載荷圖上對(duì)樣例進(jìn)行直觀的分類,而且能夠指示分類的主要參數(shù)(主因子)以及分類的依據(jù),是一種直觀、簡(jiǎn)單、方便的多元統(tǒng)計(jì)方法。
得到對(duì)應(yīng)分析二維坐標(biāo)圖以后,要想作出正確的解讀,還需要使用點(diǎn)“小手段”:
從坐標(biāo)軸中心向任意汽車品牌連線(具有方向,是一條射線),指向汽車品牌的方向?yàn)檎?,然后將所有的使用?chǎng)景往這條連線及其正反延長(zhǎng)線作垂線,(使用場(chǎng)景的)垂點(diǎn)越靠近該連線及其延長(zhǎng)線的正向方向,就代表該使用場(chǎng)景對(duì)于該汽車品牌而言更常見(jiàn)。
下圖是將上表數(shù)據(jù)映射到二維坐標(biāo)系的可視化呈現(xiàn):
圖11 ??由交叉列聯(lián)表轉(zhuǎn)化成的競(jìng)品對(duì)應(yīng)分析圖
轉(zhuǎn)換后的可視化結(jié)果更能發(fā)現(xiàn)一些有趣的事實(shí):
- 捷豹、凱迪拉克和寶馬從使用場(chǎng)景(購(gòu)車目的為購(gòu)物、上下班、商務(wù)接送、接送小孩等)上來(lái)說(shuō),幾乎是重疊的,彼此是競(jìng)爭(zhēng)對(duì)手;
- 奔馳最突出的使用場(chǎng)景還是泡妞(射線正向上離得最近),其他使用場(chǎng)景并不突出(在射線負(fù)向上);
- 路虎的越野特性還是最突出的,跑長(zhǎng)途和自駕游的特性也較突出。
由分析的結(jié)果可知,凱迪拉克的使用場(chǎng)景比較泛,當(dāng)然原因也有可能在于筆者分析的是品牌而不是具體的車系和車型,分析的粒度較粗,筆者將會(huì)在文末聊到這一點(diǎn)。
2.5 了解消費(fèi)者關(guān)注的典型話題
這里,筆者將凱迪拉克口碑?dāng)?shù)據(jù)的兩個(gè)字段 — Car_defect(車輛缺陷)、Car_merit(車輛優(yōu)點(diǎn))整合到一起,對(duì)評(píng)論內(nèi)容進(jìn)行一個(gè)“鳥(niǎo)瞰式”的分析,迅速識(shí)別出汽車消費(fèi)者較為關(guān)注的話題。
此處的分析基于HDBSCAN(Hierarchical Density-Based Spatial Clustering of Applications with Noise)實(shí)現(xiàn)。相較于K-means、Spectral clustering、Agglomerative clustering、DBSCAN等傳統(tǒng)聚類算法,筆者特別欣賞它的3大特性:
- 不需要設(shè)定聚類數(shù),有算法自動(dòng)算出來(lái)簇群數(shù)
- 可以較好的處理數(shù)據(jù)中的噪音
- 可以找到基于不同密度的簇(與DBSCAN不同),并且對(duì)參數(shù)的選擇更加魯棒(Robust,模型更加健壯)
基于自動(dòng)聚類形成的關(guān)鍵詞詞云,能自然的反映評(píng)論數(shù)據(jù)中的潛在結(jié)構(gòu)和語(yǔ)義特征,由此能準(zhǔn)確且清晰的知曉消費(fèi)者對(duì)于汽車及其功能、器件的關(guān)注側(cè)重點(diǎn)。
對(duì)于生成的可視化結(jié)果,可以這樣解讀:
- 字體大小表示詞匯的權(quán)重值大小,注意,這里的權(quán)重非詞頻數(shù),而是TF-IDF值,更能表示該詞匯在評(píng)論中的重要性
- 顏色代表不同的話題
- 詞匯之間距離越近,說(shuō)明它們?cè)谕徽Z(yǔ)境中出現(xiàn)的頻率較高,越具有語(yǔ)義相關(guān)性,比如“胎噪”、“輪胎”、“啃胎”、“噪音”、“隔音”等詞匯挨得很近,我們能迅速聯(lián)想到是胎噪導(dǎo)致噪音或者隔音效果差,而不是汽車發(fā)動(dòng)機(jī)或者車廂內(nèi)組件老化產(chǎn)生的摩擦聲引起的。
下圖是自動(dòng)聚類出來(lái)的結(jié)果,自動(dòng)聚為12個(gè)主題:
圖12? ?自動(dòng)聚合的用戶話題關(guān)鍵詞云
為了將各主題的界限劃分得更清晰些,筆者給每個(gè)主題加了虛線框(點(diǎn)擊圖片放大看高清大圖):
圖13? ?經(jīng)錨定的用戶話題關(guān)鍵詞云
上圖中,較為突出的是11個(gè)主題,按其重要性程度(字體大小、主題詞數(shù))選出TOP5,根據(jù)其中的關(guān)鍵詞可以推測(cè)消費(fèi)者的熱門討論內(nèi)容,依次是:
- 外觀:汽車的整體設(shè)計(jì),主要是外形,買車的消費(fèi)者大都是“顏控”
- 空間:后排空間、儲(chǔ)物空間和后排座椅是大家比較關(guān)注的方面,另外,一家人出行的時(shí)候,空間問(wèn)題就容易突顯
- 動(dòng)力:發(fā)動(dòng)機(jī)、汽車起步(油門、起步)、提速/加速問(wèn)題是動(dòng)力這一主題下消費(fèi)者較為關(guān)心的方面
- 配置:汽車配置這塊,消費(fèi)者對(duì)導(dǎo)航系統(tǒng)和內(nèi)部的顯示屏較為關(guān)心
- 內(nèi)飾:內(nèi)飾這塊,消費(fèi)者反映較多的是材質(zhì)的塑料感
由于筆者不是汽車行業(yè)的從業(yè)人員,平時(shí)也不開(kāi)車,所以對(duì)該領(lǐng)域的關(guān)鍵詞不太敏感。不過(guò),如果是這方面的從業(yè)者,根據(jù)詞匯之間的關(guān)聯(lián)性(距離遠(yuǎn)近),會(huì)有可能從總體上發(fā)現(xiàn)一些業(yè)務(wù)相關(guān)問(wèn)題。
2.6 從“車輛缺陷”中識(shí)別凱迪拉克的重要產(chǎn)品缺陷
剛才的關(guān)鍵詞云是一個(gè)“鳥(niǎo)瞰式”的分析,可以在較短的時(shí)間內(nèi)抓住海量評(píng)論的重點(diǎn)。但是,如果我們想要進(jìn)一步了解消費(fèi)者對(duì)于凱迪拉克的哪些缺點(diǎn)比較關(guān)注,也就是挖掘消費(fèi)者關(guān)于凱迪拉克的產(chǎn)品缺陷的典型意見(jiàn),這就涉及到分析Car_defect(車輛缺陷)這個(gè)字段了。
這里,筆者想找到凱迪拉克的12,900條負(fù)面評(píng)價(jià)中最具代表性的差評(píng),思路如下:
- 抽取語(yǔ)句中的主觀性信息(形容詞、副詞、習(xí)語(yǔ),反映消費(fèi)者的評(píng)價(jià)),和客體信息(名詞,主要是汽車各器件、功能、使用場(chǎng)景等,排除掉人名、地名、時(shí)間等實(shí)體)。
- 對(duì)每條評(píng)論中代表主觀性信息和客體信息的詞匯的TF-IDF值進(jìn)行累加,得到每個(gè)評(píng)論語(yǔ)句的重要性得分。
- 對(duì)這些評(píng)論進(jìn)行聚類,最終形成了10個(gè)規(guī)模較大的簇群,數(shù)量較少的被當(dāng)做噪音處理,盡管它們具有一定的長(zhǎng)尾價(jià)值。
- 在每個(gè)簇群中,找出重要性得分最高的語(yǔ)句,且詞匯數(shù)限定在100個(gè)以內(nèi),字?jǐn)?shù)太多,觀點(diǎn)不明確,重點(diǎn)不突出,對(duì)于后續(xù)瀏覽者的影響力也有限。
圖14? ?評(píng)論中的每個(gè)詞匯都有一定的權(quán)重
以下是按照上述思路挖掘出的TOP10典型意見(jiàn),代表了購(gòu)買凱迪拉克的用戶對(duì)于凱迪拉克車輛缺陷中的10個(gè)方面較為不滿:
- 30多萬(wàn)的車標(biāo)配的鹵素大燈,沒(méi)有前后雷達(dá)讓人有點(diǎn)無(wú)語(yǔ)
- 提速?zèng)]有傳說(shuō)快!倒車后視鏡顯示太模糊!A柱有點(diǎn)擋視線!
- 儲(chǔ)物空間明顯不夠用 比起我家之前的小6子(編者注:馬自達(dá)6)少太多,特別是手機(jī)完全不知道怎么搞
- 基本沒(méi)有,硬要找的話可能是有時(shí)會(huì)有點(diǎn)異響
- 6AT確實(shí)老了點(diǎn),算是夠用吧。
- 最不中意的就是排擋桿,巨丑
- 暫時(shí)沒(méi)有,再就是新車油耗有點(diǎn)高。漆有點(diǎn)薄,準(zhǔn)備去做鍍晶。
- 這個(gè)也不算是不滿意吧,因?yàn)楹筝嗱?qū)動(dòng)的原因,中間的隆起實(shí)在是有點(diǎn)影響乘坐,后備箱也因?yàn)檫@樣子不是很大平時(shí)東西多的時(shí)候都要放在后座。
- 底盤確實(shí)硬一點(diǎn),舒適度差了一點(diǎn)~
- 感覺(jué)這個(gè)車的音響效果并不如想象中的好。
上面這些典型缺陷可以作為汽車廠商接下來(lái)產(chǎn)品改進(jìn)的重要考量。
對(duì)于“30多萬(wàn)的車標(biāo)配的鹵素大燈,沒(méi)有前后雷達(dá)讓人有點(diǎn)無(wú)語(yǔ)”這個(gè)典型觀點(diǎn),利用基于LSI的相似語(yǔ)句檢索,可以看到最相關(guān)的若干信息,看看在這個(gè)話題下,用戶具體的槽點(diǎn)和痛點(diǎn)是哪些:
圖15? ?具體槽點(diǎn)/痛點(diǎn)語(yǔ)句的檢索
2.7?從“購(gòu)車原因”中挖掘出重要的購(gòu)車影響因素
在這部分分析中,筆者將所有文本類字段進(jìn)行合并,做進(jìn)一步文本挖掘,看看具體是哪些因素誘發(fā)消費(fèi)者購(gòu)買凱迪拉克的。筆者的做法是,從每條語(yǔ)句中抽取TF-IDF最高的TOP15關(guān)鍵詞,主要是汽車實(shí)體詞(描述汽車零部件、特性、配置相關(guān)的詞匯)、功能或者評(píng)價(jià)詞。
圖16? ?提取評(píng)論語(yǔ)句中包含重要語(yǔ)義信息的詞匯
然后按詞匯順承關(guān)系(時(shí)間先后順序,箭頭指向方為向后提及)做詞匯共現(xiàn)分析,去詞頻數(shù)較高的若干詞匯,最后形成下圖:
圖17? ?購(gòu)車影響因素圖譜
從上圖可以看到,外觀、座椅、儲(chǔ)物空間、發(fā)動(dòng)機(jī)、方向盤、后備箱是凱迪拉克購(gòu)車者較為關(guān)注的方面,至于是好的評(píng)價(jià)還是差的評(píng)價(jià),現(xiàn)在還未可知。這些關(guān)鍵詞節(jié)點(diǎn)的“Betweenness Centrality (中介性核心性)”較高,該詞學(xué)術(shù)的解釋是“兩個(gè)非鄰接的成員間的相互作用依賴于網(wǎng)絡(luò)中的其他成員,特別是位于兩成員之間路徑上的那些成員,它們對(duì)這兩個(gè)非鄰接成員的相互作用具有某種控制和制約作用“,在評(píng)論中經(jīng)常與其它汽車器件共同出現(xiàn),說(shuō)明這些器件是購(gòu)車者較為關(guān)注的方面。如果想看到消費(fèi)者關(guān)于這些器件的具體看法,可以采用上述LSI檢索相關(guān)的語(yǔ)句,筆者在這里就不做贅述。
2.8 基于微博數(shù)據(jù)的消費(fèi)者興趣挖掘
了解消費(fèi)者的興趣愛(ài)好對(duì)于打造品牌調(diào)性、營(yíng)銷內(nèi)容創(chuàng)作及投放渠道選擇都有幫助,是產(chǎn)品市場(chǎng)調(diào)研和競(jìng)品分析中的重要事項(xiàng)。
這里,筆者先挖掘出汽車品牌對(duì)于人群的興趣圖譜,然后結(jié)合使用與滿足理論(Uses and Gratifications)對(duì)結(jié)果進(jìn)行解讀,為內(nèi)容創(chuàng)作和媒體投放方面提供思考方向。
對(duì)于消費(fèi)者的興趣愛(ài)好的挖掘,筆者會(huì)用到新浪微博的消費(fèi)者個(gè)性標(biāo)簽數(shù)據(jù)。該部分?jǐn)?shù)據(jù)基于關(guān)鍵詞命中,也就是說(shuō),采集到的標(biāo)簽數(shù)據(jù)僅針對(duì)提及目標(biāo)汽車品牌的微博用戶。
在這里,筆者采用的標(biāo)簽數(shù)據(jù)涉及到5個(gè)品牌,即凱迪拉克、寶馬、奔馳、路虎和捷豹,時(shí)間跨度為近一個(gè)月。數(shù)據(jù)預(yù)處理方式跟前面的一致,最終得到如下對(duì)應(yīng)圖譜:
圖18? ?5個(gè)汽車品牌的用戶興趣對(duì)應(yīng)分析圖譜
(數(shù)據(jù)來(lái)源:新浪微博,時(shí)間:2018-12-01 ~ 2019-05-01)
比照之前對(duì)應(yīng)分析圖譜的分析方法,我們可以得到與各個(gè)汽車品牌典型且最為接近的微博消費(fèi)者興趣標(biāo)簽:
- 凱迪拉克:星座命理、汽車、美甲、韓劇、內(nèi)地綜藝等
- 寶馬:心靈雞湯、歌手、娛樂(lè)明星、搞笑段子、人生感悟等
- 奔馳:美女帥哥、網(wǎng)絡(luò)模特、模特、重口味、網(wǎng)紅草根等
- 路虎:投資、汽車資訊、歌手、旅游出行、A股、軍事等
- 捷豹:體育、美女帥哥、電子競(jìng)技、日韓明星、模特等
可以看到,這幾個(gè)汽車品牌的關(guān)注人群的興趣大體上都呈現(xiàn)娛樂(lè)化的特點(diǎn),影視、明星方面的興趣較多,這也與微博娛樂(lè)化的平臺(tái)特性有關(guān)。
挖掘出汽車品牌所對(duì)應(yīng)人群的興趣愛(ài)好以后,可采用使用與滿足理論(Uses and Gratifications)對(duì)結(jié)果進(jìn)行深度解讀和應(yīng)用。
使用與滿足理論是一種以受眾為中心的理論,側(cè)重于對(duì)大眾傳播的理解。雖然其理論框架來(lái)自傳統(tǒng)媒體,并遠(yuǎn)遠(yuǎn)早于互聯(lián)網(wǎng)和社會(huì)化媒體,但其理論假設(shè)使其完全適用于互聯(lián)網(wǎng)和社會(huì)化媒體研究。該理論假設(shè)可以概括為:
- 在選擇媒體和內(nèi)容時(shí),受眾是積極的參與者,會(huì)根據(jù)個(gè)人目標(biāo)選擇媒體和閱讀傾向;
- 媒體渠道彼此之間競(jìng)爭(zhēng),還與其他資源競(jìng)爭(zhēng),以獲得受眾的關(guān)注;
- 人們?cè)谶x擇媒體和內(nèi)容時(shí),是主動(dòng)、自我清醒且受動(dòng)機(jī)驅(qū)動(dòng)的,這使得他們能夠清楚的表達(dá)選擇媒體的原因。
基于這些假設(shè),該理論認(rèn)為受眾會(huì)積極的尋求滿足,而滿足的類型將推動(dòng)他們對(duì)社會(huì)化媒體及內(nèi)容的選擇,因而媒體選擇是目標(biāo)導(dǎo)向和實(shí)用驅(qū)動(dòng)的,也就是受眾的需求要被所選擇的社會(huì)化媒體滿足。
滿足類型背后往往潛藏著更為個(gè)性化的內(nèi)在需求,E·卡茨、M·格里維奇和H·赫斯將其歸納為5個(gè)大類:
1)認(rèn)知需求——獲得信息、知識(shí)和理解,如上知乎提問(wèn)或者瀏覽感興趣的話題、母嬰論壇找育兒知識(shí)等;
2)情感需求——情緒的、愉悅的或美感體驗(yàn),如快手、抖音上看美女直播;
3)個(gè)人整合需求——加強(qiáng)信心,穩(wěn)固身份地位,如通過(guò)加入線上圈子,觀察同類的言行,并通 ?過(guò)這種方式獲得身份認(rèn)同;
4)社會(huì)整合需求——如利用即時(shí)通訊軟件與熟人、生人進(jìn)行交流,發(fā)展或維護(hù)人際關(guān)系;
5)舒解壓力需求——逃避或轉(zhuǎn)移注意力,主要是娛樂(lè)活動(dòng),包括各種真人秀節(jié)目、網(wǎng)絡(luò)游戲等。利用使用與滿足理論對(duì)上述各汽車品牌的興趣標(biāo)簽結(jié)果進(jìn)行分析,大體上可以得出如下結(jié)果:
- 凱迪拉克:舒解壓力需求
- 寶馬:舒解壓力需求、情感需求
- 奔馳:情感需求
- 路虎:個(gè)人整合需求
- 捷豹:舒解壓力需求、情感需求
上述結(jié)果反映了各汽車品牌用戶在媒體選擇時(shí)的內(nèi)在需求,在內(nèi)容制作和媒體選擇時(shí)可以作為參考。比如,凱迪拉克可以選擇舒解壓力需求的內(nèi)容頻道或者社會(huì)化媒體(比如即刻、一條等),內(nèi)容制作上可采用游記類主題,音樂(lè)可以采用舒緩的輕音樂(lè),圖片風(fēng)格則是小清新…
此外,從競(jìng)品分析的角度,對(duì)應(yīng)分析圖還可以作如下解讀:
1. 向量的夾角大小:從向量夾角的角度看不同品牌之間的相似情況。上圖中任意兩個(gè)汽車品牌向量之間的夾角越小,代表這兩個(gè)汽車品牌的消費(fèi)者興趣愛(ài)好相近,實(shí)際上反推出品牌調(diào)性的趨同。這里可以看到,奔馳和捷豹的在微博上的關(guān)注人群的興趣愛(ài)好趨同,由此反推出品牌調(diào)性較為接近。凱迪拉克和其他4個(gè)汽車品牌之間的品牌調(diào)性差異較大,個(gè)性較鮮明。
2. 距離坐標(biāo)軸的遠(yuǎn)近:從統(tǒng)計(jì)學(xué)上來(lái)看,品牌越靠近坐標(biāo)軸中心,越?jīng)]有特征;越遠(yuǎn)離坐標(biāo)軸中心,說(shuō)明特征越明顯。從品牌角度來(lái)考慮,說(shuō)明越遠(yuǎn)離中心的汽車品牌,消費(fèi)者越是容易識(shí)別,說(shuō)明品牌特征(特點(diǎn)、特色)很明顯;越靠近中心的品牌,消費(fèi)者越是不容易識(shí)別,要說(shuō)明品牌定位有問(wèn)題,沒(méi)有顯著的特征可以識(shí)別,差異化還不夠。從這一點(diǎn)來(lái)看,凱迪拉克和捷豹的品牌個(gè)性較為鮮明,奔馳的品牌定位最為模糊。了解了品牌在潛在消費(fèi)者心中的品牌形象以后,如果發(fā)現(xiàn)跟預(yù)期接近,繼續(xù)加強(qiáng)這方面的投入即可,如果發(fā)現(xiàn)偏離預(yù)期,就需要及時(shí)調(diào)整思路了,在社會(huì)化媒體平臺(tái)上發(fā)布能反映品牌調(diào)性的內(nèi)容,引發(fā)關(guān)注人群的互動(dòng),長(zhǎng)此以往,可以對(duì)塑造特定的品牌印象起到一定幫助。
2.9 基于評(píng)論內(nèi)容的品牌調(diào)性挖掘
現(xiàn)今這個(gè)消費(fèi)時(shí)代,消費(fèi)者的消費(fèi)模式逐步從實(shí)用主義消費(fèi)過(guò)渡到象征性消費(fèi),從僅注重產(chǎn)品的功能和質(zhì)量,轉(zhuǎn)變?yōu)楦⒅仄放婆c自身品位、氣質(zhì)的契合度,從這個(gè)方面來(lái)講,品牌越來(lái)越成為消費(fèi)者的自我延伸。
與此同時(shí),與早期產(chǎn)品和品牌宣傳事實(shí)信息、功能化描述及產(chǎn)品訴求不同,強(qiáng)調(diào)品牌調(diào)性的情感式營(yíng)銷聚焦于產(chǎn)品、服務(wù)和品牌的“人格化”因素,展現(xiàn)品牌的“人性化特征”逐漸成為社會(huì)化媒體語(yǔ)境下強(qiáng)化傳播和建立關(guān)系的主要手段,更為人性化的積極互動(dòng)在社交媒體體驗(yàn)中的重要性越來(lái)越突出。
如果品牌與追隨它的消費(fèi)者保持持續(xù)的“人性化交流”,那么,相對(duì)于硬性推銷方式,這種注重消費(fèi)者關(guān)系維護(hù)的營(yíng)銷方式更能打動(dòng)消費(fèi)者,同時(shí)也能夠鼓勵(lì)消費(fèi)者積極參與并長(zhǎng)期追隨。
為營(yíng)造消費(fèi)者與品牌之間積極互動(dòng)的條件,品牌必須不斷采用“擬人化”的方式來(lái)進(jìn)行營(yíng)銷傳播,使品牌具有人的性格和氣質(zhì),這就涉及到“品牌調(diào)性”的話題了。
比較常規(guī)的做法是,品牌會(huì)用“擬人化”的方式在社會(huì)化媒體上去宣揚(yáng)產(chǎn)品和服務(wù)的獨(dú)特品質(zhì),這種方式可能是活潑的,也可能是清新的,抑或是高貴的…總之,品牌會(huì)著力打造一個(gè)屬于自己的品牌個(gè)性和風(fēng)格,從而與消費(fèi)者在情感上產(chǎn)生聯(lián)結(jié),催生出大量擁簇。
然而,品牌所創(chuàng)造的品牌調(diào)性是通過(guò)各類媒介及內(nèi)容呈現(xiàn)的,其中的重要信息隨著表現(xiàn)的形式或者傳播層級(jí)的遞增而消減,最終反饋到消費(fèi)者腦海中的可能是另一番景象,可能會(huì)產(chǎn)生一定的品牌個(gè)性認(rèn)知偏差。因此,品牌運(yùn)營(yíng)者需要經(jīng)常性的進(jìn)行消費(fèi)者品牌調(diào)性印象調(diào)研,及時(shí)了解消費(fèi)者對(duì)于品牌個(gè)性的認(rèn)知情況,視理解偏差的程度進(jìn)行調(diào)整或優(yōu)化。
在本文中,為了測(cè)量消費(fèi)者對(duì)于凱迪拉克的品牌調(diào)性的實(shí)際認(rèn)知情況,筆者采用千家品牌實(shí)驗(yàn)室改良過(guò)的品牌個(gè)性模型。千家品牌實(shí)驗(yàn)室向忠宏近六年來(lái)對(duì)20個(gè)行業(yè)領(lǐng)域1000多個(gè)品牌的持續(xù)監(jiān)測(cè)與品牌個(gè)性的分析,提取出一些中國(guó)本土化的品牌個(gè)性詞匯,這些新增的品牌個(gè)性語(yǔ)匯對(duì)應(yīng)的品牌人格通過(guò)合并到三個(gè)品牌層面,最終也并入了Aaker提出的品牌個(gè)性的五個(gè)維度中。
圖19? ?中國(guó)本土化品牌個(gè)性詞匯對(duì)照表
(數(shù)據(jù)來(lái)源:千家品牌實(shí)驗(yàn)室向忠)
下面是筆者進(jìn)行品牌個(gè)性挖掘的實(shí)際步驟:
1)將凱迪拉克口碑?dāng)?shù)據(jù)中的所有文本類數(shù)據(jù)進(jìn)行合并,包括外觀感受、 舒適性感受、性價(jià)比感受、操控性感受、內(nèi)飾感受、動(dòng)力感受、油耗感受、空間感受、車輛缺陷、車輛優(yōu)點(diǎn)、評(píng)論總結(jié)、購(gòu)買原因等;
2)經(jīng)過(guò)自然語(yǔ)義分析,即“實(shí)體/屬性—情感詞”抽取分析,得到7035個(gè)“物件詞+情感詞”組合:
圖20? ? “物件詞+情感詞”樣例
3)去除掉功能性的形容詞,保留跟品牌調(diào)性相關(guān)的情感詞。剔除掉描述汽車器件及功能的形容詞,如“漆面+不薄”、“起步+很肉”、“氣味+難散”、“真皮+柔軟”等,其中的觀點(diǎn)詞/形容詞對(duì)于描述品牌個(gè)性意義不大,而要保留擬人化的觀點(diǎn)詞,如“腰線”+“剛勁”中的剛勁,“體型+嬌”中的“嬌”;
4)根據(jù)品牌個(gè)性維度語(yǔ)匯庫(kù),對(duì)保留下來(lái)的品牌調(diào)性形容詞進(jìn)行歸類統(tǒng)計(jì)。結(jié)果如下所示:
圖21? ?品牌個(gè)性綜合統(tǒng)計(jì)結(jié)果
5)對(duì)統(tǒng)計(jì)結(jié)果進(jìn)行旭日?qǐng)D可視化呈現(xiàn),反映2個(gè)層級(jí)的品牌調(diào)性占比關(guān)系。結(jié)果如下圖所示:
圖22? ?凱迪拉克的品牌個(gè)性圖譜
從最終結(jié)果可以看到,凱迪拉克的品牌調(diào)性偏于教養(yǎng),主要在于高貴、精致、迷人的氣質(zhì);其次是其“刺激”的一面,主要在于其活潑的個(gè)性。
我們不妨從百度百科上的凱迪拉克品牌史概略來(lái)看待這個(gè)結(jié)果:
“一百多年來(lái),凱迪拉克汽車在行業(yè)車內(nèi)創(chuàng)造了無(wú)數(shù)個(gè)第一,締造了無(wú)數(shù)個(gè)豪華車的行業(yè)標(biāo)準(zhǔn);可以說(shuō)凱迪拉克的歷史代表了美國(guó)豪華車的歷史。在韋伯斯特大詞典中,凱迪拉克被定義為“同類中最為出色、最具聲望事物”的同義詞;被一向以追求極致尊貴著稱的倫敦皇家汽車俱樂(lè)部冠以“世界標(biāo)準(zhǔn)”的美譽(yù)。凱迪拉克融匯了百年歷史精華和一代代設(shè)計(jì)師的智慧才智,成為汽車工業(yè)的領(lǐng)導(dǎo)性品牌。
一款美國(guó)汽車可以很狂野,也可以很豪華,但是如果想要很尊貴就比較難了。不過(guò)卡迪拉克就是一個(gè)例外,他的創(chuàng)始人為了紀(jì)念底特律的奠基者、法國(guó)貴族安東尼凱迪拉克,就將其家族的徽章作為了車標(biāo)?,F(xiàn)在的卡迪拉克車標(biāo)已經(jīng)有了很大的變化,比如少了象征著三圣靈的黑色小鳥(niǎo)和鑲嵌著珍珠的王冠,只是由桂冠環(huán)繞著經(jīng)典的盾牌形狀,而盾牌形狀則由各種顏色的小色塊組成,其中紅色代表勇氣,銀色代表純潔的愛(ài),藍(lán)色代表探索?!?/p>
如此看來(lái),挖掘的結(jié)果較能反映事實(shí)情況,與品牌發(fā)展歷程相符。
結(jié)合使用與滿足理論和品牌調(diào)性分析,可以對(duì)于內(nèi)容的規(guī)劃、制作,以及渠道的投放提供參考,輔助決策。比如,分析汽車品牌跟網(wǎng)紅的調(diào)性以及粉絲群體是否契合,找到合適的品牌代言人。
03社會(huì)化聆聽(tīng)產(chǎn)品化的成功實(shí)踐 ——以達(dá)觀數(shù)據(jù)的客戶意見(jiàn)洞察平臺(tái)為例
上面的案例分析固然精彩,但是要充分發(fā)揮社會(huì)化聆聽(tīng)在企業(yè)中的業(yè)務(wù)價(jià)值,我們必須將其視為一個(gè)長(zhǎng)期工作,使之“嵌入”到企業(yè)的業(yè)務(wù)流程之中來(lái),為此,我們還得有一套產(chǎn)品化的解決方案。
在這里,筆者結(jié)合自身的工作實(shí)踐,聊聊達(dá)觀數(shù)據(jù)的客戶意見(jiàn)洞察平臺(tái)在這方面的獨(dú)到理解。
基于先進(jìn)的自然語(yǔ)言處理和知識(shí)圖譜技術(shù),達(dá)觀數(shù)據(jù)構(gòu)建了新一代的智能客戶意見(jiàn)洞察平臺(tái)。通過(guò)對(duì)各行業(yè)/領(lǐng)域的社會(huì)化媒體進(jìn)行實(shí)時(shí)數(shù)據(jù)抓取和深度處理,可以幫助政府/企業(yè)及時(shí)、全面、精準(zhǔn)地從海量的數(shù)據(jù)中了解公眾態(tài)度、掌控輿論動(dòng)向、聆聽(tīng)用戶聲音、洞察行業(yè)變化,實(shí)現(xiàn)產(chǎn)品、用戶、渠道、競(jìng)品、危機(jī)感知等多維度的全景分析。
除了一般性的輿情/social listening能力外,達(dá)觀數(shù)據(jù)的客戶意見(jiàn)洞察平臺(tái)還注重如下3個(gè)方面:
3.1 注重?cái)?shù)據(jù)分類的精準(zhǔn)性
在采用先進(jìn)深度學(xué)習(xí)模型的同時(shí),達(dá)觀客戶意見(jiàn)洞察平臺(tái)還有知識(shí)圖譜的“加持”,能最大限度的提升文本預(yù)處理和語(yǔ)義分析階段的文本分類精準(zhǔn)度,使得后續(xù)的統(tǒng)計(jì)和挖掘的結(jié)果具有較高的可信度,從而能放心的將分析結(jié)果應(yīng)用于指導(dǎo)實(shí)踐。
圖23? ?達(dá)觀數(shù)據(jù)的客戶意見(jiàn)洞察平臺(tái)較為注重(文本)數(shù)據(jù)分類的準(zhǔn)確性
3.2 注重文本數(shù)據(jù)的深度挖掘
無(wú)論是圖片數(shù)據(jù)還是語(yǔ)音數(shù)據(jù),后續(xù)還是會(huì)轉(zhuǎn)成文本數(shù)據(jù)進(jìn)行處理,因而文本數(shù)據(jù)的處理是非結(jié)構(gòu)化數(shù)據(jù)的重中之重。達(dá)觀數(shù)據(jù)專注于文本數(shù)據(jù)的處理和挖掘,在許多領(lǐng)域積累了大量成熟、領(lǐng)先的文本智能處理解決方案。除此之外,達(dá)觀客戶意見(jiàn)洞察平臺(tái)在立足業(yè)務(wù)場(chǎng)景的前提下,還廣泛借鑒營(yíng)銷學(xué)、心理學(xué)和咨詢等領(lǐng)域的分析方法和手段,充分挖掘數(shù)據(jù)的業(yè)務(wù)價(jià)值。
圖24? ?咨詢界“法寶”—波士頓診斷矩陣在達(dá)觀客戶意見(jiàn)洞察平臺(tái)中的應(yīng)用
圖25? ?Censydiam可以挖掘用戶在做出購(gòu)買決策時(shí)的深層情感動(dòng)機(jī)
圖26? ?Censydiam消費(fèi)動(dòng)機(jī)模型在旅游領(lǐng)域的應(yīng)用
3.3 注重業(yè)務(wù)分類體系的智能化構(gòu)建
圖27? ?業(yè)務(wù)分類體系一般是符合MECE原則的多層嵌套結(jié)構(gòu)
在很多涉及語(yǔ)義分析的業(yè)務(wù)場(chǎng)景中,建立一個(gè)符合MECE法則(Mutually Exclusive Collectively Exhaustive,中文內(nèi)涵為“相互獨(dú)立,完全窮盡”)的業(yè)務(wù)分類體系至關(guān)重要,因?yàn)樵摌I(yè)務(wù)分類體系體現(xiàn)了企業(yè)對(duì)其自身業(yè)務(wù)的認(rèn)知——產(chǎn)品/品牌/服務(wù)中包含哪些要素,哪些要素是相對(duì)重要的。該業(yè)務(wù)分類體系會(huì)涉及數(shù)據(jù)的收集、預(yù)處理、分析挖掘,以及數(shù)據(jù)結(jié)果呈現(xiàn)等階段,不可謂不重要。? ? ? ?
圖28? ?基于無(wú)監(jiān)督AI算法可以從大量無(wú)標(biāo)注的業(yè)務(wù)語(yǔ)料中發(fā)現(xiàn)潛在的業(yè)務(wù)結(jié)構(gòu)
達(dá)觀客戶意見(jiàn)洞察平臺(tái)在構(gòu)建客戶專屬業(yè)務(wù)指標(biāo)體系方面有著豐富的經(jīng)驗(yàn)。一般的,體系的大體框架會(huì)由客戶方的業(yè)務(wù)人員梳理出來(lái),同時(shí)對(duì)方會(huì)提供的少量語(yǔ)料(或者分類種子詞),達(dá)觀數(shù)據(jù)會(huì)利用先進(jìn)的無(wú)監(jiān)督方法挖掘業(yè)務(wù)體系中的潛在結(jié)構(gòu)(或者擴(kuò)展分類詞匯),輔助業(yè)務(wù)人員歸納符合自身實(shí)際的分類體系,從而提高搭建業(yè)務(wù)分類體系的效率。
圖29? ?達(dá)觀數(shù)據(jù)客戶意見(jiàn)洞察平臺(tái)
基于少許先驗(yàn)知識(shí)(即有一定結(jié)構(gòu)的種子詞匯)的主題模型可以提高主題劃分和主題詞拓展的質(zhì)量。
總體來(lái)說(shuō),達(dá)觀數(shù)據(jù)的客戶意見(jiàn)洞察平臺(tái)充分利用機(jī)器學(xué)習(xí)/深度學(xué)習(xí)、自然語(yǔ)言處理等前沿人工智能技術(shù),形成“聆聽(tīng)—>分析/預(yù)警–>行動(dòng)–>聆聽(tīng)”的業(yè)務(wù)閉環(huán),實(shí)現(xiàn)客戶意見(jiàn)洞察的數(shù)據(jù)采集、數(shù)據(jù)處理、模型構(gòu)建,最終展現(xiàn)可視化智能分析成果。