色屁屁www影院免费观看入口,欧美性猛交ⅹxxx乱大交妖精,欧美激情第5页,欧美性猛交xxxx三人,欧美一a级做爰片大开眼界

達觀動態(tài)

達觀愿與業(yè)內(nèi)同行分享 助力各企業(yè)在大數(shù)據(jù)浪潮來臨之際一起破浪前行

打造良性評論社區(qū):達觀數(shù)據(jù)為界面新聞打造全天候反廣告審核機制

?界面新聞

作為上海報業(yè)集團旗下的招牌新媒體,界面新聞自2014年9月創(chuàng)辦以來,熱度一路上升。成立僅短短10個月,界面新聞就拿到了A輪融資,并于去年7月獲得昆侖信托的3億元人民幣B輪融資,業(yè)務持續(xù)擴張,月活現(xiàn)已超過9000萬人次。

《界面》自誕生起就完全扎根于互聯(lián)網(wǎng),以商業(yè)新聞為核心,布局26個內(nèi)容頻道,提供全品類精品新聞資訊,旨在打造中國中產(chǎn)階級第一新聞平臺。然而作為輻射上億用戶的媒體平臺,如何針對海量的用戶交互內(nèi)容進行審核,尤其是杜絕層出不窮的廣告,一直是界面管理層面臨的難題。

 

24小時實時篩選,完勝“人力審核”

在界面新聞的網(wǎng)站和APP上,一篇報道閱讀量達到數(shù)十萬甚至上百萬可以說是家常便飯,并會隨之帶來數(shù)十、上百的用戶評論。每天在界面上新發(fā)出的內(nèi)容數(shù)以百計,由此引發(fā)的評論則是用“成千上萬”來形容一點也毫不夸張。

我們隨機抽取了幾個月的數(shù)據(jù),可以看出,每天的評論量基本都上千,遭遇特殊事件時,評論會急劇增長,碰到特殊情況,廣告也會發(fā)生急劇增長。

ppt配圖222

對于海量的用戶評論,界面新聞之前采用的做法是“人工審核”,通過人力對每條評論進行閱讀,然后根據(jù)規(guī)范性要求決定通過與否。傳統(tǒng)的“人工”操作方法最大的問題是工作量大,審核成本高,并且發(fā)布延遲嚴重。往常來說,一天的內(nèi)容往往需要花幾天的時間才能完成審核。而且人工識別有時難免會有漏網(wǎng)之魚,尤其是碰到摻雜巨量廣告的評論,如圖中截取的特殊時點時,人工識別的出錯率會明顯提高。

“評論識別”是達觀數(shù)據(jù)提供的文本處理服務中的一個重要分支。通過利用強大的自然語言算法后臺,達觀數(shù)據(jù)為界面新聞提供了實時的違規(guī)評論審核篩選服務。

據(jù)界面方面的相關負責人透露,通過使用達觀數(shù)據(jù)的服務,原先需要3、4天來審核的內(nèi)容,現(xiàn)在可以做到高效實時全自動完成,而且“24小時不下班”。同時,文本審核準確率也有明顯提高,比如在識別廣告的抽檢準確率高達99.97%,每審核1000例廣告誤判只有3例。

在具體識別時,達觀數(shù)據(jù)的后臺會自動對一段文本進行評分,比如對“需要資源的+v信 ?we1234”這句用戶評論的審核評分如下,系統(tǒng)會根據(jù)評分將這段文本自動識別為廣告。

QQ圖片20170623182550

此外,針對網(wǎng)絡上層出不窮的新詞、熱詞,達觀數(shù)據(jù)會利用機器學習算法不斷升級文本審核服務,自動升級關鍵詞變形識別策略,自動定位處理涉嫌違規(guī)信息,自動過濾不符合規(guī)定的相關信息。

基于上述技術優(yōu)勢,早在2016年,界面新聞就和達觀數(shù)據(jù)達成了首輪合作。在過去的一年中,界面新聞和達觀數(shù)據(jù)的業(yè)務都成長迅猛。達觀數(shù)據(jù)的算法面對海量不斷更新的文本數(shù)據(jù)體現(xiàn)出良好的適應性,產(chǎn)品性能得到界面新聞的高度認可。雙方延續(xù)“強強合作”的態(tài)勢,為媒體與技術服務商的結合樹立了標桿。

2017年4月,界面新聞和中國領先的文本挖掘服務提供商達觀數(shù)據(jù)繼續(xù)上一年的合約,繼續(xù)由達觀數(shù)據(jù)為界面提供定制的實時文本審核服務,大幅提升界面在內(nèi)容運營上的效率。