高斯混合模型(Gaussian Mixture Model)通常簡(jiǎn)稱GMM,是一種業(yè)界廣泛使用的聚類算法,該方法使用了高斯分布作為參數(shù)模型,并使用了期望最大(Expectation Maximization,簡(jiǎn)稱EM)算法進(jìn)行訓(xùn)練。本文對(duì)該方法的原理進(jìn)行了通俗易懂的講解,期望讀者能夠更……
在剛剛過(guò)去的由神策數(shù)據(jù)舉辦的年度數(shù)據(jù)分析行業(yè)盛會(huì)—— 2017 數(shù)據(jù)驅(qū)動(dòng)大會(huì)上,達(dá)觀數(shù)據(jù)創(chuàng)始人兼CEO陳運(yùn)文,作為自然語(yǔ)言處理領(lǐng)域的專家受邀出席了本次會(huì)議。并在人工智能分論壇上進(jìn)行了題為《文本挖掘技術(shù)幫助企業(yè)智能化運(yùn)營(yíng)》的精彩演講。在這次為期兩天的……
word2vec是Google研究團(tuán)隊(duì)的成果之一,它作為一種主流的獲取分布式詞向量的工具,在自然語(yǔ)言處理、數(shù)據(jù)挖掘等領(lǐng)域有著廣泛的應(yīng)用。達(dá)觀數(shù)據(jù)的文本挖掘業(yè)務(wù)有些地方就使用了該項(xiàng)技術(shù)。本文從以下幾個(gè)方面簡(jiǎn)要介紹Word2vec的skip-gram模型: ? 第一部分……
眾所周知,YouTube是世界上最大的視頻網(wǎng)站,網(wǎng)站每天要面對(duì)著不同興趣的用戶,它需要從視頻池中撈出當(dāng)前用戶感興趣,想看的視頻,以留住老用戶吸引新用戶,而這個(gè)功能就是視頻推薦系統(tǒng)提供的。 而隨著不同算法技術(shù)的興起,推薦系統(tǒng)的核心算法也在發(fā)……
Lucene是一個(gè)高性能、可伸縮的信息搜索(IR)庫(kù)。它可以為你的應(yīng)用程序添加索引和搜索能力。Lucene是用java實(shí)現(xiàn)的、成熟的開(kāi)源項(xiàng)目,是著名的Apache Jakarta大家庭的一員,并且基于Apache軟件許可。同樣,Lucene是當(dāng)前非常流行的、免費(fèi)的Java信息搜索(IR)庫(kù)……
【作者簡(jiǎn)介】 劉光敏:?達(dá)觀數(shù)據(jù)搜索組研發(fā)技術(shù)人員,負(fù)責(zé)搜索引擎架構(gòu)的設(shè)計(jì)和研發(fā),搜索集群健康狀況監(jiān)控模塊的開(kāi)發(fā)及維護(hù)等。 前言 Lucene是一個(gè)高性能、可伸縮的信息搜索(IR)庫(kù)。它可以為你的應(yīng)用程序添加索引和搜索能力。Lucene是用java實(shí)現(xiàn)的……
推薦系統(tǒng)需要根據(jù)用戶的歷史行為和興趣預(yù)測(cè)用戶未來(lái)的行為和興趣。但對(duì)于新用戶而言,沒(méi)有任何的用戶行為,如何進(jìn)行最有效的推薦呢?這就衍生了用戶冷啟動(dòng)問(wèn)題。 在當(dāng)下,企業(yè)拉新成本越來(lái)越高,用戶的選擇面也越來(lái)越多,當(dāng)新用戶到達(dá)之后,如果不能很快捕……
互聯(lián)網(wǎng)時(shí)代,信息紛繁海量,人們通過(guò)搜索引擎直達(dá)“心中所想”已是常態(tài)。那么搜索引擎到底是如何高效查找目標(biāo)內(nèi)容呢?本文主要介紹搜索引擎里一個(gè)比較重要的結(jié)構(gòu)——倒排索引。 1 倒排索引簡(jiǎn)介 倒排索引(英文:Inverted Index),是一種索引方法,常被用于全……
人工智能(Artificial Intelligence,簡(jiǎn)稱AI),是研究、開(kāi)發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門(mén)新的技術(shù)科學(xué)。既然是期望讓計(jì)算機(jī)智能系統(tǒng)來(lái)代替人的腦力勞動(dòng),自動(dòng)化的從事的各項(xiàng)工作,那么如何來(lái)衡量人工智能的實(shí)際水平呢……
? 1.?前言 互聯(lián)網(wǎng)技術(shù)和大數(shù)據(jù)技術(shù)的迅猛發(fā)展正在時(shí)刻改變我們的生活,視頻網(wǎng)站、資訊app、電商網(wǎng)站等每天都有大量的活躍用戶在不斷的產(chǎn)生海量的用戶行為,同時(shí),每天又都產(chǎn)生大量的新增PGC或者UGC內(nèi)容(如小說(shuō)、資訊文章、短視頻等)。 從推薦系統(tǒng)的角度來(lái)……
詳盡的技術(shù)文檔
長(zhǎng)期開(kāi)發(fā)維護(hù)
定制培訓(xùn)和報(bào)告
毫秒級(jí)數(shù)據(jù)反饋
達(dá)觀微信公眾帳號(hào)