推薦系統

1/2ページ

Hulu(北京)推演算法負責人周涵寧:怎樣應對基於深度學習的視訊推系統

本文僅用於學習和交流目的,不得用於商業目的。非商業轉載請註明作譯者、出處,並保留本文的原始連結:http://www.ituring.com.cn/art… 周涵寧,本科畢業於清華大學自動化系,於美國伊利諾伊大學香檳分校獲得計算機視覺領域博士學位。 曾擔任富士施樂矽谷研究中心研究員、亞馬 […]

用python寫一個簡單的推系統

前言 在上篇文章豆瓣電影,電視劇DM實戰中提及到,我和室友們產生了劇荒,萌生出要做一個個人用的推薦系統,解決劇荒的問題的想法,經過一輪的死纏爛打,這個個人推薦系統終於成型了。 今天來分享一下心得,對此感興趣的朋友可以自己對著寫一個。 傳統推薦系統演算法 首先介紹一下傳統的推薦系統方法,之所以叫它傳統 […]

推系統技術文字相似性計算(三)實戰篇

前兩篇可以直接看我的專欄或者文字相似性計算(一)文字相似性計算(二)前面說了兩篇了,分別介紹了TFIDF 得到的tain_set就是原始語料 將語料匯入詞典後,每個詞實際上就已經被編號成1,2,3….這種編號了,這是向量化的第一步,然後把詞典儲存下來。然後生成數字語料 corpus = […]

倪江利:魅族推平臺的架構演進之路

摘要:魅族擁有超大規模的使用者量及海量資料,魅族推薦平臺實現了在海量的資料中對演算法模型進行線上及離線訓練,在高併發的場景下實時進行預測為使用者推薦更感興趣的資訊。同時支撐多演算法組合A/B測試,以供演算法進行線上實驗,並能線上進行動態機器資源分配以達到資源的最大化利用。 魅族整個產品線都有用到推薦 […]

推系統從零到一

可以說是全拜谷歌吹起了「大資料」這陣春風,近幾年業界對於資料探勘人才的需求持續高漲,而推薦系統一直是資料探勘崗位的必修課。一聯絡到資料探勘,總會給人高深莫測的錯覺,以為推薦系統也是數學神童的專屬領域。萬萬沒想到,自己並不是資料探勘科班出身,也談不上數學功底有多好(本科考高數也就在生死邊緣),竟然也操 […]

simhash中如何儲存資訊等

按照Charikar在論文中闡述的,64位simhash,海明距離在3以內的文字都可以認為是近重複文字。當然,具體數值需要結合具體業務以及經驗值來確定。   使用上述方法產生的simhash可以用來比較兩個文字之間的相似度。問題是,如何將其擴充套件到海量資料的近重複檢測中去呢?譬如說對於64位的待查 […]

使用Elasticsearch實現推薦系統

聚合:找出喜歡這部電影的人們同時還喜歡哪些電影        假設你運營了一個電影網站,你有很多使用者,並且想知道如何推薦給這些使用者他們喜歡的電影。一個辦法是,把每個使用者作為一個文件建立索引,如下所示(movies_liked被設定為被分詞的欄位,並且用於搜尋): PUT recs/user/1 […]

Hulu(北京)推薦演算法負責人周涵寧:怎樣應對基於深度學習的視訊推薦系統

本文僅用於學習和交流目的,不得用於商業目的。非商業轉載請註明作譯者、出處,並保留本文的原始連結:http://www.ituring.com.cn/art… 周涵寧,本科畢業於清華大學自動化系,於美國伊利諾伊大學香檳分校獲得計算機視覺領域博士學位。 曾擔任富士施樂矽谷研究中心研究員、亞馬 […]

倪江利:魅族推薦平臺的架構演進之路

摘要:魅族擁有超大規模的使用者量及海量資料,魅族推薦平臺實現了在海量的資料中對演算法模型進行線上及離線訓練,在高併發的場景下實時進行預測為使用者推薦更感興趣的資訊。同時支撐多演算法組合A/B測試,以供演算法進行線上實驗,並能線上進行動態機器資源分配以達到資源的最大化利用。 魅族整個產品線都有用到推薦 […]