實戰智慧推薦系統(1)– 個性化推薦系統及其基本推薦演算法

NO IMAGE

個性化推薦系統是建立在海量資料探勘基礎上的一種高階商務智慧平臺,以幫助電子商務網站為其顧客購物提供完全個性化的決策支援和資訊服務。

推薦系統有3個重要的模組:使用者建模模組,推薦物件模組,推薦演算法模組。

主要推薦演算法

1. 基於內容推薦
基於內容推薦是資訊過濾技術的延續與發展,它是建立在專案的內容資訊上作出推斷的,而不需要依據使用者對專案的評價意見,更多的需要用機器學習的方法從關於內容的特徵描述的事件中得到使用者的興趣資料。使用者的資料模型取決於所用學習方法,常用的有決策樹,神經網路和基於向量的表示方法等。基於內容的使用者資料是需要有使用者的歷史資料,使用者資料模型可能隨著使用者偏好的改變而改變。

基於內容推薦方法的優點:
(1)不需要其他使用者的資料,沒有冷開始問題和稀疏問題

(2)能為具有特殊興趣愛好的使用者進行推薦
(3)能推薦新的或者不是很流行的專案,沒有新專案問題
(4)通過列出推薦專案的內容特徵,可以解釋為什麼推薦那些專案
(5)已經有比較好的技術,如關於分類學習方面的技術已相當成熟

缺點是要求內容能容易抽取成有意義的特徵,要求特徵內容有良好的機構性,並且使用者的口味必須能用內容特徵形式來表達,不能顯式的得到其他使用者的判斷情況。

2. 協同過濾推薦
協同過濾推薦技術是推薦系統中應用最早和最為成功的技術之一,它一般採用最鄰近技術,利用使用者的歷史愛好資訊計算使用者之間的距離。然後利用目標使用者的最鄰近使用者對商品的評價的加權評價值來預測目標使用者對特定商品的喜好程度,系統從而根據這一喜好程度來對目標使用者進行推薦。
協同過濾最大的優點是對推薦物件沒有特殊的要求,能處理非結構化的複雜物件,如音樂,電影。基於協同過濾的推薦系統可以說是從使用者的角度來進行相應推薦的,而且是自動的,不需要使用者努力的找到適合自己興趣的推薦資訊,如調查問卷等。
和基於內容的過濾方法對比,協同過濾具有如下的優點:
(1)能夠過濾難以進行機器自動內容分析的資訊,如藝術品,音樂等
(2)共享他人的經驗,避免了內容分析的不完全和不精確
(3)有推薦新資訊的能力,可以發現內容上完全不相似的資訊,使用者對推薦資訊的內容事先是預料不到的,這也是協同過濾基於內容過濾一個較大的差別,可以發現使用者潛在的但自己尚未發現的興趣愛好。

(4)能夠有效的使用其他相似使用者的反饋資訊,減少使用者的反饋量,加快個性化學習的速度。

3. 基於關聯規則推薦
基於關聯規則的推薦是以關聯規則為基礎,把已購商品作為規則頭,規則體為推薦物件。關聯規則挖掘可以發現不同商品在銷售過程中的相關性,在零售業中已經得到了成功的應用。管理規則就是在一個交易資料庫中統計購買了商品集X的交易中有多大比例的交易同時購買了商品集Y,其直觀的意義就是使用者在購買某些商品時有多大的傾向去購買另外一些商品。

演算法的第一步關聯規則的發現最為關鍵且耗時,是演算法的瓶頸,但可以離線進行。

4. 基於效用推薦

基於效用推薦是建立在對使用者使用專案的效用情況上計算的,其核心問題是怎麼樣為每一個使用者去建立一個效用函式。因此,使用者資料模型很大程度上是由系統所採用的效用函式決定的。基於效用推薦的好處是它能把非產品的屬性考慮進去,如供應商的可靠性和產品的可得性等考慮到效用計算中。

5. 基於知識推薦

基於知識推薦在某種程度上可以看成一種推理技術,它不是建立在使用者需要和偏好的基礎上推薦的。基於知識的方法因它們所用的功能知識不同而有明顯的區別。效用知識是一種關於一個專案如何滿足某一特定使用者的知識,因此能解釋需要和推薦的關係。所以使用者資料可以是任何支援推理的知識結構,它可以是使用者已經規範化的查詢,也可以是一個更詳細的使用者需要的表示。

6. 組合推薦
由於各種推薦方法都有優缺點,所以在實際中,組合推薦經常被採用。研究應用最多的是內容推薦和協同過濾推薦的組合。最簡單的做法就是分別用於基於內容的方法和協同過濾的推薦方法去產生一個預測結果,然後用某方法組合其結果。儘管從理論上有很多種推薦組合方法,但在某一具體問題中並不見得都有效,組合推薦的一個重要原則就是通過組合後要能避免或彌補各自推薦技術的弱點。
在組合上,有研究人員提出了七種組合思路
1)加權:加權多種推薦技術的結果
2)變換:根據問題背景和實際情況或要求決定變換採用不同的推薦技術
3)混合:同時採用多種推薦技術給出多種推薦結果為使用者提供參考
4)特徵組合:組合來自不同推薦資料來源的特徵被另一種推薦演算法所採用
5)層疊:先用一種推薦技術產生一種粗糙的推薦結果,第二種推薦技術在這個結果上產生更精確的推薦結果
6)特徵擴充:一種技術產生附加的特徵資訊嵌入到另一種推薦技術的特徵輸入中,感覺有點像特徵組合
7)元級別:用一種推薦方法產生的模型作為另一種推薦方法的輸入