NO IMAGE

網址: http://study.163.com/course/courseLearn.htm?courseId=321007#/learn/video?lessonId=435079&courseId=321007
 
4.1 位置拍賣理論

搜尋廣告:多個位置聯合拍賣,可以一個不出
展示廣告:單個位置,通常一定要出
對稱納什均衡:廣告系統的設計目標

定價機制
VCG機制:收費應等於對別人帶來的價值損害;truth-telling
Generalized Second Price:廣義第二高價,不是truth-telling
第一高價
4.2 Ad Network
淡化廣告位概念
計價方式為CPC
不支援定製化使用者劃分
4.3 廣告檢索

布林表示式
DNF格式;conjunction;assignment
index:2層索引
長query,每個term都是should
有效剪枝演算法:需要相關性函式是線性
WAND(weighted and)演算法
4.4 流量預測

query為ad,對(u, c)聯合空間做retrieval
SUM impression(c) * p(price_a – eCPM_c)
4.5 ZooKeeper介紹

分散式環境下解決一致性:訊息傳遞機制

Paxos演算法
Proposer(n, value): 
Acceptor:一次任務只批准一個value
Learner:只獲得被批准的提案
兩段式提交
4.6 點選率預測

Regression vs Ranking

Cold start問題

Online learning

4.7 邏輯迴歸

Logistic Regression
Generalized Linear Model 在Binomial error時的特例
Maximum Entropy Model在class=2時的特例。ME=Logistic Disriminate Analysis? 
優化方法
IIS
BFGS:Quasi-Newton的一種,模擬一個Hession矩陣
L-BFGS:limited memory, 對Hession矩陣的逆矩陣降維
ADMM分散式解法
4.8 動態特徵

在組合維度上的歷史統計值

5.1 探索與利用

Multi-arm Bandit(老虎機)
epsilion-greedy: 使用小流量做探索
UCB(upper confidence bound)策略
linUCB: contextual bandit,使用特徵適量代替bound
5.2 搜尋廣告

特性
使用者標籤不重要,因為query太強
使用者短時搜尋行為比較重要
問題
Query expansion:
搜尋日誌,做cf
文件集合,做topic model
廣告日誌,按eCPM排序
搜尋廣告個性化
搜尋結果不宜做深度個性化
廣告內容個性化效果有限,但廣告條數可以做個性化
短時使用者行為
同一個session內的行為
需要分鐘級別,甚至秒級別,需要流式計算平臺
5.3 流式計算平臺

S4 vs Strom
S4:全記憶體,吞吐量大,程式設計麻煩,可能丟資料
Strom:可能排程磁碟,程式設計介面類似hadoop,保證不遺漏
Strom
spout、bolt
類似map/reduce架構
排程資料,而不是排程計算
只適用處理實時資料,資料規模不能太大。(適合online learning?)
5.4 廣告購買平臺(Trading desk)
universal marketplace
非RTB流量的ROI優化
關鍵問題
例如SEM選詞
展示廣告的關鍵片語合
合理的出價
代表公司
EfficientFrontier
核心技術是Portfolio Optimization,和資料積累
被Adobe Omniture收購,改為Adobe Adlens
國外4A公司從廣告商收取17.6%費用,國內只有從百度拿6%返點

6.1 廣告交易市場

實時競價通常按照CPM收費

Ad exchange代表公司
RightMedia, Google Adx, AdECN, OpenX
6.2 實時競價
cookie mapping
ad call
對demand更有利,CTR的估計和點選的價值都交給deman來做

DMP的作用是提高精準性和市場流動性

6.3 Cookie Mapping

beacon(smart pixel):1×1或0x0的不可見畫素

三個問題:誰發起?在哪兒發起?誰儲存mapping表?
DSP-Demand site-Adx,存在DSP
DMP-Supply site,存在Supply
6.4 SSP

以優化媒體收益為目標
靈活接入和管理多種變現方式
Yield Optimizer:收入優化
代表公司:
Google AdMeld
6.5 DSP
支援定製化使用者劃分
跨媒體流量採購
代表公司
InviteMedia,MediaMath
6.6 DSP流量預測

難點:dsp只能拿到贏得的流量,不能獲取全部流量

6.7 DSP點選價值估計

挑戰
極為稀疏的訓練資料
轉化是與廣告主型別密切相關
原則
用較大的bias換取較小的variance,達到穩健估計
利用廣告商型別的層級結構特徵,以及轉化流程的特徵
6.8 DSP重定向
site retargeting
search retargeting
personalized retargeting: off-site recommendation
推薦演算法:SVD 的思想

代表公司
Magnetic:search retargeting
Criteo:站外推薦的個性化重定向
動態創意;廣告主商品庫的準實時feed介面;
採購媒體的優選CPM
不使用cross-site的資料:廣告主的資料安全很重要,不能倒賣客戶
Look-alike(新客推薦):利用種子使用者;利用客戶自定義標籤

6.9 demand端推薦方法
站內推薦
站外個性化重定向
新客推薦
6.10 廣告流量交易方式
優先銷售Premium Sale:品牌溢價
CPT
GD:Ad Server
程式交易Programmatic Trade:偏向Demand的方向
Network optimization:Ad Network
Preferred(優選)
RTB:Ad Exchange