《機器學習》

1/6ページ

機器學習主題模型之LDA引數求解——Gibbs取樣

  LDA引數推導的Gibbs取樣方法基於馬爾科夫鏈蒙特卡洛方法,因此首先學習MCMC方法。 一、馬爾科夫鏈蒙特卡洛方法 MCMC(Markov Chain Monte Carlo)方法是構造適合的馬爾科夫鏈,使其平穩分佈為待估引數的後驗分佈,抽樣並使用蒙特卡洛方法進行積分計算,實現了抽樣分佈隨模擬 […]

讀“機器學習中的範數規則化之(一)L0、L1與L2範數”筆記

專案中遇到範數正則化問題,今天拜讀了鄒曉藝大神的博文《機器學習中的範數規則化之(一)L0、L1與L2範數》, 1)其中L0、L1主要是用來特徵選擇,能夠將含有資訊量小的特徵權重優化為0,從而降低特徵的維度 2)L2主要是來防止過擬合(其實在實際工程中,有些反而需要我們去過擬合,比如廣告的點選),此正 […]

機器學習之ID3演算法

     決策樹方法在分類、預測、規則提取等領域有著廣泛的應用。ID3演算法的提出後,決策樹在機器學習和資料探勘等領域得到了極大發展。所以ID3演算法非常重要同時也非常基礎。ID3演算法的核心是在決策樹的各級節點上,使用資訊增益方法作為屬性選擇的標準,來幫助確定生成每個節點時所採用的合適屬性。   […]

機器學習 吳恩達 課後習題百度雲資源 (Coursera 搬運)

之前我在網易雲課堂看吳老師的視訊的時候,就一直疑惑為什麼沒有作業。原來網易雲上的是閹割版,作業並不包括在那。後來本人在網上也找了很久很久,最後還是自己搭了V屁恩去到了Coursera。所以為了方便各位愛學習的網友們,在這裡先提供程式設計作業題。暫時只有題目,視以後的情況來定奪是否提供完整題解。 吳老 […]

機器學習之分類學習

本文記錄了一些機器學習的經典模型以及其Python程式碼,主要使用到了sklearn這個庫。 主要內容來源於範淼和李超編著的《Python機器學習及實踐》 所有的資料集都可以從sklearn.datasets中獲得 在評估時,一般使用F1指標,即使用了調和平均數,除了具備平均功能,還會對那些召回率和 […]

機器學習中的正則化項(L1, L2)的理解

正則化(Regularization) 機器學習中幾乎都可以看到損失函式後面會新增一個額外項,常用的額外項一般有兩種,一般英文稱作ℓ1-norm和ℓ2-norm,中文稱作L1正則化和L2正則化,或者L1範數和L2範數。 L1正則化和L2正則化可以看做是損失函式的懲罰項。所謂『懲罰』是指對損失函式中的 […]