rosdiy機器

1/4ページ

機器學習筆記:ID3演算法建立決策樹(一)

ID3演算法的核心思想 以資訊熵的下降速度作為選取測試屬性的標準,所選的測試屬性是從根節點到當前節點的路徑上尚未被考慮的具有最高資訊增益的屬性。 維基百科上對ID3演算法有比較詳細的介紹:ID3維基 計算過程相關公式 xx是一個離散型的隨機變數,其概率分佈為 p(x)=P(X=x),x∈X p(x) […]

機器學習筆記之資訊熵、資訊增益和決策樹(ID3演算法)

決策樹演算法: 優點:計算複雜度不高,輸出結果易於理解,對中間值的缺失不敏感,可以處理不相關的特徵資料。 缺點:可能會產生過度匹配問題。 適用資料型別:數值型和標稱型。 演算法原理: 決策樹是一個簡單的為輸入值選擇標籤的流程圖。這個流程圖由檢查特徵值的決策節點和分配標籤的子葉節點組成。為輸入值選擇標 […]

機器學習筆記-6.5邏輯迴歸的代價函式及其求導

0- 背景 定義邏輯迴歸的代價函式時,不能夠像線性迴歸那樣,否則代價函式變成一個非函式,難以收斂到全域性最優。 1- 線性迴歸代價函式: 線性迴歸中的代價函式: J(θ)=12m∑i=1m(yi−hθ(xi))2 J(\theta )=\frac{1}{2m}\sum_{i=1}^{m}(y^{i} […]

機器學習方法:迴歸(二):稀疏與正則約束ridge regression,Lasso

歡迎轉載,轉載請註明:本文出自Bin的專欄blog.csdn.net/xbinworld。 “機器學習方法“系列,我本著開放與共享(open and share)的精神撰寫,目的是讓更多的人瞭解機器學習的概念,理解其原理,學會應用。希望與志同道合的朋友一起交流,我剛剛設立了了一個技術交流QQ群:43 […]

機器學習方法:迴歸(一):線性迴歸Linear regression

歡迎轉載,轉載請註明:本文出自Bin的專欄blog.csdn.net/xbinworld。 開一個機器學習方法科普系列:做基礎回顧之用,學而時習之;也拿出來與大家分享。數學水平有限,只求易懂,學習與工作夠用。週期會比較長,因為我還想寫一些其他的,呵呵。 content: linear regress […]

機器學習筆記(九)聚類演算法及實踐(K-Means,DBSCAN,DPEAK,Spectral_Clustering)

這一週學校的事情比較多所以拖了幾天,這回我們來講一講聚類演算法哈。 首先,我們知道,主要的機器學習方法分為監督學習和無監督學習。監督學習主要是指我們已經給出了資料和分類,基於這些我們訓練我們的分類器以期達到比較好的分類效果,比如我們前面講的Logistic迴歸啊,決策樹啊,SVM啊都是監督學習模型。 […]

機器學習筆記(三) 線性迴歸及梯度下降演算法

線性迴歸可以說是機器學習演算法中最基礎的一種了,而且我想大部分人在沒有聽說過機器學習的時候就已經學過或者用過這樣的一種方法了。 簡單的來說,線性迴歸就是利用一系列特徵的一個線性組合來進行預測,只有一個特徵的時候,通常稱為一元線性迴歸,多個特徵則稱為多元線性迴歸,通常表示如下。 不過通常我們對線性迴歸 […]

機器學習筆記(一) 邏輯斯蒂迴歸LR

 本文是在學習完李航老師的《統計學習方法》後,在網上又學習了幾篇關於LR的部落格,算是對LR各個基礎方面的一個回顧和總結。 一 簡述   邏輯斯蒂迴歸是一種對數線性模型。經典的邏輯斯蒂迴歸模型(LR)可以用來解決二分類問題,但是它輸出的並不是確切類別,而是一個概率。        在分析LR原理之前 […]

機器學習筆記四:線性迴歸回顧與logistic迴歸

一.再看線性迴歸 之前我們選擇線性迴歸的時候,只是認為那些資料看上去很符合線性的樣子,選擇最小平方損失函式的時候,也是直接提出來的,沒有考慮過為什麼會是這個樣子。接下來就從概率的角度來解釋這些問題。 首先假設目標變數和輸入與下面這個方程相關: 其中是一個誤差項(error term),來捕捉一些我們 […]