十大機器學習演算法

1/5ページ

機器學習演算法的Python實現 (2):ID3決策樹

本文資料參照 機器學習-周志華 一書中的決策樹一章。可作為此章課後習題3的答案 程式碼參考了《機器學習實戰》一書的內容,並做了不少修改。使其能用於同時包含離散與連續特徵的資料集。 本文使用的Python庫包括 numpy pandas math operator matplotlib 本文所用的資料 […]

機器學習演算法總結

機器學習(Machine Learning, ML)是一門多領域交叉學科,涉及概率論、統計學、逼近論、凸分析、演算法複雜度理論等多門學科。專門研究計算機怎樣模擬或實現人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的效能。嚴格的定義:機器學習是一門研究機器獲取新知識和新技 […]

機器學習演算法優缺點及其應用領域

原文連結:http://bbs.pinggu.org/thread-2604496-1-1.html 1決策樹(Decision Trees)的優缺點 決策樹的優點: 一、           決策樹易於理解和解釋.人們在通過解釋後都有能力去理解決策樹所表達的意義。 二、           對於決 […]

機器學習演算法之樸素貝葉斯(Naive Bayes)–第一篇

引言 先前曾經看了一篇文章,一個老外程式設計師寫了一些很牛的Shell指令碼,包括晚下班自動給老婆發簡訊啊,自動衝Coffee啊,自動掃描一個DBA發來的郵件啊, 等等。於是我也想用自己所學來做一點有趣的事情。我的想法如下: 首先我寫個scrapy指令碼來抓取某個網站上的笑話 之後寫個Shell指令 […]

機器學習演算法-樸素貝葉斯Python實現

引文:前面提到的K最近鄰演算法和決策樹演算法,資料例項最終被明確的劃分到某個分類中,下面介紹一種不能完全確定資料例項應該劃分到哪個類別,或者說只能給資料例項屬於給定分類的概率。 基於貝葉斯決策理論的分類方法之樸素貝葉斯 優點:在資料較少的情況下仍然有效,可以處理多類別問題 缺點:對於輸入資料的準備方 […]

機器學習演算法與Python實踐之(四)支援向量機(SVM)實現

機器學習演算法與Python實踐之(四)支援向量機(SVM)實現 [email protected] http://blog.csdn.net/zouxy09          機器學習演算法與Python實踐這個系列主要是參考《機器學習實戰》這本書。因為自己想學習Python,然後也想對一些機器學習演算 […]

機器學習演算法及程式碼實現–支援向量機

機器學習演算法及程式碼實現–支援向量機 1、支援向量機 SVM希望通過N-1維的分隔超平面線性分開N維的資料,距離分隔超平面最近的點被叫做支援向量,我們利用SMO(SVM實現方法之一)最大化支援向量到分隔面的距離,這樣當新樣本點進來時,其被分類正確的概率也就更大。我們計算樣本點到分隔超平面的函式間隔 […]

機器學習演算法及程式碼實現–K鄰近演算法

機器學習演算法及程式碼實現–K鄰近演算法 1、K鄰近演算法 將標註好類別的訓練樣本對映到X(選取的特徵數)維的座標系之中,同樣將測試樣本對映到X維的座標系之中,選取距離該測試樣本歐氏距離(兩點間距離公式)最近的k個訓練樣本,其中哪個訓練樣本類別佔比最大,我們就認為它是該測試樣本所屬的類別。 2、演算 […]

機器學習演算法及程式碼實現–迴歸演算法

機器學習演算法及程式碼實現–迴歸演算法 1 線性迴歸 線性迴歸假設特徵和結果滿足線性關係。其實線性關係的表達能力非常強大,每個特徵對結果的影響強弱可以由前面的引數體現,而且每個特徵變數可以首先對映到一個函式,然後再參與線性計算。這樣就可以表達特徵與結果之間的非線性關係。 假設有一個房屋銷售的資料如下 […]