機器學習演算法

1/9ページ

機器學習演算法的Python實現 (2):ID3決策樹

本文資料參照 機器學習-周志華 一書中的決策樹一章。可作為此章課後習題3的答案 程式碼參考了《機器學習實戰》一書的內容,並做了不少修改。使其能用於同時包含離散與連續特徵的資料集。 本文使用的Python庫包括 numpy pandas math operator matplotlib 本文所用的資料 […]

機器學習—決策樹(ID3,C4.5)演算法解析

機器學習—決策樹(ID3,C4.5)演算法解析 Label 機器學習 決策樹 解析 決策樹實現思路:假設有已知的資料集X【例如某些人的集合,資料內容包括用於描述他們的特徵屬性及特徵屬性值,如性別(男|女),年齡(整數),收入(較低|中等|較高)等】,以及資料集的分類標籤Y【是否是某俱樂部的成員(是| […]

機器學習演算法總結

機器學習(Machine Learning, ML)是一門多領域交叉學科,涉及概率論、統計學、逼近論、凸分析、演算法複雜度理論等多門學科。專門研究計算機怎樣模擬或實現人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的效能。嚴格的定義:機器學習是一門研究機器獲取新知識和新技 […]

機器學習中的分類演算法

機器學習中的分類演算法 機器學習,模式識別中很重要的一環,就是分類,因為計算機其實無法深層次地理解文字圖片目標的意思,只能回答是或者不是。當然現在卷積神經網路正在希望計算機能夠看懂東西,這次我們先來看一些一些簡單的分類演算法。 樸素貝葉斯 說到樸素貝葉斯,先說一下貝葉斯定理,首先要解釋的就是條件概率 […]

機器學習常見演算法優缺點總結

K近鄰:演算法採用測量不同特徵值之間的距離的方法進行分類。 優點: 1.簡單好用,容易理解,精度高,理論成熟,既可以用來做分類也可以用來做迴歸; 2.可用於數值型資料和離散型資料; 3.訓練時間複雜度為O(n);無資料輸入假定; 4.對異常值不敏感 缺點: 1.計算複雜性高;空間複雜性高; 2.樣本 […]

機器學習演算法優缺點及其應用領域

原文連結:http://bbs.pinggu.org/thread-2604496-1-1.html 1決策樹(Decision Trees)的優缺點 決策樹的優點: 一、           決策樹易於理解和解釋.人們在通過解釋後都有能力去理解決策樹所表達的意義。 二、           對於決 […]

機器學習演算法之樸素貝葉斯(Naive Bayes)–第一篇

引言 先前曾經看了一篇文章,一個老外程式設計師寫了一些很牛的Shell指令碼,包括晚下班自動給老婆發簡訊啊,自動衝Coffee啊,自動掃描一個DBA發來的郵件啊, 等等。於是我也想用自己所學來做一點有趣的事情。我的想法如下: 首先我寫個scrapy指令碼來抓取某個網站上的笑話 之後寫個Shell指令 […]

機器學習演算法-樸素貝葉斯Python實現

引文:前面提到的K最近鄰演算法和決策樹演算法,資料例項最終被明確的劃分到某個分類中,下面介紹一種不能完全確定資料例項應該劃分到哪個類別,或者說只能給資料例項屬於給定分類的概率。 基於貝葉斯決策理論的分類方法之樸素貝葉斯 優點:在資料較少的情況下仍然有效,可以處理多類別問題 缺點:對於輸入資料的準備方 […]

支援向量機SVM推導及求解過程

        支援向量機是屬於原創性、非組合的具有明顯直觀幾何意義的分類演算法,具有較高的準確率。         使用SVM演算法的思路:(1)簡單情況,線性可分情況,把問題轉化為一個凸優化問題,可以用拉格朗日乘子法簡化,然後用既有的演算法解決;(2)複雜情況,線性不可分,用核函式將樣本投射到高 […]

機器學習演算法與Python實踐之(四)支援向量機(SVM)實現

機器學習演算法與Python實踐之(四)支援向量機(SVM)實現 [email protected] http://blog.csdn.net/zouxy09          機器學習演算法與Python實踐這個系列主要是參考《機器學習實戰》這本書。因為自己想學習Python,然後也想對一些機器學習演算 […]