利用機器學習演算法

機器學習演算法優缺點及其應用領域

原文連結:http://bbs.pinggu.org/thread-2604496-1-1.html 1決策樹(Decision Trees)的優缺點 決策樹的優點: 一、           決策樹易於理解和解釋.人們在通過解釋後都有能力去理解決策樹所表達的意義。 二、           對於決 […]

機器學習演算法(二) KNN演算法

前言 KNN(K-Nearest Neighbor)演算法是機器學習中演算法中最基礎和簡單的演算法之一。它既能用於分類,也能用於迴歸。本文將在不同的小節詳細地介紹 KNN 演算法在分類和迴歸兩種任務下的運用原理。 KNN 演算法的思想非常簡單:對於任意的 n 維輸入向量,其對應於特徵空間一個點,輸出 […]

機器學習演算法-決策樹(二)

決策樹方法最早產生於上世紀60年代,到70年代末。由J Ross Quinlan提出了ID3演算法,此演算法的目的在於減少樹的深度。但是忽略了葉子數目的研究。C4.5演算法在ID3演算法的基礎上進行了改進,對於預測變數的缺值處理、剪枝技術、派生規則等方面作了較大改進,既適合於分類問題,又適合於迴歸問 […]

機器學習演算法(伍)Naive Bayes 演算法

引言 樸素貝葉斯(Naive Bayes)演算法是機器學習中常見的基本演算法之一,它主要被用來做分類任務。其理論基礎是基於貝葉斯定理和條件獨立性假設的一種分類方法。對於給定的訓練資料集: 基於以上的解釋,我們知道:(1)該演算法的理論核心是貝葉斯定理;(2)它是基於條件獨立性假設這個強假設基礎之上的 […]

機器學習演算法(三) 邏輯迴歸(LR)

邏輯迴歸模型 邏輯迴歸也被稱為對數機率迴歸,對於初學者來說這裡需要注意:演算法名雖然叫做邏輯迴歸,但是該演算法是分類演算法,我個人認為這是因為邏輯迴歸用了和迴歸類似的方法來解決了分類問題。 邏輯迴歸的損失函式 邏輯迴歸的模型求解 邏輯迴歸演算法實戰 from sklearn.linear_model […]

機器學習演算法(八)神經網路——深度學習的基礎

前言 隨著近年來人工智慧技術的飛速發展,以深度學習為代表的 AI 技術越來越成為網際網路公司的必爭技術高地:百度高調宣佈 All In AI,騰訊、阿里、京東均成立 AI Lab。不錯,正是由於深度學習的能力十分強大,在各種領域打敗傳統機器學習演算法,加速 AI 技術在各種實際應用場景的落地,尤其是 […]

機器學習演算法(九)特徵降維——PCA 與 LDA

前言 在做任何機器學習演算法訓練之前,無論該演算法模型是分類、迴歸還是聚類,我們都需要從原始資料中提取資料特徵,然後將提取的特徵組合成特徵向量的形式輸入到模型中進行訓練。但是現實中往往會存在這麼一個問題:原始資料特徵的維度特別高,不利於模型的訓練。這時候我們需要對原始資料的特徵向量進行降維處理,然後 […]