ml

1/8ページ

ML的45問(2)——ID3演算法詳解

1. 寫在前面 這次我們主要介紹關於決策樹的相關問題,尤其是針對ID3演算法的一些問題進行相應的解答。 2. ID3演算法過程 ID3的能處理的資料都是離散值的。接下來我們看演算法: 建立Root結點 如果Example都為正, 那麼返回label=正的單節點數Root 如果Example都為副, […]

  • 2018.08.03
  • ,

Subgradient

1、次梯度定義: 2、次梯度是一個集合。 經常用在凸優化問題中,我們經常想要求一個函式對某個變數的梯度,但如果這個函式是不可微分的呢。就可以採用次梯度方法 一個函式的次梯度是一個集合[a,b],a表示導數的左極限,b表示導數的右極限,就是這麼一個區間的集合。 如果函式可微,那麼次梯度集合裡面只有一個 […]

  • 2018.08.01
  • ,

Q-learning 學習心得

首先先說明一下強化學習的概念,通俗的講,強化學習就是通過agent,也就是動作的發起者,對環境造成一個影響,環境接受該動作後狀態發生變化,同時產生一個強化訊號(獎或懲)反饋給Agent,Agent根據強化訊號和環境當前狀態再選擇下一個動作,選擇的原則是使受到正強化(獎)的概率增大。選擇的動作不僅影響 […]

  • 2018.08.01
  • ,

Q-Learning分析

Q-Learning演算法詳解: 參考博文:1、http://blog.csdn.NET/pi9nc/article/details/27649323  2、http://mnemstudio.org/path-finding-q-learning-example-1.htm JAVA程式碼 imp […]

機器學習之-分類效能指標-準確率-召回率-ROC曲線

1、最簡單的分類效能指標就是錯誤率,即在所有測試樣例中錯分的樣例比例。 2、在機器學習中有一個普遍適用的稱為混淆矩陣的工具,它可以幫助人們更好地瞭解分類中的錯誤,比如一個三分類問題: 3、對於一個二分類,它的混淆矩陣比較簡單: 在這個例子中,如果將一個正例預判為正例,則認為產生了一個真正例(True […]

Facenet 原理介紹

引子[編輯 | 編輯原始碼] 這篇wiki主要介紹facenet人臉相似比較的基本原理,另外兩篇wiki主要介紹基於tensorflow實現facenet的準確率測試及原始碼解讀。   經過在網上的一番搜尋,找到了facenet實現人臉聚類的論文和論文解讀,以及github上根據facenet論文並 […]

深度學習(Deep Learning)讀書思考七:迴圈神經網路二(LSTM)

概述 通過前一節對迴圈神經網路RNN的瞭解,簡單的RNN雖然能夠解決長期依賴問題,但是訓練和優化比較困難,然後長短時記憶模型LSTM很大程度上解決長期依賴問題,本文主要介紹 1.LSTM的提出 2.LSTM網路結構 3.LSTM的分析 LSTM的提出 早在94年Hochreiter發現了RNN訓練過 […]