機器學習和

1/13ページ

機器學習和資料探勘演算法面試知識點

機器學習演算法 決策樹(DT) ID3: 基於資訊增益的大小來逐層確定分類的特徵。我們知道資訊量的增加能消除對事件的不確定性,因此我們每次選擇資訊增益大的特徵作為分類特徵, 表示引入此特徵後,資訊量增加最多,能把對事件的不確定性降為最低,墒最低。資訊增益g(D,A)(互資訊)由熵H(D)與條件熵H( […]

在機器學習領域,怎樣寫好一篇學術論文

當你做好了一個研究工作, 準備發表出來與同仁們分享, 一個首要的任務是把你的工作變成一篇文章。問題來了,怎樣寫作一篇高質量的文章呢?我們以機器學習領域的應用型文章為例,探討一下論文寫作的問題。注意,任何好的文章都要以好的研究工作為基礎,我們這裡不談你的研究工作質量如何,只討論文章的寫作問題。要把一個 […]

機器學習:過擬合、神經網路Dropout

過擬合 過擬合現象 機器學習中,過擬合現象就是訓練模型高度適用於訓練集,而對測試集或未知資料集效果不好的情況。表現為訓練集過度擬合具有高準確率,而測試集的準確率明顯低於測試集。 防止過擬合 防止過擬合的方法有:增加資料集,正則化方法以及Dropout方法。 1. 增加資料集 資料探勘中,資料量越多, […]

機器學習實戰筆記——利用KNN演算法改進約會網站的配對效果

                                                利用KNN演算法改進約會網站的配對效果 一、案例背景 我的朋友海倫一直使用線上約會網站尋找合適自己的約會物件。儘管約會網站會推薦不同的人選,但她並不是喜歡每一個人。經過一番總結,她發現曾交往過三種型別的人 […]

【機器學習】 Matlab 2015a 自帶機器學習演算法彙總

【引言】 今天突然發現MATLAB 2015a的版本自帶了許多經典的機器學習方法,簡單好用,所以在此撰寫部落格用以簡要彙總(我主要參考了MATLAB自帶的幫助文件)。MATLAB每個機器學習方法都有很多種方式實現,並可進行高階配置(比如訓練決策樹時設定的各種引數),這裡由於篇幅的限制,不再詳細描述。 […]

1 13