r

1/10ページ

基於R語言的缺失值及異常值處理

缺失值 缺失值是指粗糙資料中由於缺少資訊而造成的資料的聚類,分組,刪失或截斷。它指的是現有資料集中某個或某些屬性的值是不完全的。 缺失值的處理方法:對於缺失值的處理,從總體上來說分為刪除存在缺失值的個案和缺失值插補。對於主觀資料,人將影響資料的真實性,存在缺失值的樣本的其他屬性的真實值不能保證,那麼 […]

R語言中缺失值NA的處理

一般在專案中,資料可能會因為裝置故障、未作答問題或誤編碼資料的原因不完整。在R中NA(not available,不可用)表示缺失值。         函式is.na()允許你檢測缺失值是否存在。該函式作用於檢測物件之後將返回一個相同大小的物件,其中缺失值的位置被改寫為true,其他不是缺失值的位置 […]

約翰霍普金斯大學資料科學系列課程

強烈推薦Coursera.org的約翰霍普金大學資料科學系列課程,該系列課程主要使用R作為分析工具,在COURERA上面每1個月推出3門,滾動推出。   資料科學家的工具箱 R 語言程式開發 獲取和整理資料 探索性資料分析 可重複性研究 統計推斷 迴歸模型 實用機器學習 資料產品開發     資料科 […]

時間序列(arima) 支援向量機(svm) 優化=組合預測

看見大家想學習組合預測,我今晚就準備加班,給大家上一個arima svm的組合預測,有什麼不足的請指出了,時間序列是一個大類,我今天主要是給大家展示的是最常用的arima. 這裡原理就不介紹了,只講應用,你可以自己搜尋網上原理或者關注我後面論文,我會專門寫一個原理部分,目前也是幫別人處理的模型,根本 […]

R神經網路程式碼 (對資料有歸一化和反歸一化)

nnet包實現神經網路 看了下網上很多R實現的神經網路都是呼叫包直接做模型,對於神經網路用來預測的程式碼根本沒有進行歸一化和反歸一化的求解,在我直接研究了R的scale函式原理後,我先用它對資料歸一化,他的反歸一化自己寫程式碼實現,R這個功能的實現沒有matlab裡面方面,在matlab裡面直接可以 […]

R利用卷積神經網路做預測

深度學習在過去幾年,由於卷積神經網路的特徵提取能力讓這個演算法又火了一下,其實在很多年以前早就有所出現,但是由於深度學習的計算複雜度問題,一直沒有被廣泛應用。 一般的,卷積層的計算形式為: 其中、x分別表示當前卷積層中第j個特徵、前一層的第i個特徵;k表示當前層的第j個特徵與前一層的第i個特徵之間的 […]

第一章:新版tensorflow入門,對鳶尾花進行分類

1、背景 2018年tensorflow進行了版本升級1.8.0,新版tensorflow對原來版本進行了進一步的封裝,程式設計方式也與之前的內容有了很多的不同。本文介紹在新版TensorFlow 中解決鳶尾花分類問題。 2、新版tensorflow的基本結構 眾所周知,人工智慧的核心組成部分就是模 […]

R線上性迴歸中的應用–分析豆瓣評分與票房之間關係的案例研究

一資料準備 二檢視各國影片的票房概況 三通過簡單線性迴歸研究豆瓣評分與票房之間的關係 四小結 一、資料準備 我們需要的票房資料來自CBO中國票房網,中國票房網記錄了從2008年到目前為止的每年票房排名前25位的資料。豆瓣評分則來自於豆瓣API。最後我通過整合這兩個資料生成了一個名為cmbo_data […]