實戰可依賴的20本大資料書籍(收藏)

NO IMAGE

前言

書要讀懂,先求不懂。 因為很多人私信問我大資料應該讀什麼書比較好,所以小編特意找了二十本大資料實戰可依賴的書籍,想要轉職或者深入學習大資料的朋友可以注意了,點贊收藏加轉發,鼓勵一下小編的良苦用心

分享之前我還是要推薦下我自己建立的大資料學習交流Qun531629188

無論是大牛還是想轉行想學習的大學生

小編我都挺歡迎,今天的已經資訊上傳到群檔案,不定期分享乾貨,

包括我自己整理的一份最新的適合2018年學習的大資料教程,歡迎初學和進階中的小夥伴。

1、網際網路大規模資料探勘與分散式處理

作者:Jure Leskovec,Anand Rajaraman,Jeffrey David Ullman

譯者:王斌

書號:978-7-115-39525-2

定價:79

頁數:388

暢銷書全新升級,新增影響與同質性、社交媒體推薦和行為分析等超實用內容

涵蓋解決資料探勘核心問題所用演算法,及實際應用資料探勘所需知識,理論與實現並重

斯坦福大學資料探勘方向專家Jure Leskovec、Anand Rajaraman、Jeffrey David Ullman重磅力作

http://www.ituring.com.cn/book/1561

2、資料探勘導論(完整版)

作者:Jure Leskovec,Anand Rajaraman,Jeffrey David Ullman

譯者:範明 範巨集建

書號:978-7-115-24100-9

定價:69

頁數:480

本書全面介紹了資料探勘的理論和方法,旨在為讀者提供將資料探勘應用於實際問題所必需的知識。

本書涵蓋五個主題:資料、分類、關聯分析、聚類和異常檢測。除異常檢測外,每個主題都包含兩章:前面一章講述基本概念、代表性演算法和評估技術,後面一章較深入地討論高階概念和演算法。目的是使讀者在透徹地理解資料探勘基礎的同時,還能瞭解更多重要的高階主題。此外,書中還提供了大量示例、圖表和習題。

http://www.ituring.com.cn/book/83

3、資料科學實戰

作者:Cathy O’Neil,Rachel Schutt

譯者:王群鋒 馮凌秉

書號:978-7-115-38349-5

定價:69

頁數:312

英文原版資料探勘和演算法類暢銷書,隨機模型類No.1

谷歌、微軟、eBay資料科學家通過實際案例分享演算法、方法與模型

MIT數學博士後Cathy O’Neil,前谷歌高階統計師、哥倫比亞大學講師Rachel Schutt力作

http://www.ituring.com.cn/book/1193

4、命令列中的資料科學

作者:Jeroen Janssens

譯者:王曉偉 劉峰

書號:978-7-115-39168-1

定價:49

頁數:188

本書講解眾多實用的命令列工具。無論使用Windows、OS X,還是Linux,都可以安裝包含80多個命令列工具的“資料科學工具箱”,迅速建立自己的資料分析環境。

http://www.ituring.com.cn/book/1539

5、重新設計網際網路

作者:徐立冰

書號:978-7-115-31150-4

定價:59.00

頁數:312

“彎曲評論”網站“撥雲見日”系列熱文加量10倍的強烈之書首次完整呈現。

雲端計算時代,網路面臨怎樣的挑戰?大資料之下,網路設計應著眼何處?虛擬化的最後1000米你該如何衝刺?OpenFlow、FCoE、LISP、FabricPath、VN-Tag、VPLS、VXLAN

……當所有這一切結合到一起,你將面臨怎樣的情形?

是時候,重新設計網際網路。

通過閱讀本書,讀者將清楚地瞭解到如何在雲端計算與大資料時代構建安全、可靠、高速與靈活的網路。

http://www.ituring.com.cn/book/966

5、機器學習入門第一書

作者:杉山將

譯者:許永偉

書號:978-7-115-38802-5

定價:49

頁數:240

最簡單的機器學習入門書,187張圖輕鬆入門

覆蓋機器學習中最經典、用途最廣的演算法

提供可執行的Matlab程式程式碼

本書用豐富的圖示,從最小二乘法出發,對基於最小二乘法實現的各種機器學習演算法進行了詳細的介紹。第Ⅰ部分介紹了機器學習領域的概況;第Ⅱ部分和第Ⅲ部分分別介紹了各種有監督的迴歸演算法和分類演算法;第Ⅳ部分介紹了各種無監督學習演算法;第Ⅴ部分介紹了機器學習領域中的新興演算法。書中大部分演算法都有相應的MATLAB程式原始碼,可以用來進行簡單的測試。

http://www.ituring.com.cn/book/1371

7、機器學習系統設計

作者:Willi Richert,Luis Pedro Coelho

譯者:劉峰

書號:978-7-115-35682-6

定價:49

頁數:224

微軟Bing核心團隊成員推出

聚焦演算法編寫和程式設計方式

結合大量例項學會解決實際問題

本書將向讀者展示如何從原始資料中發現模式,首先從Python與機器學習的關係講起,再介紹一些庫,然後就開始基於資料集進行比較正式的專案開發了,涉及建模、推薦及改進,以及聲音與影象處理。通過流行的開源庫,我們可以掌握如何高效處理文字、圖片和聲音。同時,讀者也能掌握如何評估、比較和選擇適用的機器學習技術。

http://www.ituring.com.cn/book/1192

8、機器學習實戰

作者:Peter Harrington

譯者:李銳 李鵬等

書號:978-7-115-31795-7

定價:69

頁數:332

最暢銷機器學習圖書

介紹並實現機器學習的主流演算法

面向日常任務的高效實戰內容

全書通過精心編排的例項,切入日常工作任務,摒棄學術化語言,利用高效的可複用Python程式碼來闡釋如何處理統計資料,進行資料分析及視覺化。通過各種例項,讀者可從中學會機器學習的核心演算法,並能將其運用於一些策略性任務中,如分類、預測、推薦。另外,還可用它們來實現一些更高階的功能,如彙總和簡化等。

http://www.ituring.com.cn/book/1021

9、R語言入門

作者:Richard Cotton

譯者:劉軍

書號:978-7-115-35170-8

定價:69

頁:360

語言幽默,通俗易懂

完美講述R 核心元件

示例豐富,快學快用

“這本書讀起來感覺棒極了,示例完整清晰,內容通俗易懂,是目前市面上介紹R核心元件最優秀的圖書之一。”

——Rebecca Smith,TDX 公司分析經理

http://www.ituring.com.cn/book/1187

10、R語言實戰

作者:Robert I. Kabacoff

譯者:高濤 肖楠 陳鋼

書名:978-7-115-29990-1

定價:79

頁數:408

本書從解決實際問題入手,儘量跳脫統計學的理論闡述來討論R語言及其應用,講解清晰透澈,極具實用性。通讀本書,你將全面掌握使用R語言進行資料分析、資料探勘的技巧,並領略大量探索和展示資料的圖形功能,從而更加高效地進行分析與溝通。

http://www.ituring.com.cn/book/857

11、Hadoop基礎教程

作者:Garry Turkington

譯者:張治起

書號:978-7-115-34133-4

定價:65

頁數:324

本書著重講解如何應用Hadoop和相關技術搭建工作系統並完成任務。本書從Hadoop的基本概念和初始設定入手,講述瞭如何開發Hadoop程式,如何在資料規模增長的時候維持系統執行,涵蓋有效使用Hadoop處理實際問題所需用到的全部知識。

http://www.ituring.com.cn/book/1168

12、Hadoop實戰

作者:Chuck Lam

譯者:韓冀中

書號:978-7-115-26448-0

定價:59

頁數:268

經典暢銷書,廣受讚譽

揭開雲端計算的神祕面紗

深入分析,追本溯源

本書分為3個部分,深入淺出地介紹了Hadoop框架、編寫和執行Hadoop資料處理程式所需的實踐技能及Hadoop之外更大的生態系統。

http://www.ituring.com.cn/book/733

13、Mahout實戰

作者:Sean Owen,Robin Anil等

譯者:韓冀中 吳海星 段菲

書號:978-7-115-34722-0

頁數:340

Apache基金會官方推薦

Mahout核心團隊權威力作

大資料時代機器學習的實戰經典

Mahout作為Apache的開源機器學習專案,把推薦系統、分類和聚類等領域的核心演算法濃縮到了可擴充套件的現成的庫中。使用Mahout可以在自己的專案中應用亞馬遜、Netflix等公司的機器學習技術。

http://www.ituring.com.cn/book/862

14、Storm原始碼分析

作者:李明 王曉鵬

書號:978-7-115-37126-3

定價:79

頁數:484

微軟搜尋技術部門高階研發工程師實戰經驗分享

從原始碼的角度深入剖析Storm設計與實現

學習如何實現和高效利用“實時的Hadoop”

“本書從原始碼角度深入淺出地分析了Storm的設計及實現,一方面可以使讀者更好地瞭解並用好Storm技術,另一方面可以讓讀者學習如何設計大規模分散式系統,相信讀者一定會受益匪淺。”

——於偉,微軟資深開發總監

http://www.ituring.com.cn/book/1507

15、Elasticsearch伺服器開發

作者:Rafal Kuc,Marek Rogozinski

譯者:蔡建斌

書號:978-7-115-38032-6

定價:59

頁數:292

Elasticsearch百科全書式著作,使用者權威指南

所有示例和功能基於Elasticsearch伺服器1.0版

在雲端計算平臺上建立穩定、可靠、方便快速的實時搜尋技術

Elasticsearch是一個基於Lucene構建的開源、分散式、RESTful風格的搜尋引擎。它被設計用於雲端計算中,具有實時搜尋、穩定、快速、安裝使用方便等優點。本書是關於Elasticsearch的百科全書式著作,介紹了Elasticsearch這個優秀的全文檢索和分析引擎從安裝和配置到叢集管理的方方面面知識。

http://www.ituring.com.cn/book/1447

16、Openstack部署實踐

作者:張子凡

書號:978-7-115-34679-7

定價:59

頁數:284

從研究D版以來,我在各個群中回答了很多新手在OpenStack系統安裝部署方面碰到的各類問題,雖然在部落格中公佈了很多,但仍比較零散,我也一直盼望能有一本較為系統的書給新手提供幫助。看到本書後我非常高興,對於OpenStack初學者和在公司內使用OpenStack部署私有云的系統運維工程師來說,此書將會幫助大家解決很多問題,同時更有助於大家靈活地運用OpenStack系統。

——北京-YZ(部落格http://www.xiaoyinzei.com),

KVM虛擬化群群主(93146027)

一線高手實踐總結

例項講解使用OpenStack建設企業私有云系統

有效降低企業IT 成本

http://www.ituring.com.cn/book/1356

17、Docker開發實踐

作者:曾金龍,肖新華,劉清

書號:978-7-115-39519-1

定價:59

頁數292

出自國內最強雲加速 雲端儲存“迅雷雲”團隊

基礎篇:原理、操作全面解析;案例篇:帶你一步步構建複雜應用;高階篇:網路、安全、API 實戰、kubernetes叢集實戰

“騰訊的互娛的開發節奏,只有Docker跟得上!如果你想你的團隊加快開發速度,那麼我推薦你使用Docker,而本書從基礎、案例到高階話題,都有很全面的覆蓋。”

——易劍,騰訊互動娛樂事業群高階架構師

http://www.ituring.com.cn/book/1631

18、非技術讀本 《精益資料分析》

作者:Alistair Croll, Benjamin Yoskovitz

書號:978-7-115-37476-9

定價:79

頁數:356

精益系列叢書,《精益創業》作者埃裡克·萊斯主編

本書圍繞精益創業展開討論,融合了精益創業法、客戶開發、商業模式畫布和敏捷/持續整合的精華。本書匯聚了100多位創始人、投資人、內部創業者和創新者的成功創業經驗,呈現了30多個極具價值的案例分析,可以為各階段的創業者提供行為準則。

http://www.ituring.com.cn/book/1125

19、非技術讀本《大資料的衝擊》

作者:城田真琴

譯者:周自恆

書號:978-7-115-31787-2

定價:49

頁數:268

本書是日本最暢銷的大資料商業應用指南。書中結合野村綜合研究獨家披露的調查資料,網羅了美國、日本標杆企業與政府的應用案例,總結了大資料的商業模式,以及在大資料應用中需要注意的隱私問題,並就如何為大資料時代做好準備展開了深入的探討,提出了諸多有益的建議。

http://www.ituring.com.cn/book/1128

20、非技術讀本《有趣的統計》

作者:Bruce Frey

譯者:鄒澍

書號:978-7-115-35621-5

定價:59

頁數:292

本書介紹的實用技巧運用了統計學原理,還借鑑了教育學和心理學上的測量和實驗研究方法。這些技巧可以幫你解決商業、遊戲以及日常生活中的各類問題。利用統計推斷的各種工具,揭開概率的神祕面紗、發現相關性,預測事件。

http://www.ituring.com.cn/book/1094