大數據技術叢書 全集 共12本


第二本:大規模分佈式存儲系統:原理解析與架構實戰

第三本:大規模分佈式系統架構與設計實戰

第四本:大數據管理 數據集成的技術、方法與最佳實踐

第五本:機器學習實踐指南 案例應用解析

第六本:數據挖掘 實用案例分析

第七本:數據挖掘與數據化運營實戰 思路、方法、技巧與應用

第八本:網站數據分析:數據驅動的網站管理、優化和運營

第九本:Hadoop技術內幕 深入解析HADOOP COMMON和HDFS架構設計與實現原理

第十本:Hadoop技術內幕 深入理解MapReduce架構設計與實現原理

第十一本:Hadoop實戰

第十二本:Hadoop應用開發技術詳解


《Hadoop技術內幕深入解析YARN架構設計與實現原理》

圖書目錄

第一部分 準備篇


第1章 環境準備


第2章 yarn設計理

第二部分 yarn核心設計篇


第3章 yarn基礎庫


第4章 yarn應用程序設計方法


第5章 resourcemanager剖析


第6章 資源調度器


第7

第三部分 計算框架篇


第8章 離線計算框架mapreduce


第9章 dag計算框架tez


第10章 實時/內存計算框架st

第四部分 高級篇


第11章 facebook corona剖析


第12章 apache mesos剖析


第13章 yarn總結與發展趨勢


附錄a yarn安裝指南


附錄b yarn配置參數介紹


附錄c hadoop shell命令介紹


參數介紹

附錄c

第1章 概述


第一篇 基礎篇


第2章 單機存儲系統


第3章 分佈式系統


第二篇 範型篇


第4章 分佈式文件系統


第5章 分佈式鍵值系統


第6章 分佈式表格系統


第7章 分佈式數據庫


第三篇 實踐篇


第8章 OceanBase架構初探


第9章 分佈式存儲引擎


第10章 數據庫功能


第11章 質量保證、運維及實踐


第四篇 專題篇


第1章概述


1.1分佈式計算、並行計算、雲計算概述


1.2分佈式產品Hadoop、ZooKeeper、HBase概述


1.3Fourinone的產生背景


第2章分佈式並行計算的原理與實踐


2.1分佈式並行計算模式


2.1.1最初想到的master-slave結構


2.1.2“包工頭-職介所-手工倉庫-工人”模式


2.1.3基於消息中樞的計算模式


2.1.4基於網狀直接交互的計算模式


2.1.5並行結合串行模式


2.1.6包工頭內部批量多階段處理模式


2.1.7計算集群模式和兼容遺留計算系統


2.1.8工人

2.4配置文件和核心API介紹


2.5實踐與應用


2.5.1一個簡單的示例


2.5.2工頭工人計算模式更完整的示例


2.5.3工人合併互相say hello的示例


2.5.4 實現Hadoop經典實例Word Count


2.5.5分佈式多機部署的示例


2.5.6分佈式計算自動部署的示例


2.5.7計算過程中的故障和容災處理


2.5.8計算過程中的相關時間屬性設置


2.5.9如何在一臺計算機上一次性啟動多個進程


2.5.10如何調用C/C++程序實現


2.5.11如何中止工人計算和超時中止


2.5.12使用並行計算大幅提升遞歸算法效率


2.5.13使用並行計算求圓周率π


2.5.14從賭錢遊戲看PageRank算法


2.5.15使用並行計算實現上億排序


2.5.16工人服務化模式應用示例


2.6實時流計算


第3章分佈式協調的實現


3.1協調架構原理簡介


3.2核心API


3.3權限機制


3.4相對於ZooKeeper的區別


3.5與Paxos算法的區別


3.6實踐與應用


3.6.1如何實現公共配置管理


3.6.2如何實現分佈式鎖


3.6.3如何實現集群管理


3.6.4多節點權限操作示例


3.6.5領導者選舉相關屬性設置


第4章分佈式緩存的實現


4.1小型網站或企業應用的緩存實現架構


4.2大型分佈式緩存系統實現過程


4.3一致性哈希算法的原理、改進和實現


4.4解決任意擴容的問題


4.5解決擴容後數據均勻的問題


4.6分佈式Session的架構設計和實現


4.7緩存容量的相關屬性設置


4.8緩存清空的相關屬性設置


第5章消息隊列的實現


5.1閒話中間件與MQ


5.2JMS的兩種經典模式


5.3如何實現發送接收的隊列模式


5.4如何實現主題訂閱模式


第6章分佈式文件系統的實現


6.1FTTP架構原理解析


6.2搭建配置FttpAdapter環境


6.3訪

7.1調度平臺的設計與實現

7.2資源隔離的實現

7.3資源調度算法

7.4其他作業調度平臺簡介

7.4.1其他MPI作業資源調度技術

7.4.2Mesos和Yarn簡介

6.9批量並行讀寫遠程文件和事務補償處理


6

第一部分 數據集成導論


第1章 數據集成的重要性


第2章 什麼是數據集成


第3章 數據集成的類型和複雜性


第4章 數據集成開發過程


第二部分 批處理數據集成


第5章 批處理數據集成簡介


第6章 抽取、轉換和加載


第7章 數據倉庫


第8章 數據轉換


第9章 數據歸檔


第10章 批處理數據集成架構和元數據


第三部分 實時數據集成


第11章 實時數據集成簡介


第12章 數據集成模式


第13章 核心實時數據集成技術


第14章 數據集成建模


第15章 主數據管理


第16章 實時更新數據倉庫


第17章 實時數據集成架構和元數據


第四部分 大數據集成


第18章 大數據集成簡介


第19章 雲架構和數據集

第一部分 準備篇


第1章 機器學習發展及應用前景 2


第2章 科學計算平臺 8


第二部分 基礎篇


第3章 計算平臺應用實例 18


思考題 99


第4章 生產環境基礎 100


思考題 146


第三部分 統計分析實戰篇


第5章 統計分析基礎 148


思考題 170


第6章 描述性分析案例 171


思考題 201


第7章 假設檢驗與迴歸模型案例 202


思考題 226


第四部分 機器學習實戰篇


第8章 機器學習算法 230


思考題 325


第9章 數據擬合案例 327


思考題 368


第10章 圖像算法案例 370


思考題 435


第1

第一部分 基 礎 篇


第1章 初識數據挖掘


1.1 什麼是數據挖掘


1.2 數據挖掘在企業商務智能應用中的定位


1.2.1 數據挖掘給企業帶來最大的投資收益


1.2.2 數據挖掘從本質上提升商務智能平臺的價值


1.2.3 數據挖掘讓商務智能流程真正形成閉環


1.3 信息類BI應用與知識類BI應用


1.4 數據挖掘現狀及應用前景


1.5 本章小結


第2章 數據挖掘的應用分類


第3章 數據挖掘建模


第4章 頂尖數據挖掘平臺TipDM


第二部分 實 戰 篇


第5章 數據挖掘在金融電信行業的應用


第6章 數據挖掘在電力行業的應用


第7章 數據挖掘在互聯網行業的應用


第8章 數據挖掘在生產製造行業中的應用


第9章 數據挖掘在公共服務行業的應用


第10章 動手實踐


第三部分 高 級 篇


第11章 基於第三方接口的數據挖掘二次

第1章 什麼是數據化運營


第2章 數據挖掘概述


第3章 數據化運營中常見的數據分析項目類型


第4章 數據化運營是跨專業、跨團隊的協調與合作


第5章 分析師常見的錯誤觀念和對治的管理策略


第6章 數據挖掘項目完整應用案例演示


第7章 數據挖掘建模的優化和限度


第8章 常見的數據處理技巧


第9章 聚類分析的典型應用和技術小竅門


第10章 預測響應(分類)模型的典型應用和技術小竅門


第11章 用戶特徵分析的典型應用和技術小竅門


第12章 運營效果分析的典型應用和技術小竅門


第13章 漏斗模型和路徑分析


第14章 數據分析師對業務團隊數據分析能力的培養


第15章 換位思考


第16章 養成數據分析師的品質和思維模式


第17章 條條大道通羅馬


第18章 數據挖掘實踐的質量保障流程和制度


第19章 幾個經典的數據挖掘方法論

實 戰 篇


第5章 數據挖掘在金融電信行業的應用


第6章 數據


第一部分 環境準備


第1章 源代碼環境準備


第二部分 Common的實現


第2章 Hadoop配置信息處理


第3章 序列化與壓縮


第4章 Hadoop遠程過程調用


第5章 Hadoop文件系統


第三部分 Hadoop分佈式文件系統


第6章 HDFS概述


第7章 數據節點實現


Hadoop技術內幕 深入理解MapReduce架構設計與實現原理


圖書目

第一部分 基礎篇


第1章 閱讀源代碼前的準備


第2章 MapReduce設計理念與基本架構


第二部分 MapReduce編程模型篇


第3章 MapReduce編程模型


第三部分 MapReduce核心設計篇


第4章 Hadoop RPC框架解析


第5章 作業提交與初始化過程分析


第6章 JobTracker內部實現剖析


第7章 TaskTracker內部實現剖析


第8章 Task運行過程分析


第四部分 MapReduce高級篇


第9章 Hadoop性能調優


第10章 Hadoop多用戶作業調度器


第11章 Hadoop安全機制


第12章 下一代MapReduce框架


附錄A 安裝Hadoop過程中可能存在的問題及解決方案


第1章 Hadoop簡介


第2章 Hadoop的安裝與配置


第3章 MapReduce計算模型


第4章 開發MapReduce應用程序


第5章 MapReduce應用案例


第6章 MapReduce工作機制


第7章 Hadoop IO操作


第8章 下一代MapReduce:YARN


第9章 HDFS詳解


第10章 Hadoop的管理


第11章 Hive詳解


第12章 HBase詳解


第13章

第16章 Avro詳解


第17章 Chukwa詳解


第18章 Hadoop的常用插件與開發


第19章 企業應用實例


……


章 HDFS概

第1章 Hadoop概述


第2章 Hadoop安裝


第3章 MapReduce快速入門


第4章 Hadoop分佈式文件系統詳解


第5章 Hadoop文件I/O詳解


第6章 MapReduce工作原理


第7章 Eclipse插件的應用


第8章 MapReduce編程開發


第9章 MapReduce高級應用


第10章 數據倉庫工具Hive


第11章 開源數據庫HBase


第12章

RPC框架解析


第5章 作業提交與初始化過程分析


第6章 JobTracker內部實現剖析


第7章 TaskTracker內部實現剖析


第8章 Task運行過程分析


第四部分 MapReduce高級篇


第9章 Hadoop性能調優


第10章 Hadoop多用戶作業調度器


第11章 Hadoop安全機制


第12章 下一代MapReduce框架


附錄A 安裝Hadoop過程中可能存在的問題及解決方案


附錄B Hadoop默認HTTP端

第1章 Hadoop簡介


第2章 Hadoop的安裝與配置


第3章 MapReduce計算模型


第4章 開發MapReduce應用程序


第5章 MapReduce應用案例


第6章 MapReduce工作機制


第7章 Hadoop IO操作


第8章 下一代MapReduce:YARN


第9章 HDFS詳解


第10章 Hadoop的管理


第11章 Hive詳解


第12章 HBase詳解


第13章 M

第16章 Avro詳解


第17章 Chukwa詳解


第18章 Hadoop的常用插件與開發


第19章 企業應用實例


……


Pig詳解


第1章 Hadoop概述


第2章 Hadoop安裝


第3章 MapReduce快速入門


第4章 Hadoop分佈式文件系統詳解


第5章 Hadoop文件I/O詳解


第6章 MapReduce工作原理


第7章 Eclipse插件的應用


第8章 MapReduce編程開發


第9章 MapReduce高級應用


第10章 數據倉庫工具Hive


第11章 開源數據庫HBase


第12章 Mahout算法

pReduce工作原理


第7章 Eclipse插件的應用


第8章 MapReduce編程開發


第9章 MapReduce高級應用


第10章 數據倉庫工具Hive


第11章 開源數據庫HBase


第12章 Mahout算法


需要編程資料的 可以私信我


分享到:


相關文章: