大数据技术丛书 全集 共12本


第二本:大规模分布式存储系统:原理解析与架构实战

第三本:大规模分布式系统架构与设计实战

第四本:大数据管理 数据集成的技术、方法与最佳实践

第五本:机器学习实践指南 案例应用解析

第六本:数据挖掘 实用案例分析

第七本:数据挖掘与数据化运营实战 思路、方法、技巧与应用

第八本:网站数据分析:数据驱动的网站管理、优化和运营

第九本:Hadoop技术内幕 深入解析HADOOP COMMON和HDFS架构设计与实现原理

第十本:Hadoop技术内幕 深入理解MapReduce架构设计与实现原理

第十一本:Hadoop实战

第十二本:Hadoop应用开发技术详解


《Hadoop技术内幕深入解析YARN架构设计与实现原理》

图书目录

第一部分 准备篇


第1章 环境准备


第2章 yarn设计理

第二部分 yarn核心设计篇


第3章 yarn基础库


第4章 yarn应用程序设计方法


第5章 resourcemanager剖析


第6章 资源调度器


第7

第三部分 计算框架篇


第8章 离线计算框架mapreduce


第9章 dag计算框架tez


第10章 实时/内存计算框架st

第四部分 高级篇


第11章 facebook corona剖析


第12章 apache mesos剖析


第13章 yarn总结与发展趋势


附录a yarn安装指南


附录b yarn配置参数介绍


附录c hadoop shell命令介绍


参数介绍

附录c

第1章 概述


第一篇 基础篇


第2章 单机存储系统


第3章 分布式系统


第二篇 范型篇


第4章 分布式文件系统


第5章 分布式键值系统


第6章 分布式表格系统


第7章 分布式数据库


第三篇 实践篇


第8章 OceanBase架构初探


第9章 分布式存储引擎


第10章 数据库功能


第11章 质量保证、运维及实践


第四篇 专题篇


第1章概述


1.1分布式计算、并行计算、云计算概述


1.2分布式产品Hadoop、ZooKeeper、HBase概述


1.3Fourinone的产生背景


第2章分布式并行计算的原理与实践


2.1分布式并行计算模式


2.1.1最初想到的master-slave结构


2.1.2“包工头-职介所-手工仓库-工人”模式


2.1.3基于消息中枢的计算模式


2.1.4基于网状直接交互的计算模式


2.1.5并行结合串行模式


2.1.6包工头内部批量多阶段处理模式


2.1.7计算集群模式和兼容遗留计算系统


2.1.8工人

2.4配置文件和核心API介绍


2.5实践与应用


2.5.1一个简单的示例


2.5.2工头工人计算模式更完整的示例


2.5.3工人合并互相say hello的示例


2.5.4 实现Hadoop经典实例Word Count


2.5.5分布式多机部署的示例


2.5.6分布式计算自动部署的示例


2.5.7计算过程中的故障和容灾处理


2.5.8计算过程中的相关时间属性设置


2.5.9如何在一台计算机上一次性启动多个进程


2.5.10如何调用C/C++程序实现


2.5.11如何中止工人计算和超时中止


2.5.12使用并行计算大幅提升递归算法效率


2.5.13使用并行计算求圆周率π


2.5.14从赌钱游戏看PageRank算法


2.5.15使用并行计算实现上亿排序


2.5.16工人服务化模式应用示例


2.6实时流计算


第3章分布式协调的实现


3.1协调架构原理简介


3.2核心API


3.3权限机制


3.4相对于ZooKeeper的区别


3.5与Paxos算法的区别


3.6实践与应用


3.6.1如何实现公共配置管理


3.6.2如何实现分布式锁


3.6.3如何实现集群管理


3.6.4多节点权限操作示例


3.6.5领导者选举相关属性设置


第4章分布式缓存的实现


4.1小型网站或企业应用的缓存实现架构


4.2大型分布式缓存系统实现过程


4.3一致性哈希算法的原理、改进和实现


4.4解决任意扩容的问题


4.5解决扩容后数据均匀的问题


4.6分布式Session的架构设计和实现


4.7缓存容量的相关属性设置


4.8缓存清空的相关属性设置


第5章消息队列的实现


5.1闲话中间件与MQ


5.2JMS的两种经典模式


5.3如何实现发送接收的队列模式


5.4如何实现主题订阅模式


第6章分布式文件系统的实现


6.1FTTP架构原理解析


6.2搭建配置FttpAdapter环境


6.3访

7.1调度平台的设计与实现

7.2资源隔离的实现

7.3资源调度算法

7.4其他作业调度平台简介

7.4.1其他MPI作业资源调度技术

7.4.2Mesos和Yarn简介

6.9批量并行读写远程文件和事务补偿处理


6

第一部分 数据集成导论


第1章 数据集成的重要性


第2章 什么是数据集成


第3章 数据集成的类型和复杂性


第4章 数据集成开发过程


第二部分 批处理数据集成


第5章 批处理数据集成简介


第6章 抽取、转换和加载


第7章 数据仓库


第8章 数据转换


第9章 数据归档


第10章 批处理数据集成架构和元数据


第三部分 实时数据集成


第11章 实时数据集成简介


第12章 数据集成模式


第13章 核心实时数据集成技术


第14章 数据集成建模


第15章 主数据管理


第16章 实时更新数据仓库


第17章 实时数据集成架构和元数据


第四部分 大数据集成


第18章 大数据集成简介


第19章 云架构和数据集

第一部分 准备篇


第1章 机器学习发展及应用前景 2


第2章 科学计算平台 8


第二部分 基础篇


第3章 计算平台应用实例 18


思考题 99


第4章 生产环境基础 100


思考题 146


第三部分 统计分析实战篇


第5章 统计分析基础 148


思考题 170


第6章 描述性分析案例 171


思考题 201


第7章 假设检验与回归模型案例 202


思考题 226


第四部分 机器学习实战篇


第8章 机器学习算法 230


思考题 325


第9章 数据拟合案例 327


思考题 368


第10章 图像算法案例 370


思考题 435


第1

第一部分 基 础 篇


第1章 初识数据挖掘


1.1 什么是数据挖掘


1.2 数据挖掘在企业商务智能应用中的定位


1.2.1 数据挖掘给企业带来最大的投资收益


1.2.2 数据挖掘从本质上提升商务智能平台的价值


1.2.3 数据挖掘让商务智能流程真正形成闭环


1.3 信息类BI应用与知识类BI应用


1.4 数据挖掘现状及应用前景


1.5 本章小结


第2章 数据挖掘的应用分类


第3章 数据挖掘建模


第4章 顶尖数据挖掘平台TipDM


第二部分 实 战 篇


第5章 数据挖掘在金融电信行业的应用


第6章 数据挖掘在电力行业的应用


第7章 数据挖掘在互联网行业的应用


第8章 数据挖掘在生产制造行业中的应用


第9章 数据挖掘在公共服务行业的应用


第10章 动手实践


第三部分 高 级 篇


第11章 基于第三方接口的数据挖掘二次

第1章 什么是数据化运营


第2章 数据挖掘概述


第3章 数据化运营中常见的数据分析项目类型


第4章 数据化运营是跨专业、跨团队的协调与合作


第5章 分析师常见的错误观念和对治的管理策略


第6章 数据挖掘项目完整应用案例演示


第7章 数据挖掘建模的优化和限度


第8章 常见的数据处理技巧


第9章 聚类分析的典型应用和技术小窍门


第10章 预测响应(分类)模型的典型应用和技术小窍门


第11章 用户特征分析的典型应用和技术小窍门


第12章 运营效果分析的典型应用和技术小窍门


第13章 漏斗模型和路径分析


第14章 数据分析师对业务团队数据分析能力的培养


第15章 换位思考


第16章 养成数据分析师的品质和思维模式


第17章 条条大道通罗马


第18章 数据挖掘实践的质量保障流程和制度


第19章 几个经典的数据挖掘方法论

实 战 篇


第5章 数据挖掘在金融电信行业的应用


第6章 数据


第一部分 环境准备


第1章 源代码环境准备


第二部分 Common的实现


第2章 Hadoop配置信息处理


第3章 序列化与压缩


第4章 Hadoop远程过程调用


第5章 Hadoop文件系统


第三部分 Hadoop分布式文件系统


第6章 HDFS概述


第7章 数据节点实现


Hadoop技术内幕 深入理解MapReduce架构设计与实现原理


图书目

第一部分 基础篇


第1章 阅读源代码前的准备


第2章 MapReduce设计理念与基本架构


第二部分 MapReduce编程模型篇


第3章 MapReduce编程模型


第三部分 MapReduce核心设计篇


第4章 Hadoop RPC框架解析


第5章 作业提交与初始化过程分析


第6章 JobTracker内部实现剖析


第7章 TaskTracker内部实现剖析


第8章 Task运行过程分析


第四部分 MapReduce高级篇


第9章 Hadoop性能调优


第10章 Hadoop多用户作业调度器


第11章 Hadoop安全机制


第12章 下一代MapReduce框架


附录A 安装Hadoop过程中可能存在的问题及解决方案


第1章 Hadoop简介


第2章 Hadoop的安装与配置


第3章 MapReduce计算模型


第4章 开发MapReduce应用程序


第5章 MapReduce应用案例


第6章 MapReduce工作机制


第7章 Hadoop IO操作


第8章 下一代MapReduce:YARN


第9章 HDFS详解


第10章 Hadoop的管理


第11章 Hive详解


第12章 HBase详解


第13章

第16章 Avro详解


第17章 Chukwa详解


第18章 Hadoop的常用插件与开发


第19章 企业应用实例


……


章 HDFS概

第1章 Hadoop概述


第2章 Hadoop安装


第3章 MapReduce快速入门


第4章 Hadoop分布式文件系统详解


第5章 Hadoop文件I/O详解


第6章 MapReduce工作原理


第7章 Eclipse插件的应用


第8章 MapReduce编程开发


第9章 MapReduce高级应用


第10章 数据仓库工具Hive


第11章 开源数据库HBase


第12章

RPC框架解析


第5章 作业提交与初始化过程分析


第6章 JobTracker内部实现剖析


第7章 TaskTracker内部实现剖析


第8章 Task运行过程分析


第四部分 MapReduce高级篇


第9章 Hadoop性能调优


第10章 Hadoop多用户作业调度器


第11章 Hadoop安全机制


第12章 下一代MapReduce框架


附录A 安装Hadoop过程中可能存在的问题及解决方案


附录B Hadoop默认HTTP端

第1章 Hadoop简介


第2章 Hadoop的安装与配置


第3章 MapReduce计算模型


第4章 开发MapReduce应用程序


第5章 MapReduce应用案例


第6章 MapReduce工作机制


第7章 Hadoop IO操作


第8章 下一代MapReduce:YARN


第9章 HDFS详解


第10章 Hadoop的管理


第11章 Hive详解


第12章 HBase详解


第13章 M

第16章 Avro详解


第17章 Chukwa详解


第18章 Hadoop的常用插件与开发


第19章 企业应用实例


……


Pig详解


第1章 Hadoop概述


第2章 Hadoop安装


第3章 MapReduce快速入门


第4章 Hadoop分布式文件系统详解


第5章 Hadoop文件I/O详解


第6章 MapReduce工作原理


第7章 Eclipse插件的应用


第8章 MapReduce编程开发


第9章 MapReduce高级应用


第10章 数据仓库工具Hive


第11章 开源数据库HBase


第12章 Mahout算法

pReduce工作原理


第7章 Eclipse插件的应用


第8章 MapReduce编程开发


第9章 MapReduce高级应用


第10章 数据仓库工具Hive


第11章 开源数据库HBase


第12章 Mahout算法


需要编程资料的 可以私信我


分享到:


相關文章: