Hadoop权威指南

本书结合理论和实践,由浅入深,全方位介绍了Hadoop这一高性能的海量数据处理和分析平台。
2017-07-01
/云计算
650 hots

数据即未来:大数据王者之道

本书强调了“数据科学是指导数据项目开展和决策的一系列过程和概念”;大数据项目的路线图重要的是“面向过程、与客户互动提出问题”。当今,社会与科学技术飞速发展,突出了对一切事物发展的数据分析都要重视时间思维,聚焦到事物发展的关键时空点上。本书以科学的流程分析,展开大数据项目应该如何实现产品或服务的再造。
2018-01-01
/云计算
193 hots

Hadoop权威指南:大数据的存储与分析(第4版)

本书结合理论和实践,由浅入深,全方位介绍了Hadoop这一高性能的海量数据处理和分析平台。全书5部分24章,第Ⅰ部分介绍Hadoop基础知识,主题涉及Hadoop、MapReduce、Hadoop分布式文件系统、YARN、Hadoop的I/O操作。第Ⅱ部分介绍MapReduce,主题包括MapReduce应用开发;MapReduce的工作机制、MapReduce的类型与格式、MapReduce的特性。第Ⅲ部分介绍Hadoop的运维,主题涉及构建Hadoop集群、管理Hadoop。第Ⅳ部分介绍Hadoop相关开源项目,主题涉及Avro、Parquet、Flume、Sqoop、Pig、Hive、Crunch、Spark、HBase、ZooKeeper。第Ⅴ部分提供了三个案例,分别来自医疗卫生信息技术服务商塞纳(Cerner)、微软的人工智能项目ADAM(一种大规模分布式深度学习框架)和开源项目Cascading(一个新的针对MapReduce的数据处理API)。   本书是一本专业、全面的Hadoop参考书和工具书,阐述了Hadoop生态圈的新发展和应用,程序员可以从中探索海量数据集的存储和分析,管理员可以从中了解Hadoop集群的安装和运维。
2017-07-01
/云计算
184 hots