本书就使用Apache Hadoop端到端数据管理方案提供专业架构指导。其他书籍大多针对Hadoop生态系统中的软件,讲解较为单一的使用方法,而本书偏重实践,在架构的高度详细阐释诸多工具如何相互配合,搭建出打磨之后的完整应用。书中提供了诸多案例,易于理解,配有详细的代码解析,知识点一目了然。
为加强训练,本书后半部分提供了详细的案例,涵盖最为常见的Hadoop应用架构。无论是设计Hadoop应用,还是将Hadoop同现有数据基础架构集成,本书都可以提供详实的参考。
-使用Hadoop进行数据存储和建模的着眼点和思路
-将数据输入、输出系统的最佳方案
-MapReduce、Spark和Hive等数据处理框架介绍
-数据去重、窗口分析等常见Hadoop处理模式应用
-在Hadoop上采用Giraph、GraphX等图形处理工具
-综合使用工作流以及Apache Oozie等调度工具
-以Apache Oozie、Apache Spark Streaming和Apache Flume进行近实时流处理
-点击流分析、欺诈检验和数据仓库的架构案例
下载地址
站长的话:
你好,我是桩白墨,985毕业,8年程序员,探索人生十几年。很高兴与爱读书的你结缘。我正在日更公众号,输出自己的人生见解和所见所闻,已有 200+ 篇原创文章,可能会对你有帮助。欢迎关注,一起读书成长、交流人生经验。
另外,在公众号上回复特定关键字,可领取站桩教程、chatgpt 教程、美团外卖红包群等粉丝福利。
如果你想认识一群志同道合的朋友,或者近距离跟我探讨问题,欢迎加入我的社群,在那里我会尽我所能帮助你。入口在公众号“桩白墨”上,可直接微信扫码关注。
暂无评论内容