为了达到深入浅出、通俗易懂的效果,本书的第一大部分概述了大数据的主要技术,包括大数据的获取、存储、处理,还有架构设计的基本理念,以及常用的消息和缓存机制。这一部分你会发现关于Nutch、Flume、Hadoop、HBase、Redis、Hive、Kafka、Spark、Storm等的简介。对于数据处理的高级技术,本书着墨不少,但不乏对于信息检索和数据挖掘课题的探讨。例如站内搜索引擎、推荐系统、广告系统、聚类、分类和线性回归等。由于商业需求尤其看重实际产出,因此第一部分的最后还会分析常见的效果和性能评估。相信这部分对于构建读者的大数据知识体系会很有帮助。在每一章的最后,我们还会给出重要的参考图书,以便于读者继续深入学习。
下载地址
站长的话:
你好,我是桩白墨,985毕业,8年程序员,探索人生十几年。很高兴与爱读书的你结缘。我正在日更公众号,输出自己的人生见解和所见所闻,已有 200+ 篇原创文章,可能会对你有帮助。欢迎关注,一起读书成长、交流人生经验。
另外,在公众号上回复特定关键字,可领取站桩教程、chatgpt 教程、美团外卖红包群等粉丝福利。
如果你想认识一群志同道合的朋友,或者近距离跟我探讨问题,欢迎加入我的社群,在那里我会尽我所能帮助你。入口在公众号“桩白墨”上,可直接微信扫码关注。
暂无评论内容