数据清洗是数据挖掘与分析过程中不可缺少的一个环节,但因为数据类型极其复杂,传统的清洗脏数据工作单调乏味且异常辛苦。如果能利用正确的工具和方法,就可以让数据清洗工作事半功倍。本书从文件格式、数据类型、字符编码等基本概念讲起,通过真实的示例,探讨如何提取和清洗关系型数据库、网页文件和PDF文档中的数据。最后提供了两个真实的项目,让读者将所有数据清洗技术付诸实践,完成整个数据科学过程。如果你是一位数据科学家,或者从事数据科学工作,哪怕是位新手,只要对数据清洗有兴趣,那么本书就适合你阅读!
下载地址
站长的话:
你好,我是桩白墨,985毕业,8年程序员,探索人生十几年。很高兴与爱读书的你结缘。我正在日更公众号,输出自己的人生见解和所见所闻,已有 200+ 篇原创文章,可能会对你有帮助。欢迎关注,一起读书成长、交流人生经验。
另外,在公众号上回复特定关键字,可领取站桩教程、chatgpt 教程、美团外卖红包群等粉丝福利。
如果你想认识一群志同道合的朋友,或者近距离跟我探讨问题,欢迎加入我的社群,在那里我会尽我所能帮助你。入口在公众号“桩白墨”上,可直接微信扫码关注。
暂无评论内容