《R语言数据分析与挖掘实战》——3.4 小结

本节书摘来自华章计算机《R语言数据分析与挖掘实战》一书中的第3章,第3.4节,作者 张良均,云伟标,王路,刘晓勇,更多章节内容可以访问云栖社区“华章计算机”公众号查看。

3.4 小结

本章从应用的角度出发,从数据质量分析和数据特征分析两个方面对数据进行探索分析,最后介绍了R语言中常用的数据探索函数及用例。数据质量分析要求我们拿到数据后要先检测是否存在缺失值和异常值;而数据特征分析要求我们在数据挖掘建模前,通过频率分布分析、对比分析、帕累托分析、周期性分析、相关性分析等方法,对所采集样本数据的特征规律进行分析,以了解数据的规律和趋势,为数据挖掘的后续环节提供支持。

上一篇:Docker-理解镜像构成


下一篇:Python批量更新nginx配置文件