
课程咨询: 400-996-5531 / 投诉建议: 400-111-8989
认真做教育 专心促就业
数据的预处理是程序员在做数据分析之前需要进行的一个环节,而本文我们就通过案例分析来了解一下,数据处理基础知识分享。
1、数据是什么?
通过观察、实验或计算得出的结果。例:数字、文字、图像、声音等。
2、数据分析是什么?
把隐藏在数据背后的信息集中和提炼出来
总结出所研究对象的内在规律,帮助管理者进行有效的判断和决策
数据在数据分析中的重要性
数据分析即数据+分析,也就是说数据为先,分析为后。数据是分析的基础,因此数据的质量、数据的相关度、数据的维度等会影响数据分析的结果。
数据分析流程图
3、什么是数据预处理?
在特征工程和日志前,检测和去除数据集中的噪声数据和无关数据,处理漏洞数据,去除空白数据。
4、为什么要做数据预处理?
提高数据的质量,从而有助于提高后续学习过程的精度和性能
数据预处理的重要性
5、什么是数据清洗?
删除原始数据集中的无关数据,重复数据,筛选掉与挖掘主题无关的数据,处理缺失值,异常值。
造成数据缺失的原因
信息暂时无法获取;信息被遗漏;有些对象的某个或某些属性是不可用的,等等。
缺失的类型
完全随机缺失;随机缺失,非随机缺失
处理缺失值的必要性
挽回丢失的信息;确定性更加显著;得到可靠的输出
常见的数据清理的方式
【免责声明】本文系本网编辑部分转载,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与管理员联系,我们会予以更改或删除相关文章,以保证您的权益!更多内容请加danei0707学习了解。欢迎关注“达内在线”参与分销,赚更多好礼。