产品展示 Categories
联系我们 contact us
- 联系人:
- 陆先生
- 手机:
- 15895595058
- 电话:
- 0512-58628685
- 地址:
- 张家港市南丰镇
脱敏与可视化分析-数控滚圆机滚弧机折弯机张家
添加时间:2019-06-23
分析高校教学质量,并对其进行评价,本文基于python语言对教务系统导出的原数据进行处理和分析,主要从数据导入,数据预处理,及数据分析三个层面结合实例进行分析。首先利用tkinter库设计出数据导入的界面;其次阐述数据清洗、分组、集成以及脱敏等数据预处理的常用算法,并结合高校教学评价这一实际案例进行了演示,借助pandas库中的dataframe数据类型实现了对"脏数据"的清洗,以及对教师姓名的脱敏;最后利用matplotlib库对处理好的数据进行数据可视化,并结合所得图像对各专业班级及教师的学习和教学状况进行分析与评价。通过本文的数据处理,实现了对教师姓名的脱敏,保护了教师的隐私,并利用图形直观地反映出各教师和班级近几年的成绩分布,使得高校绩效考核更加的方便电脑知识与技术图1系统的图形化界面设计3数据预处理在大数据环境下,由于原始数据的杂乱性,重复性,模糊性,数据挖掘与分析的首要任务就是确保消除所有的“脏数据”文由公司网站滚圆机网站
采集
转载中国知网整理! http://www.gunyuanjixie.com,即冗余数据,异常数据,无用数据等,因此引入了数据预处理技术对原数据进行处理。数据预处理技术主要由数据清洗,数据集成,数据变换,数据规约等四部分组成。数据清洗部分主要包含处理缺失数据脱敏与可视化分析-数控滚圆机滚弧机折弯机张家港电动液压滚圆机滚弧机、检测和过滤异常值,移除重复数据等;数据集成部分主要包含使用键参数的DataFrame合并,轴向连接等;数据变换部分主要包含利用映射进行数据转换,替换值等;数据规约就是对数据进行聚集,进一步降低数据规模,方便处理与分析。常见的脱敏方法有:1)替换:以虚构的数据代替真值,从而达到将隐私数据保护起来的目的。2)无效化:以Null或者***代替真值的一部分,例如对银行卡或手机号的处理。3)置乱:对敏感数据列的值打乱后,重新分布,该方法将破坏与其他字段的联系,具有局限性。4)均值化:对数值型的数据,首先求解它们的均值,使得脱敏后的值在均值附近。5)偏移:通过随机地对数据进行移位改变数据[1]。上述五种只是常用的几种数据脱敏的方法,还有很多其他方法如反推断、FPE、屏蔽,限制返回行数等等,根据实际应用情况选取合适的脱敏方法即可。3.1实例数据分析本实例的每学期高数成绩原始数据中包含有学号、姓名、课程名称、学分、平时成绩、期中成绩、期末成绩、实验成绩、总评成绩、备注、折算成绩、补考成绩、重修成绩、绩点、课程性质、课程归属、重修标记、选课课号、学年、学期、是否注册。脱敏与可视化分析-数控滚圆机滚弧机折弯机张家港电动液压滚圆机滚弧机文由公司网站滚圆机网站
采集
转载中国知网整理! http://www.gunyuanjixie.com