当前位置: 首页 > 大数据工程师 > 大数据工程师行业动态 > 大数据工程师热点资讯 > 如何控制数据质量?

如何控制数据质量?

发布时间:2021年01月20日 03:17:09 来源:环球青藤 点击量:1795

【摘要】数据剖析是指利用适当的统计剖析办法对很多收集到的数据进行剖析,提取有用的信息,构成定论,对数据进行详细的研究和总结的进程,数据质量不仅是数据剖析定论有效性和准确性的根底,也是最重要的条件和保证。那么,怎么操控数据质量呢?

1、清晰自己的剖析主题

如你拥有来自不同部分的交易数据,那么此刻你想做一件什么事情,变得尤为重要,你是想剖析部分的成绩情况,还是想看哪个客户是优质客户?这时咱们要清晰剖析主题。

2、合理的数据建模

清晰主题后,咱们要事务建模,事务模型继而确认技术建模。

那么要确认优质客户的规范是什么,如收入问题,有联系方式,交易额超越10万。那咱们此次建模只需要收集这些拥有的信息字段就好。合理的数据建模可以给剖析减负。

3、去除脏数据

脏数据可以理解为反常数据,如电话号码中存在汉字,性别中存在其他字符。那这部分咱们需要清洗,严格要求。

分享到: 编辑:方梦茹

就业培训申请领取
您的姓名
您的电话
意向课程
点击领取

环球青藤

官方QQ

扫描上方二维码或点击一键加群,免费领取大礼包,加群暗号:青藤。 一键加群

绑定手机号

应《中华人民共和国网络安全法》加强实名认证机制要求,同时为更加全面的体验产品服务,烦请您绑定手机号.

预约成功

本直播为付费学员的直播课节

请您购买课程后再预约

环球青藤移动课堂APP 直播、听课。职达未来!

安卓版

下载

iPhone版

下载
环球青藤官方微信服务平台

刷题看课 APP下载

免费直播 一键购课

代报名等人工服务

课程咨询 学员服务 公众号

扫描关注微信公众号

APP

扫描下载APP

返回顶部