如何控制数据质量?
发布时间:2021年01月20日 03:17:09
来源:环球青藤
点击量:1812
【摘要】数据剖析是指利用适当的统计剖析办法对很多收集到的数据进行剖析,提取有用的信息,构成定论,对数据进行详细的研究和总结的进程,数据质量不仅是数据剖析定论有效性和准确性的根底,也是最重要的条件和保证。那么,怎么操控数据质量呢?
1、清晰自己的剖析主题
如你拥有来自不同部分的交易数据,那么此刻你想做一件什么事情,变得尤为重要,你是想剖析部分的成绩情况,还是想看哪个客户是优质客户?这时咱们要清晰剖析主题。
2、合理的数据建模
清晰主题后,咱们要事务建模,事务模型继而确认技术建模。
那么要确认优质客户的规范是什么,如收入问题,有联系方式,交易额超越10万。那咱们此次建模只需要收集这些拥有的信息字段就好。合理的数据建模可以给剖析减负。
3、去除脏数据
脏数据可以理解为反常数据,如电话号码中存在汉字,性别中存在其他字符。那这部分咱们需要清洗,严格要求。
上一篇:大数据的价值究竟体现在哪些方面?
下一篇:大数据分析有哪些难题?
就业培训申请领取
环球青藤
官方QQ群扫描上方二维码或点击一键加群,免费领取大礼包,加群暗号:青藤。 一键加群
最新文章
大数据工程师各地入口
环球青藤官方微信服务平台
刷题看课 APP下载
免费直播 一键购课
代报名等人工服务
大数据工程师热点排行