从两者的理论来源来看,它们在很多情况下都是极其相似的。在典型的数据挖掘技术的决策树里,CART、CHAID等理论方法都是基于统计理论所发展和延伸的;并且数据挖掘中的技术有相当比例是用统计学中的多变量分析来支撑的。
在信息化时代,数据分析应用的趋势是从大型数据库中抓取数据,并通过专业软件进行分析,所以数据挖掘工具的应用更加符合企业实践和实战的需要。从操作者来看,数据挖掘技术更多是企业的数据分析师、业务分析师在使用,而不是统计学家用于检测。
统计分析的基础之一就是概率论,在对数据进行统计分析时,分析人员常常需要对数据分布和变量的关系做假设,确定用什么概率函数来描述变量间的关系,以及如何检验参数的统计显著性;但是在数据挖掘的应用中,分析人员不需要对数据分布做任何假设,数据挖掘中的算法会自动寻找变量之间的关系。
声明:本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果用户发布的作品侵犯了您的权利,请联系管理员:wupeng@hqwx.com
环球青藤
官方QQ群扫描上方二维码或点击一键加群,免费领取大礼包,加群暗号:青藤。 一键加群