数据挖掘中的分类技术
【摘要】数据挖掘中的分类技术KNN(K最近邻算法)算法核心:如果一个样本在特征空间中K个最相似的样本中的大多数属于一个类别,则该样本也属于这个
数据挖掘中的分类技术
KNN(K最近邻算法)
算法核心:如果一个样本在特征空间中K个最相似的样本中的大多数属于一个类别,则该样本也属于这个类别,并具有这个类别的特征
在确定分类时只依靠最邻近的一个或几个样本的类别来决定待分样本所属类别,在做决策时只与极少数的相邻样本有关
由于KNN方法主要依靠周围有限的临近样本,而不是依靠判别类域的方法来确定样本所属类别。对于类域交叉或重叠较多的待分样本集来说,KNN方法较其他方法更合适
决策树
决策树要解决的问题是用哪些属性充当这棵树的各个节点的问题,决策树按分裂标准不同可以分为基于信息论的方法和基于最小GINI指标方法
神经网络
神经网络的学习是一个过程,并按照一定的规则(学习算法)调整各层的权值矩阵,待网络各层权值都收敛到一定值,学习过程结束
支持向量机(SVM)
尽量把样本中从更高维度看起来在一起的样本合在一起
支持向量机的目的是找到一个最优超平面,使分类间隔最大。最优超平面就是要求分类面不但能将两类正确分开,而且使分类间隔最大
在两类样本中离分类面最近且位于平行于最优超平面上的点就是支持向量,为找到最优超平面,只要找到所有的支持向量即可
对于非线形支持向量机,通常做法为把线形不可分转换成线形可分,通过一个非线形映射将低维输入空间中的数据特征映射到高维。
上一篇:excel表格基本操作之从零开始学习
下一篇:R描述性统计分析
就业培训申请领取
环球青藤
官方QQ群扫描上方二维码或点击一键加群,免费领取大礼包,加群暗号:青藤。 一键加群
最新文章
数据分析师各地入口
环球青藤官方微信服务平台
刷题看课 APP下载
免费直播 一键购课
代报名等人工服务
数据分析师热点排行
- 1 传统数据和大数据的区别
- 2 数据分析的8种方法都是哪些?
- 3 数据分析的具体流程是什么?
- 4 3大常用的数据分析工具是什么?
- 5 excel中的运算符
- 6 数据分析的作用有哪些?
- 7 电子商务需要分析哪些数据?
- 8 数据分析包括哪些内容?
- 9 数据分析的基本步骤
- 10 rdd是什么?