当前位置: 首页 > 数据分析师 > 数据分析师实战技能 > 数据分析师数据分析 > 数据挖掘中的分类技术

数据挖掘中的分类技术

发布时间:2020年09月28日 20:35:57 来源: 点击量:190

【摘要】数据挖掘中的分类技术KNN(K最近邻算法)算法核心:如果一个样本在特征空间中K个最相似的样本中的大多数属于一个类别,则该样本也属于这个

数据挖掘中的分类技术

KNN(K最近邻算法)

算法核心:如果一个样本在特征空间中K个最相似的样本中的大多数属于一个类别,则该样本也属于这个类别,并具有这个类别的特征

在确定分类时只依靠最邻近的一个或几个样本的类别来决定待分样本所属类别,在做决策时只与极少数的相邻样本有关

由于KNN方法主要依靠周围有限的临近样本,而不是依靠判别类域的方法来确定样本所属类别。对于类域交叉或重叠较多的待分样本集来说,KNN方法较其他方法更合适

决策树

决策树要解决的问题是用哪些属性充当这棵树的各个节点的问题,决策树按分裂标准不同可以分为基于信息论的方法和基于最小GINI指标方法

神经网络

神经网络的学习是一个过程,并按照一定的规则(学习算法)调整各层的权值矩阵,待网络各层权值都收敛到一定值,学习过程结束

支持向量机(SVM)

尽量把样本中从更高维度看起来在一起的样本合在一起

支持向量机的目的是找到一个最优超平面,使分类间隔最大。最优超平面就是要求分类面不但能将两类正确分开,而且使分类间隔最大

在两类样本中离分类面最近且位于平行于最优超平面上的点就是支持向量,为找到最优超平面,只要找到所有的支持向量即可

对于非线形支持向量机,通常做法为把线形不可分转换成线形可分,通过一个非线形映射将低维输入空间中的数据特征映射到高维。

分享到: 编辑:wangmin

就业培训申请领取
您的姓名
您的电话
意向课程
点击领取

环球青藤

官方QQ

扫描上方二维码或点击一键加群,免费领取大礼包,加群暗号:青藤。 一键加群

绑定手机号

应《中华人民共和国网络安全法》加强实名认证机制要求,同时为更加全面的体验产品服务,烦请您绑定手机号.

预约成功

本直播为付费学员的直播课节

请您购买课程后再预约

环球青藤移动课堂APP 直播、听课。职达未来!

安卓版

下载

iPhone版

下载
环球青藤官方微信服务平台

刷题看课 APP下载

免费直播 一键购课

代报名等人工服务

课程咨询 学员服务 公众号

扫描关注微信公众号

APP

扫描下载APP

返回顶部