当前位置: 首页 > 数据分析师 > 数据分析师实战技能 > 数据分析师数据分析 > 聚类分析聚类算法中包含哪些数据类型

聚类分析聚类算法中包含哪些数据类型

发布时间:2020年09月28日 09:47:55 来源: 点击量:599

【摘要】聚类分析聚类算法中包含哪些数据类型许多基于内存的聚类算法采用以下两种数据结构:(1)数据矩阵(DataMatrix,或称对象一变盘结构):用p个变

聚类分析聚类算法中包含哪些数据类型

许多基于内存的聚类算法采用以下两种数据结构:

(1)数据矩阵(Data Matrix,或称对象一变盘结构):用p个变量来表示n个对象,例如使用年龄、身高、性别、体重等属性变量来表示对象人,也叫二模矩阵,行与列代表不同实体:

(2)相异度矩阵(Dissimilarity Matrix,又称为对象一对象结构):存储所有成对的n个对象两两之间的近似性(邻近度),也叫单模矩阵,行和列代表相同的实体。其中d(ij)是对象i和对象j之间的测量差或相异度。d(i,f)是一个非负的数值,d(ij)越大,两个对象越不同;d (i,j)越接近于0,则两者之间越相似(相近)。

许多聚类算法都是以相异度矩阵为基础的,如果数据是用数据矩阵形式表示,则往往要将其先转化为相异度矩阵。

相异度d(i,j)的具体计算会因所使用的数据类型不同而不同,常用的数据类型包括:区间标度变量,二元变量,标称型、序数型和比例标度型变量,混合类型的变量。

分享到: 编辑:wangmin

就业培训申请领取
您的姓名
您的电话
意向课程
点击领取

环球青藤

官方QQ

扫描上方二维码或点击一键加群,免费领取大礼包,加群暗号:青藤。 一键加群

绑定手机号

应《中华人民共和国网络安全法》加强实名认证机制要求,同时为更加全面的体验产品服务,烦请您绑定手机号.

预约成功

本直播为付费学员的直播课节

请您购买课程后再预约

环球青藤移动课堂APP 直播、听课。职达未来!

安卓版

下载

iPhone版

下载
环球青藤官方微信服务平台

刷题看课 APP下载

免费直播 一键购课

代报名等人工服务

课程咨询 学员服务 公众号

扫描关注微信公众号

APP

扫描下载APP

返回顶部