SPSS-数据处理-数据变量
【摘要】SPSS-数据处理-数据变量spss工具中”行“用【个案】表示,“列”用【变量】表示。变量其实也就是我们在数据库中称之为字段的概念。但是在统
SPSS-数据处理-数据变量
spss工具中”行“用【个案】表示,“列”用【变量】表示。变量其实也就是我们在数据库中称之为字段的概念。但是在统计学中,我们称之为变量。
接下来主要介绍两点有关变量的基础知识:一、变量的数据类型 二、变量的尺度
一、变量的数据类型
从所周知,变量分为不同的数据类型,分别是:a:数值型数据、b:字符型数据、c:日期型数据。
a:数值型数据:直接使用自然数或度量单位进行计量的数值数据。例如:收入、年龄、体重、身高这几个变量均为数值型数据。可以直接用算术运算方法进行汇总和分析,这是区分是否是数值型数据的重要特征。
b:字符型数据:也成为文本数据,由字符串组成,它是不能进行算术运算的文字数据类型。它包括中文字符、英文字符、数字字符(非数值型)等字符。例如姓名、性别、省份这几个变量均为字符型数据。字符型数据是一种分类数据,例如性别可以分为男、女两类。省份可以分为好多省,我们可以通过对这些分类数据进行分类研究,从而更全面的掌握事务特征。
c:日期型数据:用于表示日期或时间数据,它可以进行算术运算,所以它是一种特殊的数值型数据。主要应用在时间序列分析中。
二、变量的尺度
上面介绍的数据类型主要是数据库中的语言,有的时候仅用数据类型不能准确的说明变量的含义和属性。为了更好的说明变量的含义和属性,在统计学中就采用了变量尺度这个概念。举例:
职业变量,1代表白领、2代表蓝领、3代表金领,这时1、2、3只是个标记,属于并列关系,没有次序关系。
职级变量,1代表初级、2代表中级、3代表高级,这时1、2、3不只是个标记,还有次序关系。
年龄变量,1代表1岁、 2代表2岁、 3代表3岁, 这时1、2、3不只是个标记,还有次序、大小关系,可以做算术运算。
职业职级年龄三个变量的数据类型都是数值型,但数值的集体含义不同,适用的统计方法也不同,这时就必须给数据变量增加一个测量尺度属性。
尺度属性从低到高分为四个层级:a:定类尺度、b:定序尺度、c:定距尺度、d:定比尺度。
a:定类尺度:是对事物类别和属性的一种测度。 特点:其值只能代表事物的类别和属性,不能比较各类别之间的大小,例如性别、职业这两个变量。spss中用【名义(N)】表示。
b:定序尺度:是对事物之间等级或者顺序的一种测度。 特点:其计算结果只能排序, 不能进行算术运算, 例如学历、职级这两个变量。spss中用【序号(O)】表示。
c:定距尺度:是对事物次序之间间距的一种测度,只可以进行加减运算、不能进行乘除运算,不仅能对事物进行排序,还能准确计算次序之间的差距是多少,例如温度、时间这两个变量。spss中用【度量(S)】表示。
d:定比尺度:是测量两个测量值之间比值的一种测度。它能够进行加减乘除运算,例如收入、用户数这两个变量。它与定距尺度最大的区别在于它有一个固定的绝对“0”值,而定距尺度没有。在定距尺度中“0”不表示没有,它只是一个测量值;而在定比变量中“0”就表示没有。spss中用【度量(S)】表示。
就业培训申请领取
环球青藤
官方QQ群扫描上方二维码或点击一键加群,免费领取大礼包,加群暗号:青藤。 一键加群
数据分析师相关文章推荐
|数据分析师最新文章推荐
刷题看课 APP下载
免费直播 一键购课
代报名等人工服务
- 1 传统数据和大数据的区别
- 2 数据分析的8种方法都是哪些?
- 3 3大常用的数据分析工具是什么?
- 4 数据分析的具体流程是什么?
- 5 excel中的运算符
- 6 数据分析的作用有哪些?
- 7 电子商务需要分析哪些数据?
- 8 数据分析包括哪些内容?
- 9 rdd是什么?
- 10 数据分析的基本步骤