自考“心理测量”各章复习重点(2)
8、 复本信度:又叫等值性系数。
(1) 数据采集方法是:给被试施测两个内容等值但题目不同的测验,求两组数值的相关。计算方法常见的也是积差相关法。
(2) 复本信度的高低反映了两个互为复本的测验等价的程度,而不是反映一个测验本身受随机误差影响的大小。复本信度的高低关键取决于复本测验的选择,因而施题目取样问题,或者说是测验的内容取样问题。
(3)复本信度优于重测信度的地方是:避免了重测带来的记忆效应和练习效应;可用于长期追踪研究前后测量;减少了作弊的可能性。
(4)复本信度的缺点:有些测验的复本很难找到;有些测验因正迁移效应使测验性质改变;如测量的内容很容易受练习的影响,复本信度也无法清除这种练习效应。
(5)重测复本信度,即再不同的时间里施测两个等值的测验(复本),得到的相关就是重测复本信度,也叫稳定等值系数。它比单一的重测信度或复本信度都要严格、全面一些。
9、 斯皮尔曼-布朗公式:rnn = nrtt/1 +(n-13、 1)rtt,14、 rnn是校正以后的相关系数,15、 rtt是实得的相关系数,16、 n为rnn对应的测验长度与rtt 对应的测验长度之比。分半时,17、 n = N/(N/2)= 2(N为测验全长),18、 所以分半法信度的校正公式是:rxx = 2 rnn/1 + rhh 其中rhh为两半测验的相关系数。
(1) 卢伦公式:rxx = 1-Sd2/Sx2 其中Sd2是两半测验分数之差的方差,Sx2为总方差。
(2) 从理论上分析,分半信度反映的实际上是两半测验能够测量相同内容或心理特点的程度。
10、 内部一致性信度(同质性信度):同质性是指测验的所有题目间性质的一致性,即测的是同一种心理特质或行为。同质性是测量单一特质的必要条件。这里讲的同质性是指测验题目得分反映的心理特质一致,同质性的判别标准是:题目间呈高正相关,如果相关很低或是呈负相关,则题目为异质。
(1) 库德和里查德森提出的K-R20公式只适合预测题目是二分法计分的。克伦巴赫α系数适合于非二分法计分的测验的内部一致性信度估计法。
(2) 从同质性信度的含义我们不难看出,分半信度是求测验两半之间的一致性或同质性,而同质性是求所有题目间的一致性。因此分半信度实际上是同质性信度的一种,可以作为测验同质性评价的粗略估计指标。因为可以根据测验得分来推论或验证某种概念或理论构思,因此同质性信度也是一种构思效度,或叫结构效度,它实际上介于信度与效度之间。
11、 评分者信度:有些心理测验的得分不是根据客观的计分系统计分的,是由评分者来给被试打分,因此,这样的测验的可靠性如何取决于评分者评分的一致性和稳定性如何。
评分者信度因评分者人数不同而估计方法不一样。如果是两个评分者,独立对被试的反应评分,则可以用积差相关来计算,或用斯皮尔曼等级相关法计算。如果评分者在三人以上,而且是等级评分,则可以用“肯德尔和谐系数”(W)来求评分者信度。
12、 以测量标准误表示信度的好处是:
(1) 信度的单位与测验分数的单位相同,因此解释个人分数时非常直接,能直接指出允许测验分数变化的范围。
(2) 测验同质与否并不影响测量标准误的大小。测量标准误的不足之处时:无法比较不同测验间的信度高低。比较不同测验的信度用信度系数(rxx)解释个人分数时用测量标准误(SE)。
13、 常见的影响信度的因素有:样本特征、测验的长度、测验的难度、测量的时间间隔等。
14、 我们做信度考验时,常常选取一个与常模样本性质相同的样本施测,根据被试得分求出信度系数。
(1) 样本团体得分分布的影响:求信度的样本团体得分分布如果比较窄小的话信度就低。
(2) 样本团体异质性的影响:样本团体异质的话,测验分数的分布就比同质样本的要广,分数的离差就大,样本的方差就大,信度就高。实际上,高信度可能是假性高信度,是由样本团体的异质造成的。但如果常模总体要求各种各样的人,则异质的信度样本求得的信度就是真信度。这时,相反的情况就需要校正信度。
(3)样本团体平均能力水平的影响。由于信度也会因样本间团体平均能力水平的不同而不同,因此在求信度时,一定要注意信度样本与常模总体间是否一致。
15、 测验的长度:在其他条件均等的情况下,测验越长,信度越高。原因在于:
(1) 测验越长,即题目越多,测验的内容取样就越有可能有代表性。
(2) 测验越长,被试的猜测因素影响就越小。
16、 测验的难度:难度对信度的影响之存在于某些测验中,如智力测验、成就测验、能力倾向测验、教育测验等。测验的难度对信度有间接影响,因为如果测验过难,被试的得分会集中在低分区。过于容易,分数则集中在高分区。两种情况都使信度样本的得分范围变窄,变异量降低,从而低估测验信度。
17、 测验的时间间隔:这一因素之对重测信度和不同时测量时的复本信度有影响,对其余的信度来说不存在时间间隔问题。
第6章 效度
1、 效度是指:测验能测量到所要测量的对象的程度。这一定义包含着两层含义:测验测量什么?测验对测量目标的测量精确度和真实性是多少?
2、 效度的公式为:rxy = SV2/SX2它是与测量目标有关的真实分数方差与总方差的比率。其中rxy是常用的效度表示法;SV2是“有关的真实方差”,也就是由测验所要测量的心理变量引起的方差,也叫有效方差;SX2是总方差。
3、 信度和效度的差别是:两者所涉及的误差不同:信度仅考虑偶然的随机误差占测验总变异的比例,效度则还包括与测验无关的但稳定的测量误差。
(1) 信度是效度的必要而非充分条件。
(2) 效度是受信度制约的。
4、 效度的性质:效度的真实含义是指测验结果的效度,也就是测验结果的准确程度。
(1) 效度具有相对性。
(2) 效度具有连续性。测验的有效性只有程度上的差别。
(3) 效度也不是直接就可以测量到的,它是从已有的证据推理而来的。
5、 效度的种类:内容效度、构思效度和效标关联效度。
6、 效标关联效度是指:测验总分数与外在标20、 准(效标)之间的相关程度,反映的是用测验预测个体在某种情境下行为的表现如何的有效性程度。由于外在标准成了考察测验有效性的参照标准,因此简称为效标。
7、 阿斯丁把效标分为两个层次:一是理论描述水平的“观念效标”,二是操作定义水平的“效标测量”。
(1) 观念效标是效标的理论定义,效标测量是效标的操作定义,效标测量必须能真正反映观念效标。
(2)效标测量的一个重要特征是客观性。为此因做到:
1 避免偏见影响效标测量,特别是以等级评定为效标4 测量时,评分者的主观偏见会有很大影响。
2 防止效标污染,即指个人的效标因评定者知道个体的测验分数(也叫预测源分数)而受到影响。
8、 常用的效标:学业成就、临床诊断、实际工作表现、特殊训练成绩、效标团体比较、先前有效的测验、等级评定。
9、 同时效度:它的效标资料是和测验分数差不多同时搜集的。一般情况下,它可以代替预测效度。
10、 预测效度的效标是经过一段时间以后才获得的,预测效度反映的是从测验分数预测任何效标情境或一段时间后被试的行为表现的程度。转自环 球 网 校edu24ol.com
11、 构思效度就是:心理测验对某一理论概念或特质测量的程度。因此,研究构思效度就是要搞清楚:测验测量的是什么构思(概念或特质)?测验分数的变异中有多少来自于测验的理论构思?构思效度是没有单一指标的,它是由各方面证据累积起来作出评价的。
12、 确定构思效度的基本步骤:建立理论框架、根据理论框架推演出有关测验成绩的假设、用逻辑或实证的方法来证明假设。
13、 确定构思效度的方法:测验内部的方法、测验间的方法、效标效度的研究、实验和观察法验证。
(1) 测验内方法:这类方法是通过研究测验内部结构来界定理论构思,从而为构思效度提供证据。
(2) 确定方法是:分析测验的内容效度和测验的内部一致性分析。测验的内部一致性可以由分半信度、α系数、KR20或KR21等指标来衡量,它们考察的是测验题目是否同质,分测验与总测验是否一致或同质,这些都可以证明测验所测量的构思是否合理,因而构成了证实构思效度高低的证据。
(3) 有时分析被试对题目的反应特点也可以作为构思效度的证据。
(4) 测验间的方法:通过分析几个测验间的相关关系,找出其共同之处,进行推断这些测验测量的特质是什么,也可以确定这些测验构思效度如何。最简单的方法是计算两种测验之间得分的相关。区分效度是构思效度的又一个证据。因素分析法也是建立构思效度的常用方法。
(5)实验法和观察法证实:观察实验前和实验后分数的差异也是验证构思效度的方法之一。
14、 内容效度是指:测验题目对有关内容或行为总体取样的适当性程度。因为这种效度主要是考察测验的内容,因此叫内容效度。
(1) 要想使测验的内容效度高,必须又两个条件:内容的范围或行为总体必须界定名确;测验题目应该是所界定的内容范围的代表性样本。
(2) 内容效度的确定方法:老师判断、经验判断、统计分析法。转自环 球 网 校edu24ol.com
15、 表面效度是指:一个测验看起来好象是测量所要测的东西的程度。换句话说,当那些未经过训练的被试或测验应用者认为某测验是有效的测验时,该测验就有表面效度。
16、 效度的指标是指:效标关联效度和构思效度的的指标。效度指标一般有:效度系数、统计推断参数、预期表等。
17、 效度系数:它是最常用的效度指标,尤其是效标关联效度。它是以皮尔逊积差相关系数来表示的。效度系数的实际意义常以决定性系数来表示,表达式是rx2y,效度系数的平方就是决定性系数,测验正确预测或解释的效标的方差占总方差的比例。
18、 效度的其他指标:一些描述不同团体的差异的统计指标(参数)也可以作为效度的指标,比如:t考验、F考验、重叠百分比等。
19、 效度的影响因素:测验本身的因素、测验施测的样本的性质、效标的性质等。
(1) 对于测验本身因素又可分为:测验题目的质量、测验的长度、测验实施中的干扰、被试的因素等。
(2) 样本的性质:
1 影响之一是:不同的团体对同一测验的反应可能会不一样,因被试的背景不同,对测验的题目可能采取完全不同的方法来回答。
2、响之二是:同一个测验,效度团体的性质不同,效度也会有很大差别。效度团体的性质包括年龄、性别、教育程度、智力水平、动机、职业等有关的特点,1这些性质特点使测验对不同的团体具有不同的预测能力。故称为干涉变量。
3 影响之三是:样本团体的异质性。其他条件相同的时候,样本同质性越高,效度越低。
第7章 项目分析
1、 项目分析是指 :一组分析被试对测验项目的反应的统计方法,而广义的项目分析则还包括内容效度分析和项目编写的分析。
2 最简便的难度指标通过率:所谓通过率就是在回答某个项目的样本中,正确回答该项目的人数的百分比。
3 项目难度与测验难度的确定:
(1) 对题目难度来说,如果项目过难或过易,就会造成被试基本上都答错或基本上都答对了,也就是P值接近0或1,这样也就不能区分被试能力的差异。大体而言,项目难度为。50时最理想,此时项目具有最大鉴别力。
(2)在实际操作时,一般只需使项目的平均难度接近。50而各个项目的难度在。50±。20之间变化。如果测验是用于选拔或诊断,则最好多选一些难度与录取线接近的项目。在项目选择上还有一个要注意的问题是:当项目形式是选择题时,要考虑到让P值大于概率水平,否则项目是无效的。
4 鉴别力分析的设想基础:如果单个项目与测验测的是同11、 一特性,那么我们可以预期在测验上得高分的人正确回答这一问题的概率大,而在测验上得低分的人正确回答这一问题的概率低。鉴别力分析就是在这一设想的基础上进行的。项目的鉴别力就是其对于所测量的心理特性的区分能力。
5、 鉴别力分析的一般方法:鉴别力指数、项目-总分相关、项目间相关。
6 鉴别力指数是:运用极端组计算项目鉴别力的一种简单方法。公式为:D = PH-PL是高分组在项目上的通过率,而是低分组在项目上的通过率。
当D<。19是,项目差,必须淘汰;但D在。20 ~ .29之间时,项目尚可,但必须修改;当D在。30 ~ .39之间时,项目良好,但还是最好稍做修改; 而当D.>40时,项目完全可以被接受,但一般测验,D>。30项目就可以接受了。
7 项目总分相关是:被试在项目上的得分与其总测验分的简单相关。
8 难度水平与鉴别力:难度水平直接限制了一个项目的鉴别力。如果当P值接近。50,项目最可能具有高的鉴别力。但是,P值接近。50并不能保证项目有高的鉴别力,只能说在统计上已经没有限制了。
9 项目特征曲线:运用图象直观地显示了随着测验者某种心理特征水平的变化,正确回答某个项目的概率是如何变化的。项目特征曲线是现代心理测量学最有影响的理论之一-项目反应理论或称潜特征理论的基础。ICC归纳了项目分析的信息,显示了心理能力水平与项目反应之间的关系。
当项目-总体相关为正时,ICC的斜率也是正的;当相关接近0时,ICC斜率也接近于0;当相关为负时,ICC斜率为负。
10、剪裁测验:如果能使测验适合于每个测验者的水平,那么就不用对每个人施测长长的每个能力水平上均有项目的测验。这种测验就称为剪裁测验,又称计算机化的适应测验。
第8章 智力测验
1、 关于智力的定义:
(1) 斯皮尔曼(Spearman)认为:智力是一种普遍的能力,它主要涉及联系的引出和相关的引出。
(2 比内和西蒙(Binet & Simon)认为:智力是正确地进行理解、判断和推理的能力。
(3 韦克斯勒(Wechsler)认为:智力是个体有目的地行动,理性地思考以及有效地应付环境的总体能力。
2、 智力是:通过经验进行学习的能力;适应环境的能力。
3、 智力的理论-Spearman和g 因素:
(1) 在对各种智力和感觉能力的相关模式进行广泛研究之后,提出智力由两种因素组成:一个一般因素g、若干个特殊因素S.
(2 它认为g因子是整个大脑皮层共有的能力或能量,而S因子只是代表了大脑中某些神经元的生理功能。
4、 智力的理论-Thurstone与基本心理能力:Thrustone总结出了七种基本心理能力:语词理解、数字、空间、知觉速度、语词流畅性、联想记忆、归纳推理。
5、 智力的理论-Cattell与流体智力-晶体智力:Cattell确定了两大因素:流体智力、晶体智力。
(1) 流体智力:基本上是非语言、相对不受文化因素影响的心理功能。它与个体通过遗传获得的学习和解决问题的能力有联系。
(2 晶体智力高度依赖于文化,是个体完成那些需要习得性或习惯性反应任务的能力。晶体智力是流体智力运用在不同文化环境中的产物。
6、 智力的理论-Piaget的认知发展理论:主要观点:
(1) 儿童的思维与成人的思维存在质的差别。守恒是指:在物体表面看来发生变化时,能意识到物体的实质没有变化。
(2 认知发展可分为四个阶段:感觉运动阶段、前运算阶段、具体运算阶段、形式运算阶段。
(3 图式是知识获得的基础。图式是经过组织的行为模式或定义明确的心理结构。
7、 Guilford与智力结构模型:Guilford在1967年提出了一个智力结构模型。这一模型为三维立方体,每一维代表一个变量。它包括:
(1) 自变量:代表思维的内容。
(2) 中间变量:代表思维的操作。
(3) 因变量:代表思维的产物。
8 Sternberg与智力的三主理论:该理论包括三方面:成分智力、经验智力、情境智力。
9 韦克斯勒智力测验:
(1) 韦克斯勒是从1932年开始他的测验编制的。目的是为了设计一个适合于测量精神病人的智力测验。第一个韦氏测验出版在1938年。他将量表分为言语、操作两大部分。这一区分使我们可以比较测验者使用词语和符号的能力和操作实物、感知视觉模式的能力。
(2) 韦氏验的一般特点:
1 几个重要的韦氏测验:1939年韦克斯勒-贝利弗测验;1949年韦克斯勒儿童智力量表(WISC);1974年韦克斯勒儿童智力量表修订版(WISC-R);1991年韦克斯勒儿童智力量表第三版(WISC-Ⅲ)。
2 各个韦氏测验的特点:
A. 10 ~ 12个分测验:多个分测验使我们不B. 仅得到总IQ,C. 而D. 且可以分析个体智力上的强点和弱点。
E. 言语量表和操作量表各由5 ~ 6各分测验组成。这体现了左右脑功能的整合。
F. 共同G. 的IQ计分系统。这使我们可以比较被试的分测验分数,H. 了解其相对强弱。
I. 不J. 同K. 年龄组由相同L. 的分测验有助于测验间的相互比较。
3 韦克斯勒测验的分测验:常识、数字广度、词汇、算术、领悟、相似性、填图、图片排列、积木图案、物体拼凑、译码或数字符号、迷津、句子、几何图形、动物房。
A. 常识是:一般知识性知识问题,B. 要求被试用几句话或几个数字回答,C. 问题从易到难排列。缺点是容易受到文化背景和被试熟悉程度的影响。
D. 数字广度:由顺背和倒背两部分组成。
(4) 韦氏成人智力量表修订版:WAIS-R共有11个分测验,其中包括六个言语量表:常识、数字广度、词汇、算术、领悟、相似性;五个操作量表:填图、图片排列、积木图案、物体拼凑、数字符号。所有11个分测验分数合并成全量表分数,并可以分别求得三个智力商数:言语智商(VIQ)、操作智商(PIQ)、总智商(FIQ)。
WAIS-R的标准化,被试年龄从16 ~ 74岁。
(5 韦氏儿童智力测验修订版(WISC-R)适用于6 ~ 16岁儿童。它由五个言语分测验和五个操作分测验组成。此外还有2个补充分测验。
(6 韦氏学前和小学儿童智力测验修订版(WPPSI-R)该测验与WPPSI极为相似,只是年龄范围从原来的4 ~ 6.5岁儿童扩展到3 ~ 7岁3个月儿童。
(7韦氏智力量表中国修订版:从1979年起中国韦氏测验的修订工作由湖南医学院龚耀先教授主持进行,于1982年出版了WAIS的中国修订版,WAIS-RC.
10 个体智力测验:
(1) 斯坦福-比内智力量表:
1 1916年量表:首先采用了智商这一概念。
2 1937年量表:年龄范围从1916年量表的3 ~ 13岁扩展为2 ~ 18岁,并且编制了测验复本,分别为L型和M型。
3 1960年量表:该量表采用离差智商。
4 斯坦福-比内第四版(SB:FE):该版的最大改变在于采用智力层次模型来划分和构建分测验。
SB:FE的智力模型:SB:FE的编制者用一个三层次的认知能力结构模型作为编制量表的框架。这一模型的最高层是一般智力g因子;第二层分成晶体智力和流体智力,此外又增加了短时记忆能力。短时记忆能力包括珠子记忆、句子记忆、数字记忆和物体记忆四个分测验。
(2) 考夫曼儿童成套评估测验(K-ABC)是智力和成就的综合测量。K-ABC是以神经心理学和认知心理学研究为基础,以“个体问题解决和信息加工模式”定义智力。
K-ABC提供四个方面的分数:系列加工、同时加工、综合心理加工、成就测验。
(3) 能力区分量表(DAS):适用于2岁6个月到17岁11个月的儿童。
11 团体测验于个体测验的差异:
团体测验采用多项选择,而个体测验多采用开放式问题。
团体测验多采用客观的计算机评分,而个体测验一般为施测者评分。
团体测验为团体施测,个体测验为个体施测。
团体测验多用于筛选,而个体测验多用于诊断及弥补工作。
团体测验标准化样本极大,而个体测验一般只用几千名 精心挑选的被试。
12 团体智力测验:
(1) 文化公平智力测验(CFIT)是:一个非言语流体智力测量,最早由R.B.Cattell发表在《教育心理学》期刊上,它的目标是测量流体智力,避免文化因素的干扰。
(2) 瑞文渐进测验(RPM):该测验既可以个体施测,但更多作为团体施测。
该测验实际上是三个不同的测验:瑞文儿童彩色渐进测验、瑞文标准渐进测验、瑞文高级渐进测验。
我国由北京师范大学张厚桀教授主持,从1985年起对瑞文测验进行修订。
13 图书群体测验的类型:非言语测验(古德依纳芙-哈里斯绘人测验)、非阅读性测验、婴儿智力测验、发展程序表。
14 非阅读和非动作测验-皮波迪图画词汇测验修订本(PPVT-R)是:由L.M.Dunn编制,1981年修订的测验。测验由175张图片组成,每张图片上有4个图形。PPVT-R适用于2岁半到成人,测验需用时10 ~ 20分钟。由于不需要语言反应,所以常用于言语障碍、大脑麻痹、阅读困难和智力落后的被试及孤僻、注意不集中的儿童。
15、婴儿智力量表:
(1) 葛塞尔发展程序表:该量表是最早编制于1925年的第一个婴儿智力量表。测量包括五个领域:大运动、精细运动、语言发展、适应行为、个体-社会行为。这一量表主要用于临床筛查和诊断。
(2) 丹佛发展筛查测验(DDST):主要用于筛查智力发展的大致范围,它评定了四个行为领域:个人-社会行为、精细动作适应行为、语言、大运动。
16、遗传和环境对智力的影响:遗传对智力的影响在研究中一般用遗传指数来表示。遗传指数为0意味着遗传在某种特质上不起作用;遗传指数为1意味着遗传完全决定了特质。当然,遗传对大多数特质的影响介于0 ~ 1之间。
第9章 能力倾向测验
1、 能力倾向测验一般指:测量从事某种职业或活动的潜在能力的评估工具。
2、 能力倾向测验可分成:一般能力倾向测验、特殊能力倾向测验和多因素能力倾向测验。其中一般能力倾向测验现在就是指4、 智力测验。而5、 狭义的能力倾向测验专指6、 后两者。
3、 能力倾向测验与智力测验的关系:
(1) 智力测验一般得到的是对个体总智能的评估分数,而能力倾向测验则测量的是某种特定的或多因素的组合。
(2) 智力测验与能力倾向测验的另一个区别就是:克伦巴赫提出的带宽和精确度。带宽是指测验可预测的效标全距,测验能预测的效标总数越大,则这个测验的带宽越大,智力测验比能力倾向测验的带宽普遍要大。精确度是指测验可在多大程度上预测效标,一般而言能力倾向测验的精确读为更大一些。
4、 能力倾向测验发展主要的原因:
(1) 智力测验的局限:早期智力测验的编制者,希望通过广泛地测量心理功能,从而估计个体的总体智力水平。但是所谓的智力测验只是涉及到智力的某些方面而已。
(2)体能力倾向的差异:个体在某一测验的各部分上的作业,常常表现出显著的差异。这种个体内变异在智力测验上表现为分测验得分的差异。智力测验往往不足以作出这种个体能力倾向差异的分析。
(3)素分析技术的发展:因素分析使我们能够编制多重能力倾向测验,从而为个体各种能力倾向的强弱提供比较。来自实际的需要。
5、 能力倾向测验的特点:能力倾向测验预测失败比预测成功更为正确;必须审慎解释各种特殊能力分数间的差异;能力倾向测验在训练计划中应审慎运用。
6、 多因素能力倾向测验:该测验被用来测量个体在不同领域内的技能和知识,从而为职业咨询、分类和人员安置提供最有效的信息。这种测验的结果不是一个总分或IQ,而是一组不同能力倾向的分数,它们提供了一种智能剖面图,显示出个体的强点和弱点。
7、 多因素能力倾向测验发展的原因:对个体内在差异的认识、对一般智力测验特征性的认识、职业咨询和分类的需要。统计学发展的影响。
8、 工业能力倾向成套测验:多用于工商业的人员选择与安置。它包含了测验有一般智力测验及数学、知觉、机械和心理运动能力测验。它还建立了一组职业能力模式。
9、 一般能力倾向测验(GATB):由美国就业服务社编制。研究者们在工作分析和对59各测验因素分析的基础上,设计了GATB,主要用于职业咨询。它共有12个分测验,8个纸笔测验和4个仪器测验。适用于高中至成人。
第10章 成就测验
1、 成就测验的历史发展:
(1) 最迟在汉朝,中国便已经有了非正式的考试制度。公元1370年(明朝初期)笔试成为科举取士的一部分,这可视为成就测验的正式开始。
(2) 今天在世界各地广泛应用的标准化成就测验发源于美国,始创者是赖斯。另外一个早期的奠基人是桑代克。并且桑代克被公认为是教育测验的鼻祖。
2、 成就测验和智力测验、能力倾向测验的区别:成就测验和智力测验、能力倾向测验的测量对象都是认知性特质。这三种测验都是测量个体从与环境的相互作用经验中发展出来的能力。所以在本质上,它们有相同之处。能力倾向、智力测验所测量的也可以看作一种“成就”。不过,如果从测验的目的、性质及所含盖的经验范围来看,这三种测验仍有某些不同之处,不能相互取代。
就测验的对象而言,三者本质上有重叠之处,无法加以截然区分。大多学者认为成就测验测量的是一些特定的、限定于某一范围的能力和知识,而另两者所测验的则为一般性的、较为广泛的能力。
从功能上看,成就测验也不同于智力、能力倾向测验。后两者的主要功能是预测一个人在未来的教育、训练或工作经验中可能的表现,它们的使用是在教育或训练程序以前,用以反映被试是否有接受某种课程或专业技能训练的能力。成就测验则是评估被试在接受一些教育或训练程序后所获得的学习成果,它的实施发生在教育、训练过程后。在测验的技术品质上,成就测验要注重内容效度,而能力倾向、智力测验则必须有较高的预测效度,否则就失去其基本价值。
3 成就测验的功能:考查和报告学习成就、筛选和安置、诊断、评估教育计划或教育质量。成就测验可以用于评估某种教学法和教学程序的功效,以作为改进教材和教法的参考。
4、 成就测验的分类:成就测验可从其内容、用途、编制方法和原理等四个方面进行分类,具体可分为:单科测验与成套测验、评估性测验和诊断性测验、标准化测验和教师自编测验、常模参照测验和效标参照测验。
5 低成就与学习障碍的评估:
(1) 低成就是指:学生在学业上的成就低于其所具有的学习能力。
(2)学习障碍可视为低成就中的一类。有关学习障碍的定义,使用最广的是美国联邦法的规定:“学习障碍是指和口头或书面语言的理解和应用有关的一种或多种基本心理过程有障碍,这种障碍可表现在听、想、说、读、写或数学运算的能力不足。”
(3)学习障碍的特点:
1 学习成就和一般智力之间不一致。
2 习障碍的绝大多数定义包含了排除标准。
3 障碍是异质性的。
4 习障碍是一类发展现象。
5 习障碍个体经常会因学业成就差而8 遇到社会交往和情绪适应上的困难。
6 学习障碍的评估:
(1) 在学习障碍的评估中,最基本的工具是:信度、效度可靠的成就和智力测验。大多数学习障碍组合测验包括这两个领域的主要测量工具,如斯坦福-比内智力测验、韦克斯勒儿童智力测验及皮波迪个人成就测验、考夫曼教育成就测验等。
(2)为了保证儿童能从学业方面的补救措施中受益,测验者有必要了解是否有社会交往和情绪适应问题。在这方面常用的测验工具有:儿童人格问卷(PIC)和考纳斯教师评定量表(CTRS)。
7 儿童多动症的评估:儿童多动症或称注意缺陷多动症(ADHD)是一种行为综合症。症状为注意缺陷、多动,21、 患者有轻微的脑功能障碍。考纳斯编制了一系列辨别儿童多动及其他行为问题的评定量表。其中,22、 考纳斯教师评定量表有两种版式,23、 一个包含28个项目(CTRS-28),24、 一个包含39个项目(CTBS-39)。另外考纳斯父母评定量表(CPRS)也有两个版式:一个包含48个项目(CPRS-48),25、 另一个包含93个项目(CPRS-93)。
第11章 人格测验
1、 心理测验依据所测量的心理特质或行为,2、 分为:认知性和非认知性两大类。非认知性测验所测的特质或行为是情感性的。按照知、情、意的传统三分法,前者是对知的方面,后者则是对情和意的方面的测验。
2、 认知性测验和非认知性测验的区别:
(1) 认知性测验和非认知性测验在对被试的要求上,有一个很大的不同。认知性测验基本上是最佳表现测验,其目的是测得被试的最高能力或水平,被试应该尽最大努力做正确回答。而非认知性测验是典型表现测验,其目的是对被试的日常一般行为做代表性的取样,而不是测量其是否有行为能力。非认知性测验的答案并无“对”、“错”之分。测验者关心的是被试的反应能否确切地代表他或她的典型行为。
(2)非认知性性质的测量中,人格测验都占有中心的地位。广义的人格是指:个体所具有的能力、能力倾向、需要、动机、情绪、性格、兴趣、态度及其它心理和行为的差异的总和,既包括认知性变量,又包括情感性变量。
3、 自陈量表:又称自陈问卷,是由被试本人对自己的人格特质,按照自己的意见进行评定的一种方法。它们的一个特点是高度结构化,每一量表通常包括一个或多个系列数目较多、内容明确具体的叙述语句,项目形式多为是非题或选择题。另一个特点是它们一般都建立了标准化常模,标准化和量化的结果必然会减少测验者主观因素的介入。自陈量表的高度客观性是它的一个显著优点,因此它有时又被称为客观式人格问卷。
(1) 自陈量表的编制方式:理论推演法、经验效标法、因素分析法。
理论推演法的特点式以理性的逻辑或已知的人格理论作为测验编制的基础。测验者根据要测的人格概念,找出有关的行为、情绪状态、信念等,编成具体项目。然后,再依据试测的结果与理论假设是否一致,对初始量表进行项目分析、修改、并建立常模。
(2) 典型的力量推演法量表:爱德华个人偏好量表(EPPS)、显相焦虑量表(MAS):也是根据理论推演原则编制的典型测验工具。1953年泰勒为了研究个体的瞬眼条件反射,编制了这一量表。
4、 经验效标法:以经验效标法编制人格测验,对要测的人格特质,并不需具有既定的理论基础或假设。编者时,测验项目的选择完全是以实证资料为依据,即只保留那些能够将效标组与控制组分开的项目,而不管其内容看起来是否合理。典型的经验效标法量表有:
(1) 明尼苏达多相人格调查表(MMPI):是当今人格量表中使用最广而且最受研究者重视的一种。MMPI包括14个分量表,其中10个临床量表和4个效度量表。MMPI中的测验结果将原始分数转化成T分数,超过70的分数被称为高粉,可能指示着精神障碍的存在,值得特别注意。MMPI-2于1989年推出。
从1980 ~ 1989年的十年间,我国以宋维真为首的研究小组对中文版MMPI几经修改和测试,于1989年1月正式发表了MMPI的测查表与使用手册。
(2) 加洲心理量表(CPI)是一个类似MMPI的经验效标问卷,最新修订本出版于1987年。CPI主要用于测量正常人格维度。
5、 因素分析法:
(1) 这种方法的理论假设是,如果一项人格测验能真正测量要测的特质,那么它包含的各测验项目必须具有显著的内部一致性。使用此法编制测验时,编制者要根据对某一问题已有的各方面知识,编制大量项目,施测于大样本,然后将所得资料进行因素分析,最后得到的一个或几个因素即代表这些项目所测的人格结构。编制者可将具有显著因素负荷量的项目保留,进行因素命名,并组成一个人格测验。
(2)因素分析量表的典型代表:16PF和EPQ.
1 16人格因素问卷即卡特尔人格因素问卷是卡特尔根据自己的人格特质理论,运用因素分析方法编制的。16PF的计分方法是将各量表原始分数转换成标准分数,并由此绘出被试的剖面图。
2 EPQ-艾森克人格问卷:共含内-外倾(E)、神经质(N)、精神质(P)三个分量表和一个效度量表(L)。E量表的高分表示人格外倾,低分则表示内倾。N量表得高分的被试可能焦虑、担忧、郁郁不乐、情绪反应强烈、以至出现不够理智的行为。P量表的高分则可能表示孤独、不关心他人、难以适应外界环境、感觉迟钝、与他人关系不佳、喜欢寻衅闹事等。L量表测量说谎或掩饰,但也代表假设的一种人格特质,即社会朴实或幼稚。
在EPQ测试结果上,男、女有差异;P、E、N量表得分随年龄增加而下降,L则上升。精神病人的P、N分数都较高,L分数极高。EPQ有良好的信度和效度。
EPQ的中文版,在北方地区有陈仲庚等人的修订本,南方有龚耀先、刘协和等人的修订本。EPQ广泛应用于人格研究,较少应用于临床及其它场合。
6、 序列系统法:人格研究表是杰克逊根据默瑞的需要理论设计的,共有22个量表。
7、 投射测验是:人格评估的工具之一,它通过被试对模糊不清、结构不明确的刺激的反应,分析、推断其人格特点。它的基本假设是:一个人对暧昧不明、非结构化的刺激的反应,由于没有明确的情境线索、过去经验或他人的观点的影响,会反映出其自身独特的人格特征。刺激本身并不含有一定的意义,然而它们所引发的反应则是有特殊意义的。此一意义来自被试对测验刺激的主观解释和想法,在不知不觉中,投射出其心理上的需要、个性、情绪、动机、冲突、防御等内在状态。
8、 投射测验的理论基础:投射技术的缘起和发展与心理分析理论有密切关系。投射测验的设计者常用心理分析观点作为指导来选择刺激,解释测验的结果。
(1) 罗夏克墨迹测验(RIT):是由瑞士精神病学家罗夏克编制的使用最广泛的墨迹测验。
1 1921年,他从所使用的墨迹中筛选出10张图片出版,这就是著名的RIT.在10张图片中,有五张是黑白的,有两张除黑白外,还有红色墨迹,其余的三张则为淡彩色,每张图片上的墨迹都是对称的。
2 实验的实施分为三个阶段:自由联想阶段、询问阶段、极限试探阶段。
11 RIT的计分和解释通常从三方面进行:
A. 反应的部位:测试者要根据被试是对墨迹图的整体、局部,B. 还是对空白处做反应,C. 将各反应分类。
D. 反应的决定因素:是指E. 被试做反应的依据,F. 包括形状、彩色、阴影等。
G. 反应的内容:指H. 被试回答的内容。
12 RIT主要适用对象是成人,但也克应用于三或五年级以上的儿童。
(2) 主题统觉测验(TAT):由默瑞和摩根在1935年编制出版。TAT的材料包括31张图片,其中一张为空白图片。图片中绘有主题不明确的一些图画,大多数图画中包含人物。测验者每次给被试看一张图片,要求他/她讲一个故事,在指导语中鼓励被试尽量发挥想象力。
(3) 语句完成测验的程序是要求被试将一系列的句子补充成为完整句子。
9、 对投射测验的评价:
(1) 鉴于心理学家和临床工作者对人格的深层结构或无意识仍保持相当兴趣,投射测验作为相应的测量工具仍有其地位。因为其它人格测验根本就不以无意识内容作为测量对象。
(2) 投射测验作为一种测验工具,在评分、解释的客观性及信度、效度等测量指标上有待提高。
(3) 应该加强从事投射测验人员的训练工作。
10、 主体测验:是一类非结构或半结构化的、随意而非伪装的人格评估技术。
(1) 主体测验一般包括会谈和自我概念的测量。
(2) 会谈从结构性质上来分,包括结构型会谈和非结构型会谈。
(3) 语义区分测验(SDT)最早出自奥斯古德等人1957年的语义心理学研究。
11、 Q-分类或称Q-技术是:由司蒂芬森1953年创立的,用于单一被试前后测验结果的相关或两个人测验结果的相关分析。Q-分类对研究自我概念的变化特别有用。
第12章 兴趣、态度和价值测量
1、 在兴趣测量方面贡献最大的是:史特朗,他在1927年完成了第一个正式的职业兴趣量表。另一个主要贡献者是库德。
2、 兴趣的研究:
(1) 荷兰德认为:兴趣是个体人格的表现,个体对职业的选择受到动机、知识、爱好和自知力等因素的支配,但最主要的影响因素是兴趣和人格。荷兰德界定出六种主要人格或兴趣类型,与它们相应的是六大普通职业主题。
(2) 罗伊认为,职业兴趣及职业选择的首要因素,是由儿童与家庭成员的关系造成的。一个温暖、和谐的家庭会使儿童成为“以人取向”者,而一个冷漠、疏离家庭中的儿童则具有“以事取向”的特点。职业选择的另一个维度是从“有目的交流取向”到“利用资源取向”。依据这两个连续的维度,可以对职业角色进行分类。
3、 史-坎兴趣量表:其前身是史特朗职业兴趣量表(SVIB)。SVIB是由史特朗在1927年首先编制,当时仅适用于男性。专门为女性而编制的量表则于1933年出版。
4、 总加量表:里克特1932年所设计的总加评定法在编制态度量表时较为简易。这种方法假设每一项目都具有同等量值,不同被试对同一项目反应上的程度差异可以进行分极评定。
最新资讯
- 考前必背!自学考试《中国近现代史纲要》论述题高频考点2024-10-19
- 自考报考策略:科学搭配科目,加速毕业进程2024-07-20
- 2025年考研考生五一假期,英语科目应该如何复习?2024-05-03
- 备考指南!2024年4月自学考试考前要做哪些准备?2024-03-31
- 考前备考冲刺!自考如何一次就过?2024-03-30
- 考点汇总:《中国近现代史纲要》论述题2024-03-25
- 备考资料:《中国近现代史纲要》简答题考点汇总2024-03-25
- 自考可以从哪些维度进行备考?2024-02-17
- @自考生,这里有备考技巧2024-02-17
- 自学考试备考复习方法!建议收藏2024-02-16