第三节测验的信度
第一单元信度的概念教材P348-349
一、信度的定义
信度是指同一被试者在不同时间内用同一测验(或用另一套相等的测验)重复测量,所得结果的一致程度。
二、信度的指标
1.信度系数与信度指数
大部分情况下,信度是以信度系数为指标,它是一种相关系数。
2.测量标准误
第二单元信度评估的方法 一、重测信度
1.又称稳定性系数。它的计算方法是采用重测法,即使用同一测验,在同样条件下对同一组被试者前后施测两次测验,求两次得分间的相关系数。
2.一般是两周到四周较宜,间隔时间最好不超过六个月。
来源:考试大 二、复本信度
1.又称等值性系数。它是以两个等值但题目不同的测验(复本)来测量同一群体,然后求得被试者在两个测验上得分的相关系数。
2.复本信度也要考虑两个复本实施的时间间隔。如果两个复本几乎是在同一时间内施测的,相关系数反映的才是不同复本的关系,而不掺有时间的影响。如果两个复本的施测相隔一段时间,则称稳定与等值系数。
www.Examda.CoM考试就到我考网 三、内部一致性信度
1.分半信度:分半信度指采用分半法估计所得的信度系数。修正公式是斯皮尔曼-布朗公式:
2.同质性信度:同质性主要代表测验内部所有题目间的一致性。
几个计算同质性信度的公式如下:
1.库德-理查逊公式2.克伦巴赫α系数
四、评分者信度:用于测量不同评分者之间所产生的误差。
第三单元信度与测验分数的解释教材P352-353
一、解释真实分数与实得分数的相关
信度系数可以解释为总的方差中有多少比例是由真实分数的方差决定的,也就是测验的总变异中真分数造成的变异占百分之几。
二、确定信度可以接受的水平
当rxx﹤.70时,测验不能用于对个人作出评价或预测,而且不能做团体比较;当.70≤rxx<.85时,可用于团体比较;当rxx≥.85时,才能用来鉴别或预测个人成就或作为。
三、解释个人分数的意义
作用:其一是估计真实分数的范围;其二是了解实得分数再测时可能的变化情形。
例:在一个智力测验中,某个被试的iQ为100,这是否反映了他的真实水平?如果再测一次,他的分数将改变多少?X―1.96SE<XT≤X+1.96SE
已知该智力测验的标准差为15,信度系数为.84,则其iq的测量标准误和可能范围为:
SE=
IQ=100±1.966=100±11.76≈88~112
四、比较不同测验分数的差异
例;某被试在韦氏成人智力测验中言语智商为102,操作智商为110。已知两个分数都是以100为平均数,15为标准差的标准分数。假设言语测验和操作测验的分半信度分别为0.87和0.88。问其操作智商是否显著高于言语智商呢?
首先计算出差异分数的标准误:
在统计上,经常要求两个分数的差异程度达到0.05的显著水平,才能承认不是误差的影响。因此,将差异标准误(7.5)乘以1.96,结果为14.7,这表明个体在韦氏测验两半得分的差异高于大约15分,才能达到0.05显著水平。上述被试的差异分数110-102=8是不显著的。
三、解释个人分数的意义
一般采用95%的或然水平,其置信区间为:
X―1.96SE<XT≤X+1.96SE
四、比较不同测验分数的差异
第四单元影响信度的因素教材P354-355
一、样本特征
(一)样本团体异质性的影响
(二)样本团体平均能力水平的影响
二、测验长度
(一)测验越长测题取样或内容取样越有代表性
(二)测验越长被试的猜测因素影响就越小。
三、测验难度
洛德(Lord)提出在学绩测验中,为了保证其可靠性,各类选择题的理想平均难度为:五择一测题,0.70;四择一测题,0.74;三择一测题,0.77;是非题,0.85。
四、时间间隔
两次测验相隔时间越短,其信度系数越大(参见专栏5-3信度的特殊问题)
注意事项
•斯皮尔曼-布朗公式为校正分半信度的经验公式,它的假设是两半测验分数的变异数相等。当假设不成立时,可以采用弗朗那根(Flanagan)公式或卢伦(kulon)公式之一,直接求得测验的信度系数。
•对于一些复杂的、异质的心理学变量,采用单一的同质性测验是不行的,因而常常采用若干个相对异质的分测验。
相关推荐:
心理测量学笔记第二节测验的常模
心理测量学笔记第一节概述
更多推荐:
2010年心理咨询师网校课堂
心理咨询师网友交流区