三、心理测量的基本理论
心理测量的根本目的是帮助人们做出重要的决定。
(一)心理测量的理论基础
1.心理测量的基本概念
(1)心理测量的定义
心理测量:根据一定的法则用数字对人的行为加以确定
          即依据一定的心理学理论,使用一定的操作程序,给人的行为和心理属性确定出一种数量化的价值。
心理测验:对行为样组进行客观和标准化的测量,其本质上是心理测量的工具
          心理测验有三个要素,即行为样组标准化客观性
(2)心理测量的特点
①间接性——心理属性是内在的不可直接测量到的特质,但可表现为一系列具有内在联系的外显行为,测量者可以通过一定的
            方法测量这些外显行为,并由这些行为判别特质的性质。
②相对性——对人的行为进行比较,没有绝对的标准,亦即没有绝对零点,我们有的只是一个连续的行为序列。所有的心理测量都是看每个人处在这个序列的什么位置上,也就是只有顺序量表的特征。
③客观性——实际上就是测验的标准化问题。测验用的项目,说明、言语、态度、评分、分数转换、解释都需要标准化。
2.心理测量的特征分类
(1)按所测量的心理特征分类
①能力测验——个人已有的知识、经验、技能
②成就测验——经过正式教育或训练后对新知识和技能的掌握程度
③人格测验——性格、气质、兴趣、态度、品德、情绪、动机、信念、价值观等
(2)按接受测量的人数分类
①个别测验——一名主试在一段时间内测量一名被试
②团体测验——一段时间内一名主试同时测量许多人
考编制是干嘛的(3)按测验目的分类
①描述性测验——仅仅是进行描述
②诊断性测验——对为了解决存在的问题而预先做出的诊断
③预示性测验——了解人的潜能和未来的表现
(4)按测验要求分类
①最高作为测验——被试尽可能做出最好的表现
②典型作为测验——被试按通常的习惯和没有压力的方式做出反应
(5)按评价所参照的标准分类
①常模参照测验——将被试的水平与常模比较,以评价被试在团体中的相对地位为目的
②目标参照测验——将被试水平与一个绝对标准比较
③潜力参照测验——将被试水平与自身潜力相比较
3.经典测量理论和真分数理论模型
(1)基本定义
真分数:反映被试某种心理特质真正水平的数值
        其是一个在理论上构想出来的抽象概念,在实际测量中很难得到
观察分数:实测到的分数
          我们希望通过改进和完善测量工具及方法的方式来使得观察分数尽量接近真分数。
CTT数学模型:观察分数与真分数之间是一种线形关系,并只相差一个随机误差
            其中X表示观察分数;T表示真分数;E表示随机误差(不包含系统误差)
(2)CTT模型的三个假设公理
①反复测量得到的观察分数的平均值会接近真分数,E服从均值为零的正态分布
②真分数和误差分数之间的相关为零
③平行测验上的误差分数之间相关为零
  平行测验:题目不同的测验测的是同一特质,且题目形式、数量、难度、区分度以及测查等值团体后所得分数的分布一致
(3)CTT模型的方差关系
①在一次测量中,被试观察分数的方差等于其真分数方差与误差分数方差之和
②真分数变异还可以分成与测量目的有关的变异和与测量目的无关的变异
(二)测量的信度与效度
1.测量的信度
(1)信度的定义
信度:测量结果的稳定程度
      若能用同一测量工具反复测量某人的同一心理特质,则其多次测量的结果间的一致性程度就叫信度。
信度的三个等价操作定义:
①信度是一个被测团体的真分数的变异数与实得分数的变异数之比
②信度是一个被试团体的真分数与实得分数的相关系数的平方
③信度是一个测验与其任意一个平行测验的相关系数(这个定义具有实际意义)
(2)信度系数的估计
Ⅰ 重测信度:用同一个量表对同一组被试施测两次所得结果的一致性程度
            计算:其大小等一同一组被试两侧测验所得分数的皮尔逊积差相关系数
(参见《MJ心理大纲详解-心统》P8)
            实用的前提条件:①所测量的心理特性必须是稳定的
                            ②遗忘和联系的效果基本上互相抵消
                            ③两侧测验的间隔被试的特质没有变化
Ⅱ 复本信度:两个平行的测验测量同一批被试所得结果的一致性程度
            计算:其大小亦等于两侧测验分数的皮尔逊积差相关系数。
            前提:①有条件构造出两份或以上真正平行的测验
                  ②被试有条件接受两个测验
Ⅲ 分半信度:将一个测验分成对等的两半后,所有被试在这两半上所得分数的一致性程度
            也可以把对等的半测验堪称是在最短时距内施测的两个平行测验。
            计算:先按照复本信度的方式计算出半个测验的信度,然后用斯皮尔曼-布朗公式校正
                 
                  若两个分半测验分数变异不等时则用
            前提:①通常在只能施测一次或没有复本的情况下使用
                  ②由于将测验分半的方法很多,因此一个测验有多个分半信度值
Ⅳ 同质性信度:测验内部所有题目间的一致程度
              这里的一致性指所有题目都测的是同在一种心理特质,也指所有题目得分之间都具
有较高的正相关
          计算:为题目数,为答对答错题的比例
          表示所有被试在题上的分数变异
Ⅴ 评分者信度:多个评分者给同一批人的答卷进行评分的一致性程度
              计算:评分者为2用积差相关或登记相关,大于2用肯德尔和谐系数估计
(参见《MJ心理大纲详解-心统》P9)
(3)信度的影响因素与改进
影响因素:被试方面、主试方面、施测情景、测量工具、两侧施测间隔(越短越好)
提高方法:①适当增加测验的项目数
          ②使测验中试题的难度接近中等水平的正态分布
          ③提高测验试题的区分度
          ④尽量选取同质性较强的团体上的信度
2.测量的效度
(1)效度的定义
效度:一个测验或量表实际能测出其所要测得心理特质的程度
效度的操作定义:效度是总变异中由所测量的特性造成的变异所占的百分比
效度的三个性质:
①效度是针对一次或某几次测验的具体结果的
②效度是针对某种特定的测验目的的
③效度只是程度上的差异,不是有无的差别
(2)效度的估计
效度估计就是多方寻证据来证明测验的有效性程度的过程。(测量中效度与实验中不同,区别理解。    ——MJ注)
Ⅰ 内容效度:一个测验实际测到的内容与所要测量的内容之间的吻合程度
    估计一个测验的内容效度就是去确定该测验在多大程度上代表了所要测量的行为领域。
    适用范围:内容效度主要应用于成就测验,也适合于某些用于选拔和分类的职业测验而不是和能力和人格测验
    确定方法:①明确欲测内容的范围,包括知识范围和能力要求两个方面
              ②确定每个题目所测得内容,并与测验编制者所列的双向细目表对照
              ③制定评定表,考察题目对内容的覆盖率及其比例和内容的适当性并判断题目难度与能力要求间差异
    统计计算:从同一内容中抽两套平行测验对一批被试测验,两次相关高说明有效度(除非两个测验偏向同一方面);
              也可以用再测法,通过后侧成绩与前侧成绩比较。
Ⅱ 结构效度:测验能说明心理学上的理论结构或特质的程度,或用心理学上某种结构或特质来解释测验分数的恰当程度
    结构指用来解释人类行为的理论框架或心理特质,是心理学中抽象的假设性概念、特性或变量。
    特点:①结构效度的大小首先取决于实现假定的心理特质理论
          ②当实际测量的资料无法证实我们的理论假设时,不一定表明该测验结构效度不高
          ③结构效度是市通过对测量内容的选择的证据累计起来确定的,不是靠单一数量指标描述的