结构效度

跳转到: 导航, 搜索

结构效度是指一个测验实际测到所要测量的理论结构和特质的程度,或者说它是指测验分数能够说明心理学理论的某种结构或特质的程度;是指实验与理论之间的一致性,即实验是否真正测量到假设(构造)的理论。

结构效度的概念最初是由美国心理学会(APA) 、美国教育研究协会(AERA) 和美国国家教育测量协会(NCME) (1954) 联合委员会提出,发表于《心理测验和诊断技术的技术建议》,本意是用于当测验者所测属性没有确定的标准测量,而必须使用间接的测量来证实理论有效的时候。结构效度的出现,可以看成是自比奈发明智力测验以来,测验领域中最为显著的变化。它标志着测验和历史传统与实用传统彻底决裂,而且至今仍以显著的方式改变着测验事业。

结构效度是指一个测验实际测到所要测量的理论结构和特质的程度,或者说它是指测验分数能够说明心理学理论的某种结构或特质的程度。它关系到我们依据测试成绩所做的、对评价测试结果的解释是否有意义并且恰当。罗德和诺维克认为“测试最重要的特性在于它的结构效度”。

结构效度的特点与应用范围:

根据定义,可以得知结构效度具有如下一些特点:

(1)结构效度的大小首先取决于事先假定的心理特质理论(戴海崎, 张锋和陈雪枫,2007)。要使得关于某一特质测验的结构效度的研究结果可以进行比较,则对于该特质的假设和定义就应该相同。否则,不能进行比较。

(2)由于有可能出现理论假设不成立,或该试验设计不能对该假设作出适当的检验等情况,因此当实际测量的资料无法证实我们的理论假设时,并不一定就表明该测验结构效度不高。

(3)结构效度是通过测量什么和不测量什么的证据累加起来给以确定的,因而不可能有单一的数量指标来描述结构效度。

结构效度主要用于智力测验、人格测验等一些心理测验方面。

确定结构效度的方法:

测验编制者确定结构效度的方法

(1)考察测验的内容效度,因为有些测验对所测内容或行为范围的定义或解释类似于理论构想的解释,所以内容效度高实质上也说明结构效度高。

(2)计算测验的同质性信度的方法来检测结构效度。若有证据表明测验不同质,则可以断定该测验结构效度不高。

(3)利用相容效度法,考察新编制的测验与某个已知的能有效测量相同特质的测验之间的相关。若两者相关较高,则说明新测验有较高的效度

(4)利用区分效度法,考察新编测验与某个已知的能有效测量不同的特质的旧测验间的相关。若两者相关较高,表明测到了其他心理特质,则新测验效度不高。

(5)对一组测验进行因素分析,找出影响测验的共同因素,每个测验在共同因素上的负荷量(即测验与各因素的相关)就是测验的因素效度,测验分数总变异中来自有关因素的比例就是该测验结构效度的指标。

(6)综合应用相容效度法和区分效度法,若用多种极不相同的方法测量同一种特质相关很高,或用极为相似的方法测量不同特质相关很低,则说明测量效度很高。若有多种特质都接受了多种方法的测量,就可以分别计算出任意两种方法测量同一种特质的相关和测量不同特质的相关,以及任意两种特质接受同一方法和不同方法的相关。

使用者确定结构效度的方法

(1)分析被试答题的过程。若有证据表明某一题的作答除了反映所要测的特质外,还反映其他因素的影响,则说明该题没有较好地体现理论构想,该题的存在会降低结构效度。

(2)根据所要预测的效标的性质和种类来推断结构效度,有两种做法:其一,根据效标把人分为两类,考察其得分的差异。若两组人得分差异显著,则说明该测验有效,具有较高的结构效度。其二,根据测验得分把人分成高分组和低分组,考察这两组人在所测特质方面是否有差异。若两组人在所测特质方面差异显著,则说明该测验有效,具有较高的结构效度。总结

结构效度的最大贡献是可以用来提出和验证假设,是发展心理学理论的重要研究工具。当然结构效度也有其明显的局限性,特别是当测验结果不能验证原来的构想时,我们不能确定是构想有错误,是测验本身缺乏内容效度,还是实验设计有问题。这说明结构效度发展还未完全成熟。

关于“结构效度”的留言: Feed-icon.png 订阅讨论RSS

目前暂无留言

添加留言

更多医学百科条目

个人工具
名字空间
动作
导航
推荐工具
功能菜单
工具箱