访问手机版| 职校网| 一级建造师|二级建造师|一级消防工程师|经济师|初级会计师|中级会计师|注册会计师导航
  • 各地招聘直达:
  • 当前位置:首页 > 学历教育 > 自考

    2016年考研心理学高频考点汇总表(2016年考研心理学高频考点汇总图)

    作者:admin  来源:www.zxedu.cn  发布时间:2025-10-13 11:10:39

    测量可靠性

    第一节什么是可信度

    1. 可靠性的定义

    信度,又称可靠度,是指测量结果的一致程度。一个好的测量工具必须稳定可靠,即多次测量的结果必须一致,否则就不可信。可靠性仅受随机误差的影响。随机误差越大,可靠性越低。因此,可靠性也可以看作是测量结果受偶然性影响的程度。系统误差会产生持续的影响,不会影响可靠性。

    在测量理论中,信度被定义为:一组测量分数的真实变异与总变异(实际变异)的比率。现在,

    (5.1)

    式中,rxx代表测量的信度,S代表真实分数的变异量,代表实际分数的变异量,即总变异量。

    根据式(4.3),可靠性还可表示为

    (5.2)

    关于这个定义有两点需要注意: 1)信度是指一组测试分数或一系列测量的特征,而不是单个分数的特征。 2)真实分数的变化无法直接测量,因此可靠性是一个理论上构思的概念,只能根据一组真实分数进行估计。

    任何测试只能包含来自特定样本的问题。可以由特定的测试人员在特定的时间、地点对特定的被子进行测试。不同情况下会得到不同的分数。可靠性涉及的主要问题是概括测试分数含义的能力,即从一项测量推断总体(真实分数)的准确度。

    根据现代信息论,每组信息可以包括一些真实信息(信号)和一些虚假信息(噪声)。为了提供有用的数据,任何测量都必须具有高信噪比——,即提供更真实的信息。信号可以用真实分数的变化来表示,噪声可以用误差分数的变化来表示。

    信噪比与可靠性有如下关系:

    信号/噪声=(5.3)

    式(5.3)的证明并不困难。代入上式右端,可得:

    =信号/噪声

    如果一个测试的信度为0.90,则信噪比为0.90/(1-0.90)=9.0,即真实变异与误差变异之比为9:1。

    只需稍微提高测试的可靠性就可以显着改变信噪比。例如,将可靠性从0.90 增加到0.91 可以将信噪比从9:1 更改为10.1:1。因此,即使是相当可靠的测试也应该努力提高其可靠性。

    2、可靠性系数

    大多数信度指标都用相关系数来表示,即用同一主题样本得到的两组数据之间的相关性作为测量一致性的指标,称为信度系数。

    与可靠性系数相关的一个概念称为可靠性指数,它是实际得分与真实得分之间的相关性。这就是部分与整体的相关性,可以用下面的公式来表达:

    可靠性指标的平方即为可靠性系数,可用以下公式表示:

    (5.4)

    换句话说,可靠性系数是实际得分与真实得分之间相关性的平方。相关系数的平方表示两个变量之间共享的变异比例。因此,信度系数实际上是真实分数与实际分数之间的决定系数。可以解释为实际分数的变化有多少比例是由真实分数的变化决定的。例如,当rxx=0.90时,我们可以说实际分数的变异90%来自真实分数的差异,只有10%来自测量误差。在极端情况下,如rxx=1.00,则不存在测量误差,所有变化都来自真实分数,如果rxx=0,则所有变化都反映了测量误差。

    关于信度系数还应注意三点。 1)在不同的情况下,对于不同的样本,采用不同的方法得到不同的信度系数,因此一项检验可能有多个信度系数。 2)信度系数只是对测量分数不一致程度的估计,并不表明不一致的原因。 3)获得较高的信度系数并不是心理测量所追求的最终目标。这只是迈向目标的一步,也是使测试有效的必要条件。

    可信度系数有多高才可以接受?理想的情况是rxx=1.00m,但是这是不可能的。不过,我们可以使用现有的类似测试作为比较的基准。综合能力和学业成绩测试的信度系数均在0.90以上,有的可达0.95。至于性格、兴趣、价值观等性格测试的信度系数,通常在0.80至0.85或更高。当rxx0.70时,该检验不能用于评价个体,也不能进行组间比较。当rxx=''0.70时,可用于组间比较;当rxx0.85时,可以用来识别个人。

    由于可靠性系数总是在特定情况下获得的,因此只有在许多情况下证明测试具有高可靠性,才能说测试是更可靠的测试。

    3.信度和测试分数的解释

    信度系数有两个实际用途:一是解释单个分数的含义,二是比较不同测试中分数的差异。

    (一)单项考试成绩误差

    信度仅表明一组测量的实际分数与真实分数的匹配程度,但并不直接表明单个测试分数的变异程度。由于测量误差,一个人的分数有时高于真实分数,有时低于真实分数,有时两者相等。理论上,我们可以对一个人进行无限次测试,然后找到所得分数的平均值和标准差。在这个假设的分布中,平均值是人的真实分数,标准差是误差的度量。这在实践中行不通。然而,我们可以使用对足够大的受试者组进行两次测量的结果,而不是对同一个人进行重复测量来估计测量误差的变化。此时,个人在两次测试中得分的差异就是测量误差。基于此,可以进行错误分数的分布。该分布的标准差就是测量的标准误差,它是衡量测量误差大小的指标。

    测量的标准误差可通过以下公式求得:

    SE=S

    这里SE是测量的标准误差, 是分数的标准差, 是测量的信度。从公式可以看出,测量的标准差与信度之间存在相辅相成的关系:信度越高,标准误差越小;信度越高,标准差越小。可靠性越低,标准误差越大。

    测量标准误差实际上是一组测量分数内误差分布的标准偏差,可以像其他标准偏差一样解释。因此,个体每次测量获得的分数(X)有68% 的可能性落在真实分数(T)加或减一个标准误差(SE)单位的范围内,并且有95% 的可能性它落在真实分数(T) 正负1.96 个单位范围内的可能性。在标准误差范围内。图5-1 显示了所得分数对真实分数的回归以及距离回归线一个标准误差的平行线。

    根据公式(5.6),知道一组测量值的标准差和信度系数即可确定测量值的标准误。进一步,我们可以从每个人的实际得分来估计真实得分的可能范围,即确定不同概率水平下真实得分的置信区间。人们一般采用95%的概率水平,其置信区间为:

    (X-1.96SE)T(X+1.96SE) (5.7)

    这意味着真实分数大约有5% 的机会落在所获得分数的1.96SE 范围内,或者有5% 的机会落在该范围之外。这实际上显示了重新测试时分数可能变化的范围。

    例如:有的学生在一次考试中得了80分。这是否反映了他们的真实水平?如果再次测试,他们的分数会改变多少?已知测试的标准差为5,信度系数为0.84。将适当的值代入方程5.6和5.7并求解:

    SE=5=2

    T=801.96*2=803.92=76.08~83.92

    可以说,这些学生的真实分数有95%的可能性落在76分到84分之间。也就是说,如果再次测试,他们的分数低于76分且高于84分的概率不超过5%。

    (二)两次测试成绩对比

    不同测试的原始分数不具有直接可比性;只能参考同组的平均分,换算成同量表的标准分才能进行比较。

    例如,某班期末考试中,张老师的语文和数学成绩折算成T分(平均值为50,标准差为10)分别为65和70。由此可知,张先生的数学比语文考试稍好,但这种差异是否有意义还不清楚。为了说明个体在两次测试中的表现,我们可以使用“差异的标准误差”来测试差异的显着性。常用的公式如下:

    标准偏差=(5.8)

    式中,SEd为差值的标准误,SE1和SE2分别为两组测试成绩的标准误。将SE1=和SE2=代入公式5.8可得:

    标准偏差=(5.9)

    这里S代表同一量表标准分的标准差,Txx代表第一次测试的信度系数,ryy代表第二次测试的信度系数。

    在上例中,假设语文和数学测试的信度系数分别为0.84和0.91。张的两个分数换算成T分数后,差值的标准误差为:SEd=5

    取95%置信区间(即0.05显着性水平),张在这两门课程中的成绩差异必须达到或超过1.96SEd=1.965=9.8,才能认为两者确实不同。因为数学的T分只比语文高5分,所以差别并不显着。

    使用SE估计个体分数的误差时应注意三点。1) 测试有许多可能的可靠性估计,因此也有相同数量的标准误差估计。为此,我们必须选择最适合特定情况的可靠性估计来解决问题。问题。例如,如果我们对半年内分数的稳定性感兴趣,我们使用间隔六个月的两次测试的相关系数作为可靠性估计。根据这个可靠性系数,我们可以计算标准误差,然后用它来估计六个月的时间。当月分数可能会发生多少变化。 2) 此估计假设所有分数级别的SE 都相同,但有时高分和低分的标准误并不相同。上面计算的SE实际上是整个分数范围内的平均测量误差指标。如果分数分布近似正态且实际分数不超过可能分数的全部范围,则测量的标准误差在所有分数水平上近似相同。 3) 测试分数是对一个人真实分数的最佳估计,但由于测量误差,它并不是一个准确的指标。所获得的分数对真实分数的估计准确程度可以通过SE 的大小或间接通过测试的可靠性来显示。因为一般来说,rxx1.00,se0,我们必须将测试分数视为范围或带,而不是精确的点。该范围的宽度取决于测量标准误差的大小,并最终取决于可靠性系数。 rxx越小,SE越大,范围越宽。如果我们经常将分数视为一个范围,我们就可以克服在比较不同科目的分数或同一科目在不同测试中的分数时过度解释分数之间微小差异的习惯。 4)测量标准误差是对测量误差的描述。它可以用来估计个人真实分数的置信区间。然而,用它来估计个人的真实能力可能会导致严重的错误,因为它没有考虑到系统误差的影响。分数和真实能力是两个不同的概念。

    希望大家能够认真熟记以上内容,抓住心理测量各章要点,力争为心理学专业考研打下坚实的基础,赢得理想的成绩。快点!

      相关文章:


      第1篇    高中物理力的合成与分解技巧(物理高中力的合成与分解)    作者:admin

       三、力(常见的力、力的合成与分解)(1)常见的力1.重力G=mg(方向竖直向下,g=9.8m/s2≈10m/s2,作用点在重心,适用于地球表面附近)2.胡克定律F=kx{方向沿恢复形变方向,k:劲度系数(N/m),x:形变量(m)}3.滑动摩擦力F=μFN{与物体相对运动方向相反,μ:摩擦因数,FN:正压力(N)}4.静摩擦力0≤f静≤fm(与物体相对


      第2篇    金属及其化合物知识点总结(高中化学金属及其化合物)    作者:admin

       金属及其化合物一、金属活动性Na>Mg>Al>Fe。二、金属一般比较活泼,容易与O2反应而生成氧化物,可以与酸溶液反应而生成H2,特别活泼的如Na等可以与H2O发生反应置换出H2,特殊金属如Al可以与碱溶


      第3篇    清华大学2018年自主招生人数(清华大学2018自主招生试题数学)    作者:admin

       6月10日,清华大学2018年自主招生考试全面启动,2018年清华大学自主招生、领军计划依然在全国设置多个考点,考生可就近选择。自主招生测试为初试和复试。一、笔试时间初试时间为6月10日上午9:00-12:00,共3个小时。二、笔试模式初试采用笔试形式,理科类:数学、物理、化学;文科类:数学、语文、历史。清华理科笔试都是选择,共75题,数学35道题,


      第4篇    高考语文基础知识训练试题第十三套答案(高考语文基础知识训练试题第十三套卷)    作者:admin

       1.下列划线字的读音全部相同的一项是()A.行旅行头行将就木行贿受贿B.给予给水自给自足不给面子C.测量掂量丈量土地量入为出D.应该应届得心应手理应如此2.下列各组词语中,字形全都正确的一组是()A.脉搏扶直贫困晶莹寥若辰星B.焕发一幅对联关键性格不合C.提纲情有可原厮打连年歉收D.幅射绿草如茵松弛旁征博引3.依次填


      第5篇    甲烷的氧化反应现象(甲烷氧化的化学方程式)    作者:admin

       甲烷的氧化反应最基本的就是燃烧,高考网为大家整理了《2016高考化学知识点:甲烷的氧化反应》,供大家参考,更多关于甲烷的氧化反应知识点详解请关注高考网。2016高考化学知识点:甲烷的氧化反应甲烷氧化反应最基本的就是燃烧:甲烷完全燃烧:CH4+2O2=CO2+2H2O甲烷不完全燃烧:2CH4+3O2=2CO+4H2O甲烷

    免责:本网站所收集的资料来源于互联网,并不代表本站赞同其观点和对其真实性负责...[更多]

    文章评论评论内容与本站立场无关

       评论摘要(共 条)
     职校网
     职校网