【统计学】分类文章列表

信度效度分析阅读全文»

區別效度
(H. Kaiser)特徵值:是指每一行因素負荷量平方加總後之總和,表示該因素能解釋全體變異的能力。因每一變數之變異數均為1,若所抽取之因素所能解釋的變異數小於1,則其解釋變數之變異數的效力便不如單一變數。因素之特徵值(eigenvalue)須大於1。
變異數:特徵值 除以 問項數目。
平均變異數抽取量(AVE):該構念的各因素負荷量平方和的平均值。
潛在變項的變異抽取量(variance extracted)以VE表示,VE值是計算潛在變項各測量變項對該潛在變項的變異解釋力。若VE值愈高,則表示潛在變項有愈高的信度與收斂效度,Fornell and Larcker(1981)建議其標準值須大於0.5
區別效度的證明:
區別效度之判定係以每一個變項之變異抽取量須大於各成對變項間之相關係數平方值,可稱為具區別效度(Fornell and Larcker,1981)。如果存在某對變項之相關係數值大於該變項中任一變項之變異抽取量,即表示在該對變項中,某一變項之測量問項可能也是另一個變項之測量問項(Anderson and Gerbing, 1998)
因此我們只要證明,所有構念之間的最小AVE大於相關係數矩陣中的最大值的平方值,即代表有良好的區別效度。
Hair, J., Anderson, J. R., Tatham, R. and Black, W. Multivariate data analysis. 5th ed. New Jersey: Prentice-Hall, 1998, pp. 97-104.

信度

個別項目的信度(individual item reliability):
此指標是評估測量變項對該潛在變項的因素負荷量(factor loading),以及每個負荷量是否具有統計顯著性,所有個別項目的因素負荷量在0.5以上,且具有統計顯著性,即符合Hairs et al., (1998)的建議值。整體而言,是理想的結果。
組成信度:
為測量變項信度的組成,表示構念指標的內部一致性,信度愈高顯示這些指標的一致性愈高,Fornell and Larcker(1981)建議值為0.6以上。若潛在變項的CR值愈高,則表示其測量變項愈能測出該潛在變項,

AVE 是各構念的各個Factor平方和平均值例如Table2的「CI」 factor lording 是 0.760 、0.803、0.806因此AVE為
(0.760*0.760+0.803*0.803+0.806*0.806)/3=0.62
因此在最小的AVE是Confirmation 0.60 只要大於相關矩陣中最大的相關係數值平方值即0.66*0.66=0.44 即 0.6 > [...]

日期:2009年04月09日 | 分类:统计学

如何检相关系数的差异阅读全文»

X君 @ 2008-11-13:我 的研究中有一个假设,因为电视比互联网更普及,所以看电视与生活满足感的相关程度高于上网与生活满足感的相关程度。我做了一个样本为1000人的调查,发 现前两者的相关系数为0.27、后两者的相关系数为0.22,与我的假设相符。但是,有人说,我需要对这两个相关系数的差别做显著性检验。我查遍SPSS 的说明,没有找到检验相关系数之差别的程序,不知如何做这种检验。我还有两个疑问:“相关系数差别的显著性检验”到底是什么?既然SPSS里没有此项检 验,还有必要关心这个问题吗?
庄主 @ 2880-11-16:
你问了三个W问题:什么(What is the significance test of the difference between two correlation coefficients)、为何 (Why do we need to test the significance of …) 和如何(How can we test the significance of …)。
什么是两个相关系数之差别?
这要从“相关系数也是一个统计量(a statistic)”这一基本概念说起。什么是统计量?样本中的每个变量都有一些特征值,如平均值(数值变量)或百分比(名目变量)、标准差、等等。它们被称为“单变量统计量” (univariate statistic)。两个统计量(如两个平均值)之间的差别,也是一个统计量,叫做“双变量统计量”(bivariate statistic),我们都知道如何用t-检验来检验两个平均值之间的差别(因此统计教科书和SPSS里都有t-检验)。
其实,双变量统计量不仅包括两个统计量之间的差别(difference between two statistics),也包括两个变量之间的关系(relationship between two variables)。注意,“两个统计量之间的差别”和“两个变量之间的关系”是两回事(参见我的前贴 “Difference vs. Correlation“)。这里的“两个变量之关系”可以是相关系数、也可以是回归系数、甚至其它统计量(如reliability coefficient, factor variance, 等等),当然,它们之间都是可以转化的。
为什么要检验两个相关系数之差别?
既 [...]

日期:2008年11月22日 | 分类:统计学

如何解读这篇文章中极高的标准化回归系数?阅读全文»

石水 @ 2008-11-17:
在一元线性回归中,标准化回归系数的平方就等于确定系数,由此可以看出该自变量对因变量的解释能力。那么在多元线性回归中,标准化回归系数的平方有什么意义吗?它们的平方和与确定系数有关系吗?
庄主 @ 2008-11-18:
如 果多元回归中的所有自变量之间完全独立(即相关系数=0),它们的标准化回归系数的平方之和就应该等于回归模型的R平方(确定系数)。但是,这个“如果” 条件经常不能满足,所以各自变量的标准化回归系数的平方之和就会大于回归模型的R平方。这个“大于”的部分,反映了由自变量之间的相关关系而造成的对因变 量的“虚假解释力”。
石水 @ 2008-11-19:
明白了。那我可以理解吗?多元回归方程中,任何一个自变量的标准化回归系数的平方都不可能大于R平方。我看到很多发表在不错的期刊上的文章出现这个问题,是不是明显数据造假?
庄主 @ 2008-11-19:
你的理解是对的。个体永远不可能大于总和。不知你看到的文章中报告的是标准化回归系数、还是它们的平方?前者完全可能大于R平方的。
如果是国际期刊,请举个实例?
石水 @ 2008-11-19:
嗯,那肯定就是造假了。是国内管理类期刊,捧得很高。我看到报告的数据是标准化回归系数很高,其中一个系数的平方也远远大于他报告的R平方。谢谢庄主的解答。
庄主 @ 2008-11-20:
如方便,请告知有关文章的出处。
是谁 @ 2008-11-20:
管理世界2006第3期91页的那个回归表
庄主 @ 2008-11-21:
91页上有两个表,是表二还是表三?如果是表二,作者好像只说age等六个自变量的系数被标准化、没说是其平方值?
石水 @ 2008-11-21:
表3中的模型9和模型15,有几个系数都是0.9以上,而R平方都不到0.2
庄主 @ 2008-11-22:
果 然如此(见下图)。表中的High Involvement Work Index (姑且简称为HIWI)的标准系数在模型9和15中,分别为0.905和0.967,其平方分别为0.82和0.94,调查数据中从来没有见过具有如此强 大解释力的自变量。此外,另一个自变量 Environment Dynamics (ED)的系数也很高,分别为0.548和0.628,其平方也分别达到0.30和0.39,大于各自模型的R平方(0.147和0.295)。

(出处:《管理世界》2006年第3期91页)
但是,先不要激动,这里有一个很致命的catch(是否可以译成“蹊跷”?):这两个模型均含有HIWI和ED的交互影响,如上图所示,该两个交互影响的系数均是一个高度的负值(-0.858和-0.862)。我在“如何在回归分析中检验和解读交互影响?”、“如何生成交互影响变量?”等帖子中提到的,回归分析中的交互影响变量与构成其的自变量之间存在高度共线性,需要先对自变量作“中心化”(centering)处理,然后才能生成交互变量,最后进行回归分析。否则,分析结果会有严重问题。本例就是一个明证。
我们可以依次比较一下模型4-9:

模型4中有四个自变量,但均不显著,加起来的共同解释力(R平方)只有0.027。
模型5加入了HIWI的标准系数是0.300,其平方为0.090,从而使得模型的R平方提高到了0.114。
模型6用SHC替换了HIWI,SHC的系数为0.382,平方为0.146,而模型的R平方则从模型4的0.027提高到0.150,说明SHC的解释力比HIWI还大。当然,SHC带来的解释力中也许还包括了HIWI的影响(如果SHC与HIWI相关的话)。
模 型7证明了SHC与HIWI是相关的,因为两者同时出现在模型7中,而两者的系数均小于各自独立出现时的系数。同时,模型7中的SHC的系数 (0.317)大于HIWI的系数(0.218),也证明了我们在比较模型5和模型6时说的“SHC的解释力比HIWI还大”结论。
模型8用ED来取代SHC,这是非常错误的做法,应该是保留SHC并加入ED,这时唯一值得注意的信息是HIWI的系数从模型4的0.300降到了0.274,说明HIWI与ED有一定程度的相关。
模 型9与模型8的区别在于模型9多了一个HIWI*ED的交互项,R平方则由模型8的0.127提高到模型9的0.149,其新增的0.022就是由该交互 变量带来的,如表3所示,这个0.022的增量在95%的水平上是显著的。这一部分是正确的。然而,HIWI的系数却从模型8的0.274飙升到模型9的 0.905,ED的系数也从模型8的0.123猛增到0.548,这两者都是不可靠的。同样,我们也可以通过模型9的0.022增量R平方而得知,模型9 的交互变量的系数应该为0.022的平方根0.148,而不是表中的-0.858。虽然我们没有证据,但甚至可以怀疑-0.858的负号都可能是由其与 HIWI和ED的高度相关而造成的。

我们也可以按同样的方法比较模型10-15、并得出类似的发现。这里就不再作简单的重复了。
结论:我觉得作者并不一定是有意造假,而是不懂如何检验交互影响、甚至如何构建回归模型(见模型8的讨论)。同时,“捧得很高”的期刊的评审人和编辑没有看出问题,也是有责任的。当然,不管无意的错误还是有意的造假,误导的后果都是一样的。

日期:2008年11月22日 | 分类:统计学

快速搜索栏

热门标签排行

页面导航栏

历史文章索引

友情链接