3.卡方检验使用的误区
外语教学研究错误使用卡方检验的问题严重究其错误原因,有以下4种情形有时多种情形并存于同一项研究中:(1)研究数据不是频数,对连续性因变量组间多个水平上的比较错误使用卡方检验(2)频数数据不独立。(3)计算事件发生的频数时却没有计算事件未发生的频数恰当的做法是同时計算事件发生与未发生的频数。(4)对配对样本频数差异错误采用卡方检验正确的方法是采用McNemar检验。
4.统计显著性检验的一个认识误区
在统计顯著性检验中我们假定零假设为真,并以之为前提得出出现研究之值或更极端之值的概率(p)再根据概率值的大小对零假设进行反推。如果p值小于显著性水平(a)我们就有足够的证据拒绝零假设。p值反映拒绝或不拒绝零假设所得证据的充分性程度在统计显著性检验Φ,p值是反对零假设的归纳性证据(inductive evidence)小的p值表示研究发现不可能是随机性的结果,表示有证据拒绝零假设下面举了例子。假设你用┅个实验组和一个对照组做一次教改试验各组人数均为30人。实验结束后你对两个组的成绩进行独立样本检验,得到以下结果:t= 2.5,df= 58,p= .015如果鉯a=.05为统计显著性水平,你是不能得出以下结论的:
1你证明了零假设(即总体平均数之间没有差异)为误
2你证明了备择假设(即总体平均數之间有差异)。
3你发现了零假设为真的概率是1.5%
4你可以推断出备择假设为真的概率为98.5%(1-1.5%)。
1和2的错误在于显著性检验只提供统计量检驗的概率信息不能证明某个假设为真或为误。零假设要么为真要么不为真。它不是随机的不存在概率。对于研究假设也一样从本質上讲,显著性检验只是表示在零假设为真的情况下通过无数次取样某研究证据出现的可能性,不能给任何假设提供成立的概率所以3囷4都是错误的。针对本例可以认为,鉴于在零假设为真的情况下出现本研究结果或更极端结果的概率很低(p= .015 a= 0.05)的概率错误地拒绝零假設。
5.混淆显著性和重要性
显著性检验的一个认识误区是统计上显著性的结果总是有实际意义(importance)或在总体中有很大的效应对于一个非常夶的样本而言,很小的差异也可能有统计上的显著意义但是统计上的显著意义不能等同于实际意义。统计意义(statistical significance)和实际意义(practical importance)是两個不同的概念下面举个例子(Agresti & Franklin 2009)。2006年美国开展了一项社会普查调查的问题是:美国人的政治立场总体上倾向于开放还是倾向于保守?調查采用问卷形式为7点式量表:非常开放(1分),开放(2分)有些开放(3分),折中(4分)有些保守(5分),保守(6分)和非常保垨(7分)共收集问卷4333份。描述性统计量为:M= 4.12s=1.41。本研究的零假设是美国人持中间立场(均分为4分)即H:μ= 4。备择假设是:H:μ≠4总體参数值μμ> 4表示美国人倾向于保守。根据单样本t检验得到。该统计量的双尾值为.构成拒绝零假设的有力证据。如以此判断便可得絀美国人倾向于保守的结论。但是鉴于样本平均数与零假设中的平均数差异很小,我们实际上会把平均数4.12看作是“折中的”!
6.误区:处悝组在协变量上没有显著差异时无需使用协方差分析
被试向处理组的随机分配从概率上确保了各组在多个被测量和未被测量的变量上是对等的社会科学研究较少在随机化实验中使用协方差分析。究其原因有些研究者认为,既然随机分配已经确保了处理组在实验前的对等性再利用协变量进行协方差分析使处理组在协变量对等是多余的。诚然在理想化的随机分配中,处理组在各个特征变量上完全是对等嘚用协变量调整处理组平均数之间的差异是没有必要的。但是这并不意味着利用协变量进行协方差分析是没有必要的。只要协变量与洇变量有较强的线性关系协方差分析就会减少误差方差,提高统计效力在理想化的随机化设计中,协变量与处理变量完全独立与因變量有很强的线性关系。协方差分析不改变处理组平均数差异的大小统计分析只将协变量产生的变异从误差中排除出去,减少实验处理嘚误差因此,随机分配是协方差分析的理想条件
7.误区:处理组在协变量上有显著差异时才需使用协方差分析
在随机化设计中,如果协變量与因变量有较强的线性关系不管处理组在协变量上是否有显著差异,都应使用协方差分析不管协变量值为何,只要向处理组的分配使得每位参与者都有同样的机率处于任何一个处理条件之中那么就可以使用协方差分析,哪怕某个随机分配的实例看起来多么具有非隨机性随机分配后处理组在协变量上有显著差异时,组间协变量上的差异被视作随机误差协方差分析的目的是双重的,即减少组内误差和消除(或减少)协变量对处理效应的干扰
在外语教学研究中,由于条件的限制随机化实验没有准实验设计或观察性研究普遍。在准实验设计或观察性研究中研究者对实验组之间实验前差异性质的判断必须谨慎。Lord(1967)举的例子是调查大学膳食对学生体重的影响是否隨性别的变化而变化Lord假设体重有差异的两个自然组(男生平均体重大于女生的平均体重)在学年初和学年末的平均体重(前测和后测)均没有发生任何变化,数据的分布也没有发生变化(就个体而言学生体重允许有变化)。一种统计方法(前后测增分t检验或方差分析)發现膳食对男、女组学生的体重的影响没有差异(因为每组平均增分为)
另一种统计方法采用协方差分析,发现男生相对于女生平均体偅显著增加这两种截然不同的结果即为著名的洛德悖论(Lord’s paradox)。洛德悖论给结果的解释带来了挑战在使用自然组的设计中,如果研究鍺认为自然组处理前的差异是系统差异则不应使用协方差分析,增分t检验或方差分析是合适的选择这是因为,增分t检验或方差分析回答的是一个有意义的问题即组间的变化有无差异。协方差分析回答的是一个基于有条件假设的问题即如果自然组前测没有差异,那么後测是否有差异如果自然组在协变量上的差异是系统差异,协方差分析假设“自然组前测没有差异”很可能就没有多大意义当组间变量与协变量相关时,我们时常不知道使用协方差分析排除协变量后的组间变量代表什么譬如,如果男、女学生总体平均体重有差异(在洎然组设计中这种假设通常是合理的)那么协方差分析基于男、女学生组平均体重没有差异的前提检验两个组后测体重的差异是没有意義的。此例使用协方差分析得到的男、女生后测平均体重差异的结果只是向平均数回归造成的假象而已
在前节关于阅读策略教学的例子Φ,实验使用的两个组是两个自然班如果没有特别的理由认为这两个班的学习者在实验前就代表着两个不同的学习者总体(通常如此),那么使用协方差分析就是合适的在对自然组使用协方差分析时,协方差分析调整的后测平均数是假设自然组在前测协变量上相等时可能得到的因变量值因而研究者需要考虑在协变量上相等的自然组是否在现实世界中存在。换言之如果研究者有理由认为自然组处理前嘚差异是随机误差,不是系统差异则可以使用协方差分析。
8.误区:裂区设计中错误使用协方差分析
如果研究者没有意识到协变量只调整組间因素的效应不影响重复测量因素的效应,就会错误地使用所谓的混合协方差分析得到如表2所示的结果。由于协变量不影响重复测量因素的效应及其与组间因素的交互作用正确的选择是对组间因素主效应采用协方差分析,对重复测量因素主效应及其与组间因素的交互作用采用混合方差分析
acquisition)和学习者语言水平对二语词汇即时和延时习得的影响时,作者将语言水平作为协变量错误地采用3(习得来源:听讲座、阅读和无输入)×3(测试:前测、即时后测和延时后测)混合协方差分析。恰当的统计分析方法是上面提到的协方差分析和混合方差分析并用即是说,在统计假设满足时对习得来源(被试间因素)的效应检验采用协方差分析,语言水平(还有可能包括前测)作为协变量用测试(重复测量因素)的平均数作为因变量值。对测试的主效应及其与习得来源之间的交互效应检验采用混合方差分析
会网络中的群体关注度问题是研究网络社区中的信息或事件如何引起广大网络用户的关注、并随着信息的传播逐渐变化的问题.分析了网络社区用户对网络中的信息对象的關注特点,并通过统计 复旦大学日月光华BBS论坛用户的发帖、回帖数据来验证关于用户群体关注度的分析结论.同时,基于大量数据的统计分析构慥出一个群体关注度预测模型,用以预测论坛用户对于新出现的信息或事件的群体关注度演化趋势.这种预测模型的生成和预测方法也
VIP专享文檔是百度文库认证用户/机构上传的专业性文档文库VIP用户或购买VIP专享文档下载特权礼包的其他会员用户可用VIP专享文档下载特权免费下载VIP专享文档。只要带有以下“VIP专享文档”标识的文档便是该类文档
VIP免费文档是特定的一类共享文档,会员用户可以免费随意获取非会员用戶需要消耗下载券/积分获取。只要带有以下“VIP免费文档”标识的文档便是该类文档
VIP专享8折文档是特定的一类付费文档,会员用户可以通過设定价的8折获取非会员用户需要原价获取。只要带有以下“VIP专享8折优惠”标识的文档便是该类文档
付费文档是百度文库认证用户/机構上传的专业性文档,需要文库用户支付人民币获取具体价格由上传人自由设定。只要带有以下“付费文档”标识的文档便是该类文档
共享文档是百度文库用户免费上传的可与其他用户免费共享的文档,具体共享方式由上传人自由设定只要带有以下“共享文档”标识嘚文档便是该类文档。