最近关于p值讨论的爆发激发了我进行简短的模拟研究。

特别是,我想说明p值如何随着效果和样本大小的不同而变化。
以下是模拟的详细信息。我模拟在R语言中用模拟探索回归的P值 随笔 第1张在R语言中用模拟探索回归的P值 随笔 第2张​了我的自变量的绘制在R语言中用模拟探索回归的P值 随笔 第3张在R语言中用模拟探索回归的P值 随笔 第4张​:

SRE实战 互联网时代守护先锋,助力企业售后服务体系运筹帷幄!一键直达领取阿里云限量特价优惠。

在R语言中用模拟探索回归的P值 随笔 第5张在R语言中用模拟探索回归的P值 随笔 第6张

 

在R语言中用模拟探索回归的P值 随笔 第7张在R语言中用模拟探索回归的P值 随笔 第8张

对于每一个在R语言中用模拟探索回归的P值 随笔 第9张在R语言中用模拟探索回归的P值 随笔 第10张​,我定义一个在R语言中用模拟探索回归的P值 随笔 第11张在R语言中用模拟探索回归的P值 随笔 第12张​as

在R语言中用模拟探索回归的P值 随笔 第13张在R语言中用模拟探索回归的P值 随笔 第14张

 

在R语言中用模拟探索回归的P值 随笔 第15张在R语言中用模拟探索回归的P值 随笔 第16张
在R语言中用模拟探索回归的P值 随笔 第17张
在R语言中用模拟探索回归的P值 随笔 第18张

换句话说,对于每个效果大小,在R语言中用模拟探索回归的P值 随笔 第19张在R语言中用模拟探索回归的P值 随笔 第20张​模拟绘制在R语言中用模拟探索回归的P值 随笔 第21张在R语言中用模拟探索回归的P值 随笔 第22张​并在R语言中用模拟探索回归的P值 随笔 第23张在R语言中用模拟探索回归的P值 随笔 第24张​出现一些错误在R语言中用模拟探索回归的P值 随笔 第25张在R语言中用模拟探索回归的P值 随笔 第26张​。估计以下回归模型并在R语言中用模拟探索回归的P值 随笔 第27张在R语言中用模拟探索回归的P值 随笔 第28张​观察p值。

在R语言中用模拟探索回归的P值 随笔 第29张在R语言中用模拟探索回归的P值 随笔 第30张

绘图和回归完成1,000次,因此对于每个效果大小 - 样本大小组合,模拟产生1,000个p值。下面绘制了每种效应大小和样本大小组合的这1,000个p值的平均值。

注意,这些结果是固定的在R语言中用模拟探索回归的P值 随笔 第31张在R语言中用模拟探索回归的P值 随笔 第32张​。较高的采样误差通常会使这些曲线向上移动,这意味着对于每个效应大小,相同的样本将产生较低的信号。

 在R语言中用模拟探索回归的P值 随笔 第33张在R语言中用模拟探索回归的P值 随笔 第34张

 

首先,对于给定的样本大小,更容易“检测”更大的效果大小。通过检测,我的意思是使用.05阈值发现具有统计显着性。可以使用相对较小的样本大小(在这种情况下<10)检测较大的效果大小(例如.25)。相反,如果效果大小很小(例如.05),则需要更大的样本来检测效果(> 10)。

其次,这个图说明了一个关于p值的常见警告:总是在样本大小的范围内解释它们。缺乏统计意义并不意味着缺乏效果。可能存在效果,但样本大小可能不足以检测它(或者数据集中的可变性太高)。另一方面,仅仅因为p值表示统计显着性并不意味着该效果实际上是有意义的。考虑效果大小.00000001(实际为0)。根据该图表,随着样本大小的增加,甚至该效应大小的p值趋于0,最终超过统计显着性阈值。

还有问题吗?联系我们!

 

大数据部落 -中国专业的第三方数据服务提供商,提供定制化的一站式数据挖掘和统计分析咨询服务

统计分析和数据挖掘咨询服务:y0.cn/teradat(咨询服务请联系官网客服

在R语言中用模拟探索回归的P值 随笔 第35张在R语言中用模拟探索回归的P值 随笔 第36张​QQ:3025393450

在R语言中用模拟探索回归的P值 随笔 第37张在R语言中用模拟探索回归的P值 随笔 第38张

【服务场景】  

科研项目; 公司项目外包;线上线下一对一培训;数据采集;学术研究;报告撰写;市场调查。

【大数据部落】提供定制化的一站式数据挖掘和统计分析咨询服务

在R语言中用模拟探索回归的P值 随笔 第39张在R语言中用模拟探索回归的P值 随笔 第40张

扫码关注我们
微信号:SRE实战
拒绝背锅 运筹帷幄