原创分享：为什么有人说大部分发表的科学研究都是错的？(3/4)

　　【星辰指挥官】小说免费阅读，请收藏　爱微阅读网【2vdu.com】

　　我们再来看看另一个有趣的例子。2015年在西方媒体中，一份论文引发了一阵热潮。

　　天啦撸~每天吃一块巧克力可以减肥啦！！！！！

　　在这个研究中心，男女年龄在19到67岁之间的参与者被随机分配到三个治疗组之一：第一组进行低碳水化合物饮食，第二组进行相同的低碳水化合物饮食加每天42克巧克力（盎司），第三组则是对照组，要求他们保持日常饮食结构。

　　实验在三周之后结束，对照组的体重不增不减，第一组和第二组的参与者一样平均减掉了的体重，但是加餐了巧克力组的减肥速度比不吃巧克力的组快10%。这个实验结果在统计学上是显著的，因为p值小于。

　　你可以想象这个结果有怎样的爆炸性，新闻媒体立刻跟进，吃巧克力能减肥的消息迅速传播开来。结果呢？

　　五月的时候，这位大哥跳了出来，注意一下他和论文中第一作者的名字差别。这篇论文从头到尾都是一个玩笑。这位Bohannon是何许人也，他是美国著名的科学记者和生物学家。这篇论文就来自于他故意设计的恶意研究，他想要通过这个时间来观察媒体如何捕获和吸收“无意义”的研究结果。

　　他用这篇论文向二十家期刊投稿，并最终被国际医学档案馆（International Archives of Medicine）发行。他使用了一个假名字并虚构了一个假的研究机构，但是这篇充满恶趣味的论文却登上了大量的世界性媒体。

　　接下来，我们来看看他是如何操纵实验结果的。

　　首先，实验样本十分小，只有15个人被分到了三组，这意味着每组只有5个人。每个人被测量追踪了18个不同的身体指标，包括体重、胆固醇、钠含量、血蛋白水平、睡眠质量、幸福度等等。他们通过如此设计大大增加了实验指标中出现假阳性的可能性，如果体重没有显著差异，还有很多其他因素可能有。

　　此处体现p值操纵（p-hacking，或者Data dredging， data fishing， data snooping， data butchery 谁知道为啥有这么多名字）p值的一个重要特点是它只对单一指标有效，一旦在实验中比较了一大堆变量，那么变量中出现假阳性的概率就被大大提高了。研究人员可以在实验分析中采取很多手段来主动降低p值。

　　举个例子，我想要实验豆类对于人心情的影响，那么我可以使用一大堆变量。首先是人，抑郁程度、睡眠时间、自我评价等等，然后是豆类，黑豆、红豆、黄豆、青豆等等。如果足够幸运的话，我也许就能够从中找到一组假阳性的数据并发表论文。标题呢？吃红豆有助于改善抑郁症状，哇啦，又是一篇微博朋友圈的话题来源~

本章未完，点击[下一页]继续阅读-->