原创分享:为什么有人说大部分发表的科学研究都是错的?(3/4)

  【星辰指挥官】小说免费阅读,请收藏 爱微阅读网【2vdu.com】

  我们再来看看另一个有趣的例子。2015年在西方媒体中,一份论文引发了一阵热潮。

  天啦撸~每天吃一块巧克力可以减肥啦!!!!!

  在这个研究中心,男女年龄在19到67岁之间的参与者被随机分配到三个治疗组之一:第一组进行低碳水化合物饮食,第二组进行相同的低碳水化合物饮食加每天42克巧克力(盎司),第三组则是对照组,要求他们保持日常饮食结构。

  实验在三周之后结束,对照组的体重不增不减,第一组和第二组的参与者一样平均减掉了的体重,但是加餐了巧克力组的减肥速度比不吃巧克力的组快10%。这个实验结果在统计学上是显著的,因为p值小于。

  你可以想象这个结果有怎样的爆炸性,新闻媒体立刻跟进,吃巧克力能减肥的消息迅速传播开来。结果呢?

  五月的时候,这位大哥跳了出来,注意一下他和论文中第一作者的名字差别。这篇论文从头到尾都是一个玩笑。这位Bohannon是何许人也,他是美国著名的科学记者和生物学家。这篇论文就来自于他故意设计的恶意研究,他想要通过这个时间来观察媒体如何捕获和吸收“无意义”的研究结果。

  他用这篇论文向二十家期刊投稿,并最终被国际医学档案馆(International Archives of Medicine)发行。他使用了一个假名字并虚构了一个假的研究机构,但是这篇充满恶趣味的论文却登上了大量的世界性媒体。

  接下来,我们来看看他是如何操纵实验结果的。

  首先,实验样本十分小,只有15个人被分到了三组,这意味着每组只有5个人。每个人被测量追踪了18个不同的身体指标,包括体重、胆固醇、钠含量、血蛋白水平、睡眠质量、幸福度等等。他们通过如此设计大大增加了实验指标中出现假阳性的可能性,如果体重没有显著差异,还有很多其他因素可能有。

  此处体现p值操纵(p-hacking,或者Data dredging, data fishing, data snooping, data butchery 谁知道为啥有这么多名字)p值的一个重要特点是它只对单一指标有效,一旦在实验中比较了一大堆变量,那么变量中出现假阳性的概率就被大大提高了。研究人员可以在实验分析中采取很多手段来主动降低p值。

  举个例子,我想要实验豆类对于人心情的影响,那么我可以使用一大堆变量。首先是人,抑郁程度、睡眠时间、自我评价等等,然后是豆类,黑豆、红豆、黄豆、青豆等等。如果足够幸运的话,我也许就能够从中找到一组假阳性的数据并发表论文。标题呢?吃红豆有助于改善抑郁症状,哇啦,又是一篇微博朋友圈的话题来源~

 

本章未完,点击[下一页]继续阅读-->