◆ ◆ ◆
导语
新年伊始,很多人想要改变饮食习惯。这常常需要将食物分类为好或坏,健康或不健康,营养或放纵,瘦身食物或致胖食物等。然而,食物属于哪个类别常常取决于你咨询了谁。
美国膳食指南咨询委员会(U.S. Dietary Guidelines Advisory Committee )最近发布了最新的指导手册,将健康饮食定义为着重蔬菜、水果、全麦食品、低脂或脱脂牛奶产品、海鲜、豆类和坚果,同时要减少红肉、精制谷物、含糖食物和饮料摄入;一些心脏病专家建议富含橄榄油的地中海饮食习惯;美国糖尿病协会提倡低碳水化合物和低脂肪饮食;医学医师委员会推荐素食饮食;各种专家提出各种不同的健康饮食方案,还有古新世饮食、酮饮食等。
到底谁是正确的?这很难说。一旦说到营养学,每个人都有他的观点。然而大家都没有一个无懈可击的说法。问题源自于我们并没有就什么是健康饮食达成一致。是为了让你更苗条吗?还是增肌?保持骨骼强壮?还是避免心脏病或癌症或老年痴呆?不管你在担心什么,都有很多(所谓的)食谱可以帮你。将饮食习惯和食物与健康联系起来真是太容易了,读一下我们做的试验你就可以明白了。
我们对于营养学研究的尝试显示,对于食物影响健康的研究结果非常令人忧虑。透过现象看本质。首先我们需要知道营养学研究者们研究的是极其难的问题,因为没有办法将人们关在屋子里、谨慎地测量他们的饮食,所以很难确切地知道人们吃了什么食物。因此,几乎所有的营养学研究是依赖于要求人们记住并报告自己吃了什么食物。通常的方式就是食物日记、回忆调查,和食物频率问卷(FFQ)
食物频率问卷有很多个版本,但是他们使用的是相似的技术:询问人们吃特定食物的频率和每次的食用量。但是,记得你吃过的所有东西是很困难的。人们常常会少报告了他们吃的食物,或者他们常常忘了自己吃过某些食物或者可能会记错他们吃了多少。
Nutrition Quest的CEO Torin Block认为“关键是做饮食评估非常困难”。Nutrition Quest是一家从事食物频率问卷的公司,由Torin Block的母亲Gladys Block创立,Gladys是美国国家癌症研究所从事食物频率研究的先驱。
“总是有误差的,这无法避免”,他说。食物日记和24小时食物回忆在学界都有很高的地位。然而,Block认为,“如果想估算一个人长期的日常饮食摄入,你必须做更多的工作”。为了做研究,研究院对于人们昨天或前天吃了什么并不感兴趣,而是对于他们平时摄入食物的方式和常规有兴趣。用24小时食物回忆方式去做的研究通常都会高估或者低估人们每天没有摄入的营养,因为他们只记录了一个很小且不具有代表性的快照(snapshot)。
当我尝试纪录一个7天的饮食日记时,我发现Block说得太对了:如果只收集几天的数据的话,是很难反映人们平日饮食特征的。当我在记录饮食日记期间离开家去开会的时候,我吃的都是快餐和饭店,这与我平时在家中吃的食物相差甚远。我的食物日记显示,我在晚餐前只吃了一个甜甜圈和两包薯条。那我晚餐吃了什么呢?是印度尼西亚海鲜咖喱,但是我不可能把所有的成分都列进清单中。
作者和她同事的饮食日记本
在我短暂的记录饮食日记的期间,我还学到另一课:完全的记录你的饮食会影响你的饮食。当我知道我需要把它写下来的时候,我更加注意我吃了多少,有时我选择不要吃东西只是因为我懒得去记录它或者我发现我并不是真的想吃第二个甜甜圈了(或者我不愿意承认我吃了第二个!)。
在饮食汇报中撒些小谎,是我们人类的天性;食物频率问卷希望通过汇报的长期性,来抵消短期饮食汇报所带来的记录偶发性和人们的这类小谎。当我们阅读到一些如“蓝莓预防记忆减退”这一类的文章,它的依据就往往是食物频率问卷某些版本的测试。这一类调查问卷通常会询问调查者在过去一季度、半年或者一年里的食物摄入情况。
为了明白这些调研是怎么实施的、以及这些调研有多可靠,我们聘请Block向我的同事Anna Barry-Jester、Walt Hickey以及一些读者志愿者们分享他们公司半年的食物频率问卷报告。
其中有些问题非常简单,比如:你喝咖啡的频率是怎样的?但还有一些食物却让我们不知如何作答,比如:番茄。半年里我吃番茄的频率是怎样的?当九月番茄遍布我的菜园时,我像小孩贪吃糖果似地贪食着小番茄,我还可能每天吃上两三个蘸着香醋和橄榄油的紫色大切诺(切诺是番茄的一种);但从十一月直至来年的七月,我连一个新鲜的番茄都吃不着。那么问题来了:我吃番茄的频率应该怎么回答呢?
除了食物的摄入频率,摄入量的问题也让我们非常困惑。在有些情况下,调研问卷上会提供虽然奇怪但有用的指导,例如:当要求选择酸奶的摄入量为半杯、一杯还是两杯时,问卷上会相应画上碗装的、不同量的木屑作为参考。还有一些问题就很荒诞,“哪个地球人能知道一杯三文鱼或者两杯肋骨是多少的量呢?”Walt说。
虽然这些问卷调查的本意只是衡量我们的食物摄入,但有时却会有评判的意味,如:你是吃全脂、低脂还是无脂肪酸奶?我发现,每当我面对三个摄入量的选择时,无论真实情况是怎样的,我都会倾向于选择中间值的那一选项。
尽管存在着以上的种种困难, Anna、Walt和我还是尽最大努力、诚实地做完了问卷。在随后的结果对比中,我们发现这两类食物在我们的卡路里来源中占据着重要地位:全脂的奶酪,各种酒精制品。这点之外,我们的饮食有了差异:Walt通过生酮饮食瘦了50磅(约45斤);Anna蛋白吃得相当少;我摄入的热量是Walt或Anna的两倍。
这些结果怎么可能正确?我和Anna的身高和体重完全相同;我们都可以相互换衣服穿。我怎么可能摄入了Anna两倍多的食物?Block承认,得到精确的卡路里数是非常困难的,尤其是在没有长期饮食记录的情况下;当细化到各种营养的时候,这种统计的精确性就更是天方夜谭。他指出了1987年一个研究的结论:为了得到一个真实的平均卡路里数,男性需要27天的每日食物摄入数据,女性需要35天的。某些营养成分需要更长时间的数据,例如:平均需要474天的食物摄入记录来计算女性的维他命A摄入量。这提醒了我们:我们的报告可能是正确的,但也很有可能包含着很多的错误。
弗吉尼亚理工大学人类营养学教授Brenda Davy认为:尽管基于记忆的测量有局限性,但是营养学界的大多数人认为这样的测量是有其存在价值的。有充分的证据表明人们会少报那些不健康的食物,如高脂食品或者甜食,导致卡路里测量的精确性无法保证。“但这并不表示所有的食物都被少报,不表示纤维摄入和钙摄入的测量也是有问题的。”
调研的研发者们认识到调查问卷答案并不完美。为了纠正偏差,他们将食物频率问卷结果与其他方法得到的结果进行有效性验证,所比对的方式一般为24小时食品回忆或者更长期的饮食日记。Block说,有效性验证的结果能够让研究者们考虑到每日摄入量的变化情况。
但是食物频率问卷的抨击者认为这种有效性验证只是又一个循环论证,伯明翰阿拉巴马大学营养肥胖研究中心的计算生理学家Edward Archer便是其中之一,他觉得这只是在用一种形式的主观报告来验证另一种形式的主观报告。
作为一名注册营养师以及亚特兰大营养学会的发言人,Tamara Melton说,记录自己饮食这件事比看起来要更难,尤其是当在外面用餐时几乎不可能测量食物的成分和输入量,总不能在一个商务午餐中,拿出一个量杯来进行测量吧!
Anna、Walt和我分别对食物频率问卷与7天饮食日记计算得到的卡路里数进行了比对,发现这两个结果并不匹配。那到底哪个结果是准确的呢?
伯明翰阿拉巴马大学营养肥胖研究中心主任David Allison指出,虽然大家对自我报告饮食摄入量的关注已经存在了几十年,但所有争论近几年才浮出水面。2014年,Allison在能量平衡测量工作组时撰写了一篇专家报告,在这份报告中,他声明:使用“绝对不准确”的测量方法来设置医疗保健政策、研究和临床实践,这是绝对不能接受的;这样的滥用,只会导致“有(测量方法)比没有还要恶劣”!
食物频率问卷还有更深的问题。他们不仅仅不可靠,而且还产生了巨大的、有很多变量的数据集。我们通过邀请读者们参加食物频率问卷和回答一些其他问题,随之而来的聚宝盆一般的各种可能变量组合可以让我们很容易得到看起来很炫酷(但是错误)的结论。最终我们得到54个完整的答卷,然后寻找关联 - 就像研究员寻找食物和可怕疾病之间关系一样。找到这样的关连简直太容易了:
我们的食物频率问卷产生了1066个变量,附加的问题把参与试卷调查的人们根据26个不同的特征(比如右利手还是左撇子)进行分类。 这个庞大的数据集使得我们在仅仅几个小时内就做了27,716个回归测试(完整结果可以在GitHub找到)。在如此多待检查的可能性关联中我们肯定可以找到一些“具有统计学意义”(Statistically Significant)的,却不真实的关联。通常我们会用P值是否小于0.05来做关联性是否为统计性显著的标准,这就相当于有5%的误报(False Positives)概率。但误报不是唯一的问题, 我们还有可能发现一些真实的却在科学上没有用处的关联。例如,我们的实验发现,相比那些把牛排上的肥肉都吃掉的人,去掉牛排上肥肉的人更有可能是无神论者。虽然切掉牛排上的肥肉和无神论者有可能确实有关联,但是并不意味着它们是因果关系。
如果一个牧师教导他的教徒不要去掉牛排上的肥肉,以免他们失去自己的宗教,那他可能会被嘲笑。然而营养流行病学家们却基于类似站不住脚的证据提出了各种营养建议。几年前,哈佛大学公共卫生学院的营养流行病专家Jorge Chavarro曾经根据一个护士们正在进行的、食物频率问卷的数据,建议试图怀孕的女性考虑吃高脂肪的奶制品,而不是低脂肪的奶制品。他和他的同事Walter Willet还根据这些结果写了本书《助孕食谱》。 当我这个星期联系Chavarro问他对奶制品和生育能力之间的关联又多自信的时候,他说“在我们发现的所有关联中,这是我们最不自信的一个。” 然而,这个关联却上了头条新闻。
斯坦福大学元研究创新中心的一位研究结果可靠性方面的专家John Ioannidis说道, 几乎所有你能想到的营养物质,都已在食物频率问卷等工具的应用下,在同行评议的科学文献中,与一些健康结果关联到一起。在2013年发表在临床营养美国学报(American Journal of Clinical Nutrition)上的一篇分析中,Ioannidis和他的一个同事在一本食谱中随机选出50个常见的成分,并寻找评估每种食品与癌症关联的研究。最后,他们发现研究表明:80%的这些成分中,包括盐,鸡蛋,黄油,柠檬,面包,胡萝卜, 都和癌症有关系。Ioannidis说,其中有些研究指出某些食用成分会使癌症的风险增加,有些指出某些成分可以降低癌症风险,但是研究报告里把这种关联的影响表述成“令人难以置信的大”,提供的证据却是薄弱的。
存在的问题不只是统计方面的。许多报告的结果在生物学上也是不可能的。举例来说,2013年的研究发现,人如果每周吃三份坚果会降低近40%的死亡风险。Ioannidis说,如果吃坚果确实能降低40%的死亡风险,这将是革命性的发现,但这一数字几乎肯定是言过其实。如果没有食用场景,一切都毫无意义。90岁的人是否可以和60岁的人得到相同的好处?你必须多少天甚至多少年坚持吃坚果才能获得这样的好处,以及这样的影响会持续多久?这些才是人们真正想知道的答案。但是,正如我们的实验证明,很容易使用营养调查去关联食物和健康结果,但很难知道这些关联的真正意义。
“食物频率问卷这个方法是不完美的”,哈佛大学的Chavarro说,“但目前很少有其他的选择。用目前已有方法进行营养评估我们可能已经到了一个极限,想要做得更好则需要一个重大的转变才行”。
目前的研究遭受着另一个重大的困扰:我们对它们的期望值太高。我们期待着回答类似这样的问题:黄油和人造黄油哪个更健康?吃蓝莓可否保持我的思维敏捷?腊肉会不会让我得结肠癌?但是通过人们的记忆而完成的观察性研究(食物频率问卷)这样的工具很粗糙,不足以提供如此精确的答案。
“一个原因是,单一的营养成分,如饱和脂肪或抗氧化剂对产生疾病的绝对风险只有微不足道的差异”,Ioannidis解释道。 (他的结论来自于更严格的随机对照试验。)这就是为什么头条新闻经常报道相对风险 - 吃腊肉的人与那些不吃的人比较,该组中得了癌症的比例。相对风险总是比绝对风险更加极端,但绝对风险(比如:如果你吃腊肉,患癌症的概率)才是我们真正关心的。如果说,1万个吃腊肉的人中1个人得了癌症,1万个不吃腊肉的人中3个人得了癌症,这是一个3倍的差异。但在绝对风险的差异上, 得癌症是0.01%的概率相对于0.03%的概率 - 这样的差距是微小的,可能不足以改变任何人的饮食习惯。
现在的新闻倾向于把结果报道地比真正的事实更加精确和重要,这也解释了为什么我们会看到这么多来来回回结论不同的头条新闻,比如说咖啡。 “大数据集产生的所谓的虚假准确度都是噪音(noise),”Ioannidis在他2013年的分析里写道。
因此,我们又回到了最初的那个问题:什么是健康饮食?我们知道它的基本知识 - 我们需要足够的热量和蛋白质才可生存 。我们需要像维生素C和铁这样的营养物质。除此之外,我们可能想得太多了,营养肥胖研究中心的生理学家Archer说。 “我们的文化是回避水果和蔬菜,但我们也健康地活了几千年”,他说。(编者注,西方确实很少吃蔬菜和水果。)有些人群只吃极少数的蔬菜,而另一些人生存几乎完全以植物为食物。Archer说,结论是我们的身体有很强的适应能力,如果我们能学会倾听,它会告诉我们它需要什么。
◆ ◆ ◆
结语
即便如此,我猜人们也不会放弃寻找茶水间和冰箱里的秘密健康神药。媒体和公众不断的攫取这些研究是有原因的。也是因为同样的原因,研究人员花费数十亿美元做着这样的科研。我们生活在这样一个世界里:可怕的疾病不停地侵袭着我们周围的人,有时还是猝不及防的。当听说有人心脏病发作或确诊为癌症的时候,我们的自然反应是寻找一种方法来保护自己免受同样的命运,因此,我们通过食物来获得哪怕只有一点点的安慰。我们不能控制体内细胞发生的变化,但我们起码可以控制吃进自己身体里的东西。科学还没有找到一个神奇的维生素或营养使我们保持永远健康,但似乎我们已决心继续努力寻找下去。
原文发布时间为:2016-02-09
本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号