在本论文中,作者们开发了一种机器学习算法,整合血液指标、饮食活动和肠道的微生物组数据来准确地预测个人饭后的血糖水平(临床医学称之为餐后血糖反应,PPGR)。这一研究表明,个人微生物组的组成和功能是如何有助于个性化营养学和疾病预防的。这一项目由 Eran Segal 和 Eran Elinav 教授领导,论文于 2015 年发布在 Cell 上。读者朋友也可以点击阅读原文下载此论文。
肠道微生物组日益突显的作用
我们肠道中的细菌,也就是我们所知的肠道微生物组,对我们的健康与疾病风险起着很大的作用(图 1)。在肥胖与糖尿病的发展过程中,如今肠道微生物组被认为是个体之间存在差异的重要原因。个人微生物组一般由一种细菌占主要地位,且与年龄、性别、地理位置无关,并且受到长期的饮食习惯的影响。
图 1. 营养的变化极大地影响近期的代谢
由于近年来测序技术的发展,如今测量微生物组中的几乎每一种微生物基因也成为了可能。具有较低的微生物基因数(即更低的多样性)的人群易于患更严重的肥胖症,而且也要比有较高的微生物基因数(即更高的多样性)人群有更多的炎症。因此,微生物组既是生物标志物,也是在个性化营养中对饮食干预的作用靶标。
个性化营养大数据
目前,预测一个人的 PPGR 值的常见方法是观察饮食中的碳水化合物的含量。或者,人们可以参考血糖指数(GI),这是一种根据食物中碳水化合物影响血糖水平的程度的相对排名。然而,作者认为 GI 数据只是基于单一的一种食物,并不能反映现实生活中的膳食。人们的基因、生活方式、肠道微生物以及膳食都会影响 PPGR。
在这项研究中,作者结合了(i)可穿戴式连续性血糖检测仪对 PPGR 进行的纵向监测,(ii)肠道微生物组数据,(iii)包含 800 名非糖尿病志愿者身体信息的大型群组研究(图 2)。志愿者自己上报了超过大约 47000 顿饭中大约 1000 万卡路里的消耗,并且使用人体工程且微创的连续血糖监测仪自动捕捉了 150 万个血糖测量数据值。研究人员还整合各种数据类型,包括健康志愿者和糖尿病前期志愿者群组的各项信息如饮食摄入、人体测量数据、体育运动、睡眠觉醒周期、高分辨率的长期血糖监测和粪便微生物宏基因组。
图 2. 临床和微生物数据收集
利用机器学习算法创建适合你的饮食
作者首先证实了志愿者之间的巨大差异。同样的食物会给某些人带来巨大的血糖峰值,但是对于其他人只会造成微小的浮动。志愿者对于会引发尖锐峰值的食物也有所不同。例如,445 号参与者对香蕉反应强烈,而 644 号参与者则会对餐后饼干产生强烈的反应。(图 3)
图 3. 不同的人在用同样的餐后食用不同的餐后食物
之后,作者分析了每个人的人体测量数据、活动参数和肠道微生物组数据以预测针对各种食物的 PPGR 响应的预测。结果表明,每个人的 PPGR 可以通过计算方法来实现预测,而且个性化的饮食可能更成功有效地控制 PPGR。简单地说,作者采用了一个两阶段算法(图 4)。在第一阶段,他们开发了一种基于梯度提升回归方法的机器学习算法,其中派生了数以千计的决策树来优化整体模型的预测能力。梯度提升回归模型适用于 PPGR 与各种预测因子之间的非线性关系。研究人员利用留一交叉验证法(leave-one-out cross-validation)在 800 名个体群组中对他们的模型进行训练。在第二阶段,他们招募了 100 个志愿者的独立群组,并使用在 800 名志愿者的主要群组上训练好的模型来预测他们的 PPGR。
图 4. 预测的方法
未来的方向
这项工作是一项重要的概念验证研究,它在饮食反应预测中整合了微生物组的贡献。整合从大规模志愿者中得到的多维纵向数据可以使得机器学习算法的表现优于基于专家经验的 PPGR 预测。Eran Segal 教授打算进一步提升算法的效果。他们计划通过采集志愿者的体育运动、肠道细菌菌株甚至遗传学方面更详细的信息,来提升模型的准确率。
最近,Eran Segal 和 Eran Elinav 两位教授成立了一家名为 DayTwo 的创业公司(https://www.daytwo.com),旨在提供个性化营养服务,从而让人们的生活更健康并维持正常的血糖水平。用户可以通过一个 APP 来调整膳食以防止 2 型糖尿病。
图 5. 一个帮助你区分食谱好坏的 APP
Reference
Zeevi D et al. Personalized Nutrition by Prediction of Glycemic Responses. Cell, 2015.
(link: https://www.ncbi.nlm.nih.gov/pubmed/26590418).