Google欲用大数据改善美国人早餐

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

HamptonCreek是一家专门生产植物鸡蛋食品的创业公司,它最有名的产品是“Just Mayo”,这家公司在本周刚刚进驻Dollar Tree开设专卖店,在接下来的几个月中,它还会将公司位于旧金山市中心的总部扩建成占地9万平方英尺的办公场所。不过它最大的动作还是挖走了Google的高级数据分析师丹·西格蒙德(Dan Zigmond)。HamptonCreek这样做得原因是什么呢?是要颠覆整个食品制造业。


西格蒙德在过去八年的时间里一直都在处理YouTube和Google Maps 出现的数据难题。他现在的新任务是为Hampton Creek建立全世界最大的植物数据库。这个数据库有可能会改变我们每天早上放进嘴里吃的东西,只是我们不会觉察到有什么不同而已。


GoogleMaps的专家可以为美国人的体重问题做些什么


可能你现在还看不出来,一位任职于蛋黄酱公司的前任Google数据科学家可以怎样改变标准美国饮食(SAD),不过根据Hampton Creek的CEO乔什·蒂特里克(Josh Tetrick)的说法,西格蒙德正是最合适的人员。“丹拥有令人难以置信的大脑,他能够整理大量的数据,并从中找出数据之间的真正联系。”他所说的“真正的联系”指的是利用现有的数据库找出能够真正改善地球的植物。


我们已经吃了太多垃圾食品了,所以我们需要吃更多的植物!USDA最新发表的一份调查表明,我们购入了太多的红肉、细粮和不健康的脂肪。




虽然有某些研究指出美国的肉类消费正在下降,但是全世界范围的整体肉类消费正在上升。从某种程度上来说这是个好消息,因为这意味着一些曾经贫穷落后的国家现在可以买得起更贵的食物了。尽管这是世界经济环境改善的信号,但是这对于我们的环境和身体健康来说就不是一件好事了。而且那些动物工业区的名声也不太好。不过我们暂时先放下这些虐待动物的问题,先来看看下面的一些数字,我们要消耗5到6磅的玉米,52加仑的水和超过1,000 BTU的石油才能得到一块四分之一磅的牛肉饼。



另外,过量摄入玉米和大豆产品也导致美国人的体重大幅上升。这可能是因为购买精细或者加工过的食物的价格要比健康有机蔬果便宜得多。自从大萧条以来,美国政府一直都根据农业法案向种植某些作物(例如玉米和大豆)的农民提供津贴。这份法案对薯片和糖果的产量提供了很大的支持,但是苹果就没有享受到这种待遇了。






肥胖症与低收入水平的相关性也是一个无可否认的事实。超市里面能买到最便宜的食品通常都有较高的卡路里含量和较低的营养价值。这些食品大部分都是来自农业法案所扶持的玉米和大豆。以上的原因导致了每三个美国成人当中就有一人患有肥胖症。这意味着现在美国有超过1亿的人口正在面临更高的健康风险,比如更容易患上糖尿病和心脏病。另外,截至2008年,我们每年的医疗支出已经超过了1,470亿美元!



然而,要建立全世界最大的植物数据库来解决以上的问题可不是一件简单的事情。现在世界上有超过870万种已知的植物,更不要提每种植物之下还有多种不同的分类了。


全世界最大的植物数据库可以为世界饥饿问题做些什么


根据联合国粮食及农业组织(FAO)的估计,每晚有超过10亿人都是在饥饿的状态下入睡的。我们为食用的动物提供的粮食都比提供给这些人的多。我们应该将更多的土地用于种植粮食,而不是养殖动物,这种做法可以大幅降低发展中国家购买主食的负担。


工厂化农业经营造成了大型工业化农场的垄断地位,这样会导致大规模的浪费,我们的土壤也会被磷酸甘油之类的除草剂污染,工人的收入被拉低,另外现在很多普通的病原体都对抗生素产生了抗药性,有很大一部分的原因都是来源于农场的工业化经营。Hampton Creek的想法是建立一个数据库,让其他的公司可以从中获取世界上各种植物的信息,然后利用这些信息来鼓励农民种植一些对地球有好处的新经济作物(不仅仅是大豆和玉米)。这样反过来也能帮助农民更好地养家糊口,提供更加健康、性价比更高的食物,同时也能带动小型农场的发展。


解密数据

Hampton Creek的调研团队现在已经记录了13种植物当中的4,000棵不同的植物,希望找出比HamptonCreek现有产品拥有更好地稳定性和口感,而且价格更低的植物特性。蒂特里克做出了这样的比喻,“我们现在不是在搅拌鸡蛋,而是将植物捣碎,找出我们需要的特性。”


Hampton Creek最出名的产品是蛋黄酱,不过它也有卖不含鸡蛋的曲奇饼。他们很快就会推出一种外观和味道都跟鸡蛋一样的豆制品。蒂特里克说如果拥有世界上最大的植物数据库的话,他们将会推出更多不含鸡蛋的产品。他表示有一种植物现在还没有投入市场,但是它可以降低糖果的含糖量,同时还能保持糖果本来的味道。


这家公司的目标是向大众提供价格合理,同时能够改善地球的食品。“这就是我们最近进驻Dollar Tree的原因。”蒂特里克说道,“比如像我爸爸这样的人就应该买得起蛋黄酱,不用担心它的价格和是否健康。对于普通人来说,食物应该变得更加健康和便宜,不然它们就没有任何意义了。”


出售数据

西格蒙德如果建立出全世界最大的植物数据库,Hampton Creek就可以开始研究那些植物拥有他们所需的特性,可以做出更健康、更便宜,而且对动物和环境的影响更低的食品。


蒂特里克深入的解释了他们发现某些类型的加拿大黄豆拥有合适的分子质量,这就意味着这些黄豆拥有合适的稳定性,可以用于制作Hampton想要的产品。但是从目前来看,要找到更多这样的植物特性无异于大海捞针。仅仅是加拿大黄豆就有超过2,000个变种。


根据蒂特里克的说法,如果了解了这方面的知识之后,他们就可以做出更便宜、更安全、更健康的产品。而且这些信息也是一些大型食品厂商愿意花钱购买的。虽然蒂特里克不愿意透露具体的厂商名字,但是他说Hampton Creek现在已经跟几家知名的食品品牌商讨数据库授权的事宜。


“如果现在有人要用十亿美元买下Hampton Creek,我们全公司上下都会毫不犹豫地拒绝。”蒂特里克说道。这家公司现在已经获得了由Bill Gates Foundation和Google Ventures等投资人提供的3,000万美元资金,这是一家盈利性的公司,目前处于盈利状态。他们的“Just Mayo”产品在全国的Whole Foods、Safeway、Costco和Dollar Tree等商店有售。


Dollar Tree这家商店对于蒂特里克个人来说有着最重要的意义,因为这是一家面向中等收入的美国人的商店,也是他爸爸会走进去买东西的商店。这也是他愿意将他们的信息卖给一些大型食品厂商的原因。他想要这些产品变得随处可见,能够让人们真正吃上更好地食物,无需再站在收银台前在价格和健康之间作出选择。“我真的很想做一些能够改变世界的事情。”这对于他和西格蒙德来说是真是一份量身定做的工作。


原文发布时间为:2014-07-19

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
5月前
|
SQL 监控 大数据
"解锁实时大数据处理新境界:Google Dataflow——构建高效、可扩展的实时数据管道实践"
【8月更文挑战第10天】随着大数据时代的发展,企业急需高效处理数据以实现即时响应。Google Dataflow作为Google Cloud Platform的强大服务,提供了一个完全托管的流处理与批处理方案。它采用Apache Beam编程模型,支持自动扩展、高可用性,并能与GCP服务无缝集成。例如,电商平台可通过Dataflow实时分析用户行为日志:首先利用Pub/Sub收集数据;接着构建管道处理并分析这些日志;最后将结果输出至BigQuery。Dataflow因此成为构建实时数据处理系统的理想选择,助力企业快速响应业务需求。
271 6
|
8月前
|
SQL 存储 人工智能
Google BigQuery深度解析:云端大数据分析服务的威力
【4月更文挑战第8天】本文是关于Google Cloud Platform的BigQuery在大数据和云技术领域的应用分析。BigQuery的核心特性包括无服务器、全托管架构,实现高性能的超大规模并行处理,并严格遵循安全与合规标准。在实战应用中,它用于数据湖分析、机器学习与AI,以及实时数据分析与BI。BigQuery的极致性能、易用性和与GCP生态的整合,使其成为云端大数据分析的强大工具,适用于各种行业场景,帮助企业释放数据价值。作者将持续分享相关技巧和最佳实践。
966 0
|
8月前
|
存储 弹性计算 大数据
【云计算与大数据技术】Google、亚马逊、IBM、阿里云等云计算应用平台介绍讲解(超详细)
【云计算与大数据技术】Google、亚马逊、IBM、阿里云等云计算应用平台介绍讲解(超详细)
433 0
|
存储 缓存 负载均衡
大数据理论篇HDFS的基石——Google File System(二)
Google File System 但凡是要开始讲大数据的,都绕不开最初的Google三驾马车:Google File System(GFS), MapReduce,BigTable。 为这一切的基础的Google File System,不但没有任何倒台的迹象,还在不断的演化,事实上支撑着Google这个庞大的互联网公司的一切计算。 以下是原文内容,内容较长,建议详细阅读。
269 0
大数据理论篇HDFS的基石——Google File System(二)
|
存储 缓存 监控
大数据理论篇HDFS的基石——Google File System(一)
Google File System 但凡是要开始讲大数据的,都绕不开最初的Google三驾马车:Google File System(GFS), MapReduce,BigTable。 为这一切的基础的Google File System,不但没有任何倒台的迹象,还在不断的演化,事实上支撑着Google这个庞大的互联网公司的一切计算。 以下是原文内容,内容较长,建议详细阅读。
678 0
大数据理论篇HDFS的基石——Google File System(一)
|
存储 分布式计算 监控
实时计算大数据处理的基石-Google Dataflow
简要回顾一下,上一篇我们介绍了Streaming,批量与流式计算,正确性与推理时间的工具,数据处理模式,事件事件与处理时间,窗口化。 在这篇文章中,我想进一步关注上次的数据处理模式,但更详细。 这里会用到一些Google Cloud Dataflow[1]的代码片段,这是谷歌的一个框架,类似于Spark Streaming或Storm。
458 0
实时计算大数据处理的基石-Google Dataflow
|
数据采集 存储 搜索推荐
康诺云联合创始人郭辉:让大数据改善健康
郭辉:刚才海军和卢刚实际上都提到过这个领域的一些事情,我们在看人的需求在变化的,传统健康的时候大家都会想到医院,实际上医院是被动型的,当你有了疾病以后医院才是被动的选择。
333 0
康诺云联合创始人郭辉:让大数据改善健康
|
大数据 数据处理 分布式计算
Google的大数据为什么这么牛逼?
近年来,大数据技术的发展,不论是技术迭代,还是生态圈的繁荣,都远超我们的想象。从 Spark 成为 Hadoop 生态的一部分,到 Flink 横空出世挑战 Spark 成为大数据处理领域的新星,再到如今 Google 又决心用 Apache Beam 一统天下。大数据技术的发展可谓跌宕起伏,波澜壮
1117 0
|
2月前
|
存储 分布式计算 数据挖掘
数据架构 ODPS 是什么?
数据架构 ODPS 是什么?
456 7
|
2月前
|
存储 分布式计算 大数据
大数据 优化数据读取
【11月更文挑战第4天】
61 2