预见未来:数字化人生

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介:

拥有世界一流的科研队伍,开展一系列重要动植物、人类健康、生物能源的基因组研究,致力于人类健康服务事业和科技应用领域的发展。



互联网社会,我们接触到的数字化信息越来越多。正如美国麻省理工学院教授、媒体实验室的创办人、被媒体誉为“未来学家”的尼葛洛庞帝在《数字化生存》中所说,“信息的DNA”正在迅速取代原子而成为人类生活中的基本交换物。


无论何时,我们的身边都充斥着大数据。大盘涨跌几个点,背后是一支支红的绿的股票在起伏;出门前看看天气预报,才好决定要不要带伞;和朋友吃饭点开大众点评看看最受欢迎的餐厅和菜式;在网上买个东西,淘宝还会根据你的搜索和购买记录“猜你喜欢”……数字化已渐渐改变我们的生活方式和行为习惯,润物细无声。




除了这些“身外之物”,每时每刻,我们身体里的数据,也在反映着我们的健康状况。23对染色体,2万多个基因,30亿对碱基,千亿个神经元,无数细胞每分每秒都在经历着自我更替……我们的健康由此决定,了解更多,也就更能把握健康。



社交网络和健康大数据

大数据的作用范围越来越广。想过社交网络能够对流行病进行监控么?据奇点网报道,Twitter曾被芝加哥公共卫生部(CDPH)用来确定食源性疾病爆发的案件,CDPH与Smart Chicago合作开发了一款能对有关食物中毒的Twitter消息进行分析的应用,据此,CDPH对芝加哥的违规食品企业进行了规范整顿。




无独有偶,纽约市健康与心理卫生部(DHMH)与哥伦比亚大学、商铺点评网站Yelp进行合作,对Yelp上有关食源性疾病的点评信息进行分析,根据结果预测疾病爆发情况。


当然,这些结果目前只能作为辅助预测信息,大数据更特别的应用,还在更为直接的健康应用上。


生命大数据

每个生命体都是大数据。人的基因组有约30亿对碱基,以一个Byte储存一对碱基来算,每个人有3GB左右的数据量(via www.OnlineEducation.net)。觉得不多?其实一个人基因组检测的原始数据就有好几百GB,再加上蛋白质等好几个TB才能够完成一个人的数据。即使按一个人1TB的数据量来算,全球人的基因组加起来就有约7万亿GB的数据量。而且,和我们同在的不止是我们自己,还有十倍于我们细胞数量的微生物,我们的地球上还有许多的动物、植物、微生物......地球生命的基因组数据量不可估计,且绝对远大于互联网数据量——据美国市场研究公司IDC预测,到2020年时,全球互联网数据总储存量才达到40万亿GB。




正如世界上没有两片完全一样的树叶,一个人不可能两次踏进同一条河里的道理一样,每个人的基因组信息都是独一无二的,甚至每个人在不同时刻的基因组信息都可能有差异。基因组信息的测序和生命密码的解读,会帮助我们了解基因状况,防治疾病。


从统计学角度来说,只有收集大量的数据,才能从中分析出规律。疾病预知、健康管理同样需要大数据的支持,只有基于大范围的数据比对,才能知道某个人的基因变异是否是致病原因。因此,只有在收集多数人的基因组信息基础上,才能更为准确地了解基因与疾病的关系,及如何做好未病先防。



基因网络

智能家居的概念越来越热,将所有设备连接起来,用手机或某个智能设备来控制,似乎成了便捷生活的代名词。设想一下,如果将所有人的生物信息放在可以互相连通的平台上,形成“基因网络”,通过对这些生命大数据的比对分析,将对健康管理大有助益。




而这依赖于基因组学在全球的大力发展。2012年英国宣布启动“10万基因组计划”,去年又从政府和私人渠道获得了3亿英镑的资金注入,目的是为了根据基因组学和临床数据制定个性化治疗方案。今年奥巴马政府提出投资2.15亿美金用于美国100万名志愿者的基因测序项目,希望将各大机构或企业已有的数据进行整合,便于医生发现病因、研究人员了解致病因素,并开发有针对性的基因靶向药物。华大基因的标志性项目之一百万基因组计划也将扩大范围。该项目旨在对百万人群、百万种动植物和百万微生态进行基因组测序。


现有的医疗系统也正在改革。国外已经有企业与机构开展电子病历改革计划,比如获得谷歌风投的Flatiron Health,计划整合美国肿瘤治疗中心所有临床数据,为医生出具医疗方案提供参考。IBM的人工智能系统Watson则与Memorial Sloan kettering 肿瘤中心展开合作,整理分析论文、临床数据、文本,并生成分析结果及治疗方案供医生决策参考。



健康管理:上医治未病

每个现代人都需要健康管理。据《新英格兰医学杂志》分析,近100年来,慢性病(癌症、心脏病等)、老年病对人类健康的影响越来越大。据《2014中国卫生和计划生育统计年鉴》显示,2013年,糖尿病发病率是35.1‰,2003年,这个数据只是5.6‰,十年来发病率增长了6倍;2013年高血压发病率是142.5‰,2003年这个数据只有26.2‰,十年来发病率增长了4倍。




一些慢性疾病的发生其实可以避免,令人遗憾的出生缺陷也可以避免。基因技术可以帮助我们早期发现慢性病、遗传病、肿瘤,通过婚前、孕前、产前基因检测,能够控制出生缺陷(比如21号染色体多出一条导致的唐氏综合征,在孕早期即可通过检测孕妇血液中的胎儿游离DNA片段发现异常),对于肿瘤等已患疾病,可以通过靶向药物和化疗药物用药指导检测,辅助医生指导用药,已达到更好的治疗效果。


当然,对于数字化的人生,许多人还有顾虑——数据泄露怎么办?数据平台的安全性,会是这一成果普及的重要前提。但技术本身无所谓对错,我们怎样使用它才是结果好坏的决定因素。也有人担心,数字化会带来人的异化,我们会被我们制造出来的东西左右,或是生存方式虚拟化。担心源自关心,但过分担忧往往无益。科技的发展有伦理的制约,相信科学家会平衡探索与自律的关系。我们要做的,是利用技术带来的好处,对自己和家人的健康负责。




原文发布时间为:2015-06-23

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
JavaScript API
发票PDF在线合并小工具
在公司报销的时候虽然已经有了电子发票,但是贴票还是需要将发票打印出来贴上,如果只有一两张也就算了,如果几十张.. 呵呵,光胶水我都不够用的,找了好多工具、在线版本都不合心意,烦死,自己做个自己喜欢的吧。
发票PDF在线合并小工具
|
存储 关系型数据库 MySQL
一文教你使用 Docker 启动并安装 Nacos
一文教你使用 Docker 启动并安装 Nacos
5157 0
|
移动开发 JavaScript iOS开发
【笔记】html图片映射usemap(vue环境下、map、area、coords)
html图片映射usemap(vue环境下、map、area、coords)
361 0
【笔记】html图片映射usemap(vue环境下、map、area、coords)
|
数据可视化 关系型数据库 网络安全
节省大量时间的 Deep Learning 效率神器
节省大量时间的 Deep Learning 效率神器
477 0
节省大量时间的 Deep Learning 效率神器
|
存储 NoSQL Java
多租户&多账户&多公众号_saas微信公众平台设计思路
多租户&多账户&多公众号_saas微信公众平台设计思路
355 0
多租户&多账户&多公众号_saas微信公众平台设计思路
|
传感器 算法 前端开发
3D激光SLAM:LIO-SAM整体介绍与安装编译
**LIO-SAM**的全称是:**Tightly-coupled Lidar Inertial Odometry via Smoothing and Mapping** 从全称上可以看出,该算法是一个紧耦合的雷达惯导里程计(Tightly-coupled Lidar Inertial Odometry),借助的手段就是利用GT-SAM库中的方法。 **LIO-SAM** 提出了一个利用GT-SAM的紧耦合激光雷达惯导里程计的框架。 实现了高精度、实时的移动机器人的轨迹估计和建图。 **框架的构成**: 通过相对观测(两帧间的估计)及绝对观测(GPS),还包括回环检测,构成因子图。 这
3D激光SLAM:LIO-SAM整体介绍与安装编译
|
7月前
|
安全 Unix Linux
Linux 内核源代码情景分析(一)(中)
Linux 内核源代码情景分析(一)
91 1
|
机器学习/深度学习 计算机视觉 Python
如何使用 Google 的 AutoAugment 改进图像分类器
本文将解释什么是数据增强,谷歌AutoAugment如何搜索最佳增强策略,以及如何将这些策略应用到您自己的图像分类问题。
1805 0
|
Apache Windows 数据安全/隐私保护
windows服务器重启后 apache自动启动
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/chengyi_L/article/details/52484133 1.开机启动项+服务器开机自动登录       将apache启动程序制作成批处理命令 .bat文件,再将此bat文件加入开机启动项中。
1541 0
|
传感器 数据可视化 机器人
ROS中阶笔记(四):机器人仿真—Gazebo物理仿真环境搭建(重点)
ROS中阶笔记(四):机器人仿真—Gazebo物理仿真环境搭建(重点)
2180 0
ROS中阶笔记(四):机器人仿真—Gazebo物理仿真环境搭建(重点)

热门文章

最新文章