大数据活力要靠规则保障

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

通过云计算,大数据在全球医疗、卫生、保险等领域得到广泛运用,它像土地、矿产一样,成为一种能够创造价值的资源。但因为是基于对人的信息的采集,大数据的利用也陷入了个人隐私的困境。如何在利用其价值的同时,规避信息安全的风险,专家认为,最重要的是要制定法律,让那些拥有大量数据的人,不去滥用数据。

“很多医院医疗水平很高,但没有数据库,导致很多患者错过最佳治疗时间”

英国邓迪大学医学院院长安德鲁·莫里斯每天都要浏览自己建立的苏格兰糖尿病研究网。这个网站的登记用户为来自苏格兰的23.9万名糖尿病患者。通过浏览网站上的信息,莫里斯跟踪患者病情,及时在患者病情加重前就拿出救治方案。经过7年的努力,这个网站建立的数据库已经使苏格兰糖尿病患者的截肢率降低了40%。

莫里斯还给每位患者配了一个随身携带的微型电子设备,以随时采集患者的身体变化数据,患者也可以24小时不间断地观察病情,这些设备被患者们亲切地称为“衣袋里的智能医生”。

莫里斯说,在大数据时代,医生的职责正在从过去的“给病人看病”转为“预测和预防病情”。“很多医院的医疗水平很高,但由于没有建立数据库,导致很多患者错过了最佳治疗时间。”

国际商业机器公司(IBM)中国开发中心首席技术官毛新生在接受本报记者采访时表示,大数据在医学领域可以比较便捷地获得,比如,可穿戴设备测量血压、心跳、血糖、血脂等指标,实时了解人体的运行情况;而手机应用程序可以收集饮食、作息等方面的数据,汇集到云端。

日本广岛县吴市是日本少子老龄化的典型,该市65岁以上人口占比高达28%,导致地方财政的70%用于支付医疗费用。为了削减医疗费用,吴市于2008年引进了“健康管理促进体系”,将医院和药房提交给医保部门的处方、医疗费用报销单据等扫描输入电脑后生成数据,筛选出就诊次数频繁、医疗费用异常的案例,医保部门再对其进行重点干预。比如,一位70岁老太太因为膝盖疼痛在一个月内去了15次医院,医保部门就派出护士对病人进行上门指导,帮助她改变生活方式,并改用疗效相同的低价药品。通过鼓励使用低价药品等手段,2011年,该市节省医疗费用约1.5亿日元(1元人民币约合16.4日元)。

目前,日本政府已经决定在全国推广“吴市模式”,通过对医疗数据的大规模分析,确定合理的药品和单病种诊疗价格,抑制过度医疗,控制医疗费用。

 “大数据就像一个上帝,无所不知,所有数据都可以加以利用”

大数据应用的实质是,通过云计算强大的计算和存储能力,把所有数据都吸收进来,分析现象之间的关联度,寻找到重复性的规律。这也是为什么当你打开淘宝、京东商城等网站,经常会看到“浏览了该商品的用户还购买了这些商品”的推荐,百度也会在同一页面向不同用户精准地投放不同的广告。毛新生解释说,“这是利用大数据进行的交叉销售,即一件事情发生,另一件事情也很可能发生。交叉销售有助于减少信息不对称,用户可以减少无关广告的打扰,商家也可以降低广告成本。”

“大数据就像一个上帝,无所不知,所有数据都可以加以利用。”毛新生说, “做一个大胆假设:未来,如果你在微信上谈情说爱,微信在分析了你们的聊天内容后,就可能向你推荐一些适合情人的旅游胜地、餐厅、电影和音乐会,甚至会向你推荐一些情歌和少女约会服饰等。”

毛新生还举了大数据在生活中得到应用的一个实例: “可以在京津冀地区大量铺设用于监测空气质量的传感器,实时采集空气数据进行分析,就可以知道京津冀地区的空气粉尘的传播路径。比如,北京的雾霾是输入性的还是输出性的?如果是前者,是由哪个地区输入?在那个地区,钢铁厂、石灰厂还是造纸厂是雾霾的原生制造者?”

毛新生认为,大数据也正在重塑新闻行业的商业模式。他举例说,“有网络服务商以个性化信息推荐的方式推送新闻,提高了推荐精确度,比传统媒体更善于利用目标客户的价值。以此类推,传统媒体也可以利用大数据找出读者最感兴趣的新闻事件,然后马上派出记者就此新闻采写文章,并对热点新闻稿件的转载征收更高的费用。”

在美国斯坦福大学助理教授贾斯廷看来,随着大数据的应用范围日趋广泛,许多研究领域正在一个个变成“数据密集型学科”,其中包括政治学。像贾斯廷这样的政治学者,其日常工作模式已经转变为:对互联网上的新闻报道、受众留言、博客文章、政客演说等海量信息进行搜集、统计、分析,从而预判一段时期的政治风向和温度。

“衡量大数据的成效,不是看创造了多少数据,而在于创造了多少价值”

“正如火被发明后,既能用来煮食、照明、取暖,也可以用来纵火。大数据技术的应用可以促进经济增长与社会发展,但也可能适得其反。”中国信息安全测评中心顾问俞晓秋对本报记者说。

在大数据各种“先天缺陷”中,隐私泄漏是最令人担心的。“在社交网络上,任何人都可以看到你的国籍、婚姻状况、毕业学校、邮箱等个人信息,甚至可以翻看你发布的照片和生活感悟等。在陌生人面前你变得毫无隐私,这非常可怕。”巴西智库瓦加斯基金会技术与社会中心研究员玛里莉娅对本报记者感叹说。

“您现在是不是正考虑买车辆保险?”“我们向您介绍一款理财产品”……每天,巴西人何塞都会收到好几通这样莫名其妙的推销电话,他的邮箱里也经常堆满了各类促销邮件。

对大数据的精确分析,也可以使黑客更加精准地进行攻击,或通过仿冒社交网站域名进行病毒传播等。南非人亚伯拉罕经常在社交网站“脸谱”上炒股。最近,除了一个炒股账户以外,他的其它账户突然都拒绝访问了。“后来我才发现,原来有人盗用了我的身份,已经侵入我的账户长达两周时间,他一直盯着我的账户呢!”

在大数据时代,关乎国计民生的国家重要信息数据系统同样面临着网络恐怖主义的威胁。斯诺登揭露的美国“棱镜门”项目就体现出“数据挖掘”技术在情报领域的应用。

在毛新生看来,所有安全事故的根本原因主要在于人们自身对安全问题缺乏足够重视,有意或无意地泄露了一些入口信息。“人们需要培养保障个人数据安全的意识,包括不在邮件里写用户名和密码等个人信息。最重要的是制定法律,让那些拥有大量数据的人,不能滥用数据。”

咨询机构毕马威硅谷分部高级分析师维贾·佳卓对本报记者说,互联网公司应当建立共同的隐私标准,赋予用户更多控制个人网上信息的权利。比如,科技企业在搜集、储存用户信息时应当充分尊重用户知情权,明确告知搜集了哪些信息、如何贮存以及如何利用这些信息,此外,还应当对企业和机构可以采集的个人数据类型,作出明确、合理的限制。

中国社科院信息化研究中心秘书长姜奇平对本报记者表示,“大数据”作用的发挥,不仅有赖于数据收集、数据提纯等多重技术要素,更关键的是,大数据的应用要与人以及解决人的问题联系起来。衡量大数据的成效,不是看创造了多少数据,而应是利用这些数据,在满足人们需求方面创造了多少价值。

原文发布时间为:2014年06月30日
本文来自云栖社区合作伙伴至顶网,了解相关信息可以关注至顶网。
相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
SQL 分布式计算 运维
双11史上作业数最多,人工干预最少—MaxCompute 自适应执行引擎DAG2.0为1.5亿分布式作业提供自动化保障
阿里巴巴双11史上作业数最多,但人工干预最少的一次双11技术保障: 从动态并发调整带来的单日10亿计算节点的节省,到数据智能编排带来的高级基线单个作业数十个小时执行时间的缩短,再到全新Bubble执行模式在百万作业获取的30%以上的性能提升。 本文为大家介绍,在2020年阿里巴巴集团双11海量作业数目与突变的数据特性面前,阿里云MaxCompute 新一代 DAG 2.0 执行引擎,通过其自适应的动态执行能力和新架构上的全新计算模式,如何为双11大促数据的及时产出提供自动化保障。
6427 0
双11史上作业数最多,人工干预最少—MaxCompute 自适应执行引擎DAG2.0为1.5亿分布式作业提供自动化保障
|
存储 缓存 数据可视化
大数据(数据入库管理规则)
数据入库、大数据、入库规则
1377 0
|
SQL JavaScript 大数据
阿里云大数据ACP认证知识点梳理6——基础SQL语句(内建函数、窗口函数规则、隐式转换规则)
内建函数使用规则、窗口函数使用使用规则、隐式转换规则
1737 0
|
算法 数据库
《大数据分析原理与实践》——3.2 关联规则分析
本节书摘来自华章计算机《大数据分析原理与实践》一书中的第3章,第3.2节,作者 王宏志,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
1918 0
|
算法 数据库
《大数据分析原理与实践》一一 3.2 关联规则分析
本节书摘来自华章出版社《大数据分析原理与实践》一 书中的第3章,第3.2节,作者:王宏志 ,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
1514 0