大数据算法在诸多领域“弄潮”

简介:

研究恒星和对付癌症看起来似乎风马牛不相及,但大数据算法将两者关联到了一起,并成为其中的“弄潮儿”。

据英国广播公司报道,天文学家和肿瘤学家近日在英国剑桥大学召开跨学科会议,探讨如何对不断涌来的数据进行管理。在此次会议上,天文学家尼古拉斯·沃尔顿与英国剑桥癌症研究所的詹姆斯·布伦顿一见如故,与会人士也倾听了英国剑桥癌症研究所的卡洛斯·卡尔达斯教授对未来如何使用大数据的畅想。

恒星算法可用来攻克癌症

会议上,卡尔达斯说:“天文学家们需要对望远镜拍摄的天空图片进行深入研究,但无法通过人工筛查数百万张图片,因此,他们用成像算法来对物体进行分析和归类。那么,可以用同样的算法对仪器拍摄的人体图像进行深入研究吗?”

答案无疑是肯定的!而且,这一算法一直在推动癌症领域的研究。

卡尔达斯进一步解释说:“使用这些天文学算法,我们能自动对数十万个细胞进行归类,能研究模式,研究细胞之间如何关联,精算出有多少细胞以及它们之间的距离。这一算法加快了诊断进程,也使一些以前被掩盖或忽视的信息重见天日,为我们所用。”

卡尔达斯一针见血地指出:“这一算法将病理学完全转变到数字领域。”

英国癌症研究所的研究人员最近在“阅读”乳腺癌细胞方面取得了重大突破,他们收集了超过30万个乳腺癌细胞的数百万张图像,对其中的细胞形状和不同基因的数据进行分析,创造了一份3D“地图”,显示了乳腺癌细胞形状与基因打开和关闭间的关联,并将其与真正的疾病诊断结果进行匹配。

英国癌症研究所首席科学家凯伦·沃斯顿教授说:“了解乳腺癌的外观和行为与其基因组成之间的联系,将有助研究人员更好地了解该疾病。”

大数据分析让多领域受益

当然,从大数据中受益的不仅包括疾病诊断。埃森哲咨询公司总经理尼克·米尔曼解释称:“在健康领域,以前用于市场分析以了解个人偏好的技术,现在也能应用于保健,如鼓励某人遵循更健康的饮食习惯等。”

英国伦敦科学博物馆最近在举办一个展览,其中一个主题正是大数据。该展览不仅展示了大数据对工业的影响和重塑,也关注我们的“数据脚印”对自身隐私的影响。

此次展览的负责人谢尔顿·帕奎因在接受英国广播公司采访时表示:“这场静悄悄的革命(大数据)已经彻底改变了我们生活的方方面面,从如何看待恒星,到如何看病,再到人们之间如何交流。现代社会通过技术彼此关联交织在一起,我们拥有的所有事物都与大数据有关。”

帕奎因说:“我们现在能研究语言的进化历史,为研究疾病搜索基因组等,人们之间日益紧密的关联也在使我们更容易被研究。”

信息和数据即是金钱

这一展览上的一项研究让人印象深刻。这项由剑桥大学进行的研究证明,通过用户在社交媒体脸书上留下的“点赞”记录,可轻易地了解用户的个性特点。

研究人员要求志愿者完成一系列性格测试,然后再将测试结果同他们在脸书上留下的数据进行比较。戴维斯·史迪威说:“我们发现这两者的匹配度非常高,如此一来,我们或许可以通过脸书上的数据脚印来预测某个人的个性特点,包括智商、年龄、性格、性别以及宗教信仰等。”

而且,他们开发的“可预测的世界(Predictive World)”算法,会利用用户的脸书数据生成用户的心理情况,同时找出性别和薪水、位置、犯罪风险,以及性格和预期寿命之间的关系。

现在,该研究团队正在同游戏出版商育碧公司合作,帮助公司推销其充满未来主义色彩的游戏“看门狗2(Watch Dogs 2)”。

越来越多公司尝试让人们更好地理解与他们有关的数据,并出售这些数据,CitizenMe是其中的翘楚。

人们能借助CitizenMe从互联网收集自身数据的副本,并将其放入手机APP中。该公司创办人圣约翰·迪金斯表示:“这些信息和数据很快会变得非常值钱。如果用户愿意,可以选择匿名出售这些数据赚钱。”目前约有1万人使用这一APP。

本文转自d1net(转载)

相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
目录
相关文章
|
机器学习/深度学习 算法 搜索推荐
从理论到实践,Python算法复杂度分析一站式教程,助你轻松驾驭大数据挑战!
【10月更文挑战第4天】在大数据时代,算法效率至关重要。本文从理论入手,介绍时间复杂度和空间复杂度两个核心概念,并通过冒泡排序和快速排序的Python实现详细分析其复杂度。冒泡排序的时间复杂度为O(n^2),空间复杂度为O(1);快速排序平均时间复杂度为O(n log n),空间复杂度为O(log n)。文章还介绍了算法选择、分而治之及空间换时间等优化策略,帮助你在大数据挑战中游刃有余。
467 3
|
6月前
|
机器学习/深度学习 自然语言处理 算法
大数据选举预测:算票的不只是选票,还有算法
大数据选举预测:算票的不只是选票,还有算法
241 0
|
10月前
|
负载均衡 算法 关系型数据库
大数据大厂之MySQL数据库课程设计:揭秘MySQL集群架构负载均衡核心算法:从理论到Java代码实战,让你的数据库性能飙升!
本文聚焦 MySQL 集群架构中的负载均衡算法,阐述其重要性。详细介绍轮询、加权轮询、最少连接、加权最少连接、随机、源地址哈希等常用算法,分析各自优缺点及适用场景。并提供 Java 语言代码实现示例,助力直观理解。文章结构清晰,语言通俗易懂,对理解和应用负载均衡算法具有实用价值和参考价值。
大数据大厂之MySQL数据库课程设计:揭秘MySQL集群架构负载均衡核心算法:从理论到Java代码实战,让你的数据库性能飙升!
|
5月前
|
算法 搜索推荐 大数据
当“爆款书”遇上大数据:出版业的老路,正在被算法改写
当“爆款书”遇上大数据:出版业的老路,正在被算法改写
500 8
|
11月前
|
数据采集 机器学习/深度学习 算法
别急着上算法,咱先把数据整明白:大数据分析的5个基本步骤,你都搞对了吗?
别急着上算法,咱先把数据整明白:大数据分析的5个基本步骤,你都搞对了吗?
718 4
|
7月前
|
算法 搜索推荐 大数据
大数据能不能看透消费者的心?聊聊那些“你以为是偶然,其实是算法的必然”
大数据能不能看透消费者的心?聊聊那些“你以为是偶然,其实是算法的必然”
214 5
|
存储 分布式计算 算法
大数据-106 Spark Graph X 计算学习 案例:1图的基本计算、2连通图算法、3寻找相同的用户
大数据-106 Spark Graph X 计算学习 案例:1图的基本计算、2连通图算法、3寻找相同的用户
325 0
|
12月前
|
数据采集 机器学习/深度学习 人工智能
大数据中的数据预处理:脏数据不清,算法徒劳!
大数据中的数据预处理:脏数据不清,算法徒劳!
1143 2
|
缓存 算法 大数据
大数据查询优化算法
【10月更文挑战第26天】
635 1
|
机器学习/深度学习 数据采集 算法
大数据中缺失值处理使用算法处理
【10月更文挑战第21天】
1009 3

热门文章

最新文章