谷歌流感预测|学习笔记

简介: 快速学习谷歌流感预测

开发者学堂课程【高校精品课-北京理工大学-大数据技术导论:谷歌流感预测】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/857/detail/15616


谷歌流感预测

 

内容介绍:

一、谷歌流感预测是什么

二、谷歌流感预测问题原因 

 

一、谷歌流感预测是什么

谷歌流感预测是大数据分析里面非常经典的一个案例。当谷歌把流感趋势预测这个案例推出来的时候,引起了很多人的关注,因为它是未卜先知的一个例子,常被看作大数据分析的一个优势,他发现了搜索关键词和流感发病率之间的关系。

谷歌它最开始是通过搜索起家,经常会用谷歌的搜索引擎去搜索数据,在搜索引擎里面输入数据的时候叫输入关键词,谷歌就通过输入的关键词。建立起关键词和流感发病率之间的关系,GFT 谷歌的浏览预测,亮出了十分惊艳的成绩单,在零九年 GFT 团队,在自然发文报告只需分析数十亿搜索中的45个关键词,45个关键词就能够比 CDC实际上是美国的疾病预防控制中心提前两周预报2007到2008年的这个流感的发病率,一天的提前,会带来更多的价值。可以采取更多的措施,可以避免更多的人染上流感,所以谷歌亮出成绩单之后,受到了大家非常广泛的这个关注

二、谷歌流感预测问题原因

图片230.png

在这张图可以看出,谷歌流感趋势和美国疾控中心的这个数据的对比,前面的红线和黄线还是非常吻合的,说明预测的还是非常准的,但也会发现。在后边2011年到2012年这段时间,它的差距会比较大,说明预测不准了,出现问题了,有人去分析了这个出现问题的原因,主要有三个方面。

第一个方面,认为过度的拟合导致了谷歌预测的不准,用前几年的数据,比如040506年的数据去预测0708年的情况,因为几年匹配的很好,但是它后面会有些突发情况,比如说反季节的情况,一般会认为冬天容易发生流感但夏天也可能出现流感的爆发,那这这些反常的信息反常的情况,在谷歌里面可能就没有预测到,所以就会导致预测不准,过拟合,过于与040506年的数据进行结合。过于相关,所以导致后边一些特殊的场景,它变得不准。

第二个问媒体的过度关注,因为流感预测一出现,大家都很关心,因为它很有效,提前两周预测出来,所以媒体很关注,很多人关注,有群众我民众会关注,科学家也关注,导致谷歌浏览器搜索这个关键词,自然对谷歌的模型会产生影响,所以也可能导致不准,这是谷歌的一个结论。

还有一种分析,是认为这个算法的演化,谷歌的搜索引擎服务于两个目的一是为用户找出最有价值的信息,第二个目的是要能够赚更多的广告的收入,谷歌的算法工程师就要围绕这两个目标去不断的去改进他的算法。改进算法的结果是他就会给用户推荐一些关键词,大家经常会用到这个搜索引擎,用户在输入关键词的时候会给你推荐一堆相关的关键词,但这些关键词并不一定是你想要的,所以导致导致搜索的关键词不是我本意,不是我真正想的关键词,就会导致预测的不准。所以这是

三个方面的原因可能会导致这个预测的不准。这是我们谷歌流感预测的例子,在这个例子里面谷歌通过搜索的关键词以及流感的发病率之间建立起了联系,建立起了这种关联性带来了流感预测的价值,这对我们很有启发的。所以这个例子,在几年前很受大家所推崇,很多人的关注

相关文章
|
4月前
|
机器学习/深度学习 文字识别 监控
【论文速递】20 年的目标检测:一项调查
【论文速递】20 年的目标检测:一项调查
|
11月前
|
机器学习/深度学习 人工智能 算法
OpenAI、谷歌双标玩得溜:训练大模型用他人数据,却决不允许自身数据外流
OpenAI、谷歌双标玩得溜:训练大模型用他人数据,却决不允许自身数据外流
|
11月前
|
人工智能
警惕AI换脸技术:近期诈骗事件揭示的惊人真相
警惕AI换脸技术:近期诈骗事件揭示的惊人真相
178 0
|
12月前
|
机器学习/深度学习 人工智能 自然语言处理
参数少量提升,性能指数爆发!谷歌:大语言模型暗藏「神秘技能」
参数少量提升,性能指数爆发!谷歌:大语言模型暗藏「神秘技能」
|
12月前
|
机器学习/深度学习 存储 算法
顶会最强的前20%!电影情感效应预测论文拿下ACMMM Oral收录!
顶会最强的前20%!电影情感效应预测论文拿下ACMMM Oral收录!
135 0
|
机器学习/深度学习 移动开发 Windows
机器学习奥林匹克-身体健康与幸福之心脏病预测
机器学习奥林匹克-身体健康与幸福之心脏病预测
253 0
机器学习奥林匹克-身体健康与幸福之心脏病预测
|
机器学习/深度学习 数据可视化 安全
机器学习实战:意大利Covid-19病毒感染数学模型及预测
机器学习实战:意大利Covid-19病毒感染数学模型及预测
186 0
机器学习实战:意大利Covid-19病毒感染数学模型及预测
|
机器学习/深度学习 人工智能 算法
中国研究者开发AI系统,平均3秒内识别新冠肺炎和普通感冒
秋冬季节也是其他呼吸道疾病的高发期,这让新冠肺炎的鉴别、诊断和治疗变得更加困难。近期,《自然》子刊《自然通讯》发布的论文显示,中国研究员已开发一种基于深度学习的人工智能系统,可用来快速地区分新冠肺炎和其他呼吸道疾病。
4319 0
中国研究者开发AI系统,平均3秒内识别新冠肺炎和普通感冒
|
机器学习/深度学习 人工智能 安全
新冠病毒或致个人年内死亡率翻倍!哥大校友用机器学习飞速筛选抗体
新冠肺炎全球确诊超34万、死亡超1.4万。日前,Yann LeCun转发推文:感染COVID-19会使你在一年内的死亡几率翻倍。危急时刻,世卫组织对四种最有希望的新冠病毒治疗方法展开全球大规模试验,哥大数据科学研究所校友使用机器学习快速发现新冠病毒治疗方法。
新冠病毒或致个人年内死亡率翻倍!哥大校友用机器学习飞速筛选抗体

热门文章

最新文章