大数据时代 在搜索引擎上看中国人的科普需求搜索行为

简介:

2015年7月21日,中国科协科普部、中国科普研究所、百度数据研究中心联合在京发布《中国网民科普需求搜索行为报告》(2015年第一季度),对当前中国网民的科普搜索行为特点、科普主题搜索份额、科普搜索人群的年龄、地域、性别等结构特征等进行分析。大数据时代在搜索引擎上看中国人的科普需求,希望我们的呈现和解读能为读者带来思考的全新角度。

中共中央、国务院《关于深化科技体制改革加快国家创新体系建设的意见》明确提出,到2015年我国公民基本科学素质比例要达到5%

本报告以使用百度搜索的中国网民为研究对象。研究内容包括当前中国网民的科普搜索行为特点、科普主题搜索份额、科普搜索人群的年龄、地域、性别等结构特征,并对不同终端上的搜索行为进行分析,以期了解中国网民的科普需求状况。

本报告根据2011—2015年的科普热点研究提出8—10个科普主题,根据科普主题及种子词,百度通过数据分析对种子词进行衍生,然后产生衍生词库,由各领域专家对衍生词进行归并,根据一定科学原则进行取舍,进行数据的统计和筛选。

第一期确定的8个科普主题分别是:健康与医疗、食品安全、航空航天、信息科技、前沿技术、气候与环境、能源利用和应急避险。

四年来,中国网民科普搜索需求增长178%,增长主要发生在移动端

科普搜索指数日均值由2011年第一季度的2517175增长到2015年第一季度的6992853,同比增长178%。其中PC端搜索指数基本持平,4年多的增长主要发生在移动端。移动端科普搜索指数日均值从637394增长到4640849,增长了6倍多,在2013年9月首次超过PC端单日科普搜索指数。

2015年第一季度PC和移动端的科普搜索占比

北上广及其他信息科技发达城市成为互联网科普用户的集中地

科普搜索指数排名前十城市依次为:北京、广州、上海、杭州、郑州、成都、苏州、深圳、武汉和西安。

从区域看,科普搜索指数华东地区明显领先,后面依次是华北、华南、华中、西南、东北和西北。

中国网民科普搜索指数城市排名

地震频发掀起了应急避险的新一轮搜索热潮;在前沿技术领域,先进制造和智能技术的普及带来了两倍的同比增长

应急避险主题2015年第一季度的同比增幅达到198%,相较于2014年第一季度同比有显著增长;2015年1月14日四川乐山市地震、1月18日河南濮阳市地震、2月2日阿根廷地震、2月7日四川宜宾地震、2月17日日本地震,3月15日安徽阜阳市地震等事件激发了搜索指数的大幅增长。

前沿技术主题2015年第一季度的同比增幅为38%,相较于2014年同比增长速度增加了2倍。机器人、3D打印、纳米技术及智能技术的迅速发展和推广应用引发中国网民的广泛关注。

“地震”是本季度排名第一的科普热词

地震在种子词搜索中位居榜首。原因是第一季度河南濮阳、安徽阜阳以及日本东海岸海域等多地发生了地震,引起中国网民高度关注。地震及相关预防、避险、救援等科普搜索在全国范围内都有明显提高。按区域划分,西南地区对“地震”的搜索份额高达38.19%,作为对比,该地区对应急避险主题的搜索份额为13.13%,对全部8个主题的搜索份额为9.71%。

第一季度通常是雾霾高发期,对于不同的主题,一级城市对气候的关注比较突出,在一级城市中北京、上海、杭州、成都等地都非常关注雾霾。

  中国网民科普搜索热词TOP10

健康与医疗成为最受关注的科普主题,互联网成为常见疾病的问询平台

健康与医疗在8个主题的搜索中占比为57.01%,最受关注;信息科技占比为12.20%,位居第二;应急避险占比为11.47%,位居第三。

在健康与医疗主题中,咳嗽、感冒等常见病是第一季度关注热点,尤其以上海、安徽等长江以南、无供暖的区域较明显。

健康与医疗科普主题热搜词TOP10

短期科普需求集中于应急避险,中长期需求集中在健康与医疗和航空航天领域

根据33个省份、自治区及直辖市、香港特别行政区(澳门特别行政区无数据)搜索指数的同比和环比、新闻与突发事件的综合分析,在此列出各个省份科普需求的短期、中期和长期科普主题推荐,为各个省份科普工作提供指导。建议短期为1个季度,中期为1年,长期为2至3年。

应急避险科普需求增长很快;健康与医疗是中国网民长期关注的焦点,相关需求持续走高;但不同省份在航空航天、气候与环境、信息科技和前沿技术都有科普需求的增长,食品安全的科普需求增长放缓,甚至出现负增长。

各地区科普需求主题的推荐

以移动端为代表的即时型搜索以应急避险和健康与医疗主题为主;以PC端为代表的学习型搜索以前沿技术和气候与环境主题为主

从PC端和移动端对8个主题的搜索指数看,移动端是PC端的2倍。其中,应急避险和健康与医疗的移动端搜索份额超过70%,说明该领域的科普搜索主要来源于移动端,这种应急与健康等常识性科普需求的特点为内容碎片化和即时型获得,建议这两个领域的科普内容以移动端的形式推送。

PC端搜索份额排名前两位的科普主题分别是前沿技术和气候与环境,二者份额均超过了50%,说明该领域的科普需求是深度学习的需求,内容专业性比较强,建议以PC端推送为主。

各年龄段关注的科普主题同中有异

健康与医疗是各年龄段最关注主题,信息科技在20岁以上年龄段人群中排名第二,应急避险在30岁以上年龄段中排名第三。29岁以下年轻人呈现出对航空航天主题的偏好,尤其是19岁以下青少年对航空航天的关注排名第二。

对于每个主题,30—39和20—29岁人群占据了大部分的搜索份额。

2015年第一季度中国网民各年龄段的科普主题搜索排名

■术语释义

搜索指数:以搜索次数为基础,经过加权处理,反映特定内容在百度上被搜索的热度。

用户占比:科普搜索用户中性别、各年龄段、PC和移动终端所占的比例。


本文作者:佚名

来源:51CTO

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
4月前
|
SQL 分布式计算 MaxCompute
在MaxCompute中,如果你想让Spark的行为更接近Hive
在MaxCompute中,如果你想让Spark的行为更接近Hive
23 1
|
存储 机器学习/深度学习 Java
入门科普:Python、R、大数据、云计算最全学习资源都在这里
本文写给有抱负的新兴数据科学家、知道各种专业知识的程序员,还有那些不懂任何编程技巧的初学者。本文提供了简单的教程和可实践的分析,而不是理论。我还试图将Python与R结合起来,为学习者提供对比的方法。
|
存储 分布式计算 安全
大数据处理也要安全--关于MaxCompute的安全科普
企业从未像今天这样可以轻易地存储和使用大数据。然而,当您在使用大数据产品时,是否考虑过其中的安全问题呢?庆幸的是,阿里云产品专家和安全专家早就想你所想急你所急,先行一步将安全特性带入了大数据计算产品 MaxCompute。该产品在面世之初就具备强大的安全特性,让企业可以放心地在云上使用。
2596 0
|
新零售 算法 搜索推荐
【独家科普】揭秘大数据的分析方法
    编注:“大数据文摘”的很多读者亲友,一些纯粹的大数据爱好者,甚至有一部分企业管理者经常在后台向我们建议,希望我们能把大数据的分析系统做一个简单的介绍,不要“只见案例,不见原理”。于是Larry就自告奋勇来为大家做一个科普,带领读者亲友们一探究竟,让我们来揭开大数据推荐系统神秘的面纱!     说到大数据,神马根据数据进行精准营销啊,神马更了解你的客户啊,神马啤酒尿布超市推送商品预测怀孕亚马逊预测式发货等等,你谷歌百度搜狗有道一气,都是说推荐系统如何如何牛逼的,但是没人介绍推荐系统到底是啥样的。
1325 0
|
大数据
重磅推出:大数据科普3集连放
       《头脑风暴》重磅推出大数据系列节目,邀请“大数据时代的预言家” 维克托.迈尔-舍恩伯格对话顶尖学者、全球知名IT企业、创业公司。        【第1期】大数据时代来了        【第2期】商业巨头如何玩转大数据        【第3期】创业者如何掘金大数据    
1014 0
|
2月前
|
分布式计算 DataWorks IDE
MaxCompute数据问题之忽略脏数据如何解决
MaxCompute数据包含存储在MaxCompute服务中的表、分区以及其他数据结构;本合集将提供MaxCompute数据的管理和优化指南,以及数据操作中的常见问题和解决策略。
47 0

热门文章

最新文章