大数据时代 在搜索引擎上看中国人的科普需求搜索行为

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

2015年7月21日,中国科协科普部、中国科普研究所、百度数据研究中心联合在京发布《中国网民科普需求搜索行为报告》(2015年第一季度),对当前中国网民的科普搜索行为特点、科普主题搜索份额、科普搜索人群的年龄、地域、性别等结构特征等进行分析。大数据时代在搜索引擎上看中国人的科普需求,希望我们的呈现和解读能为读者带来思考的全新角度。

中共中央、国务院《关于深化科技体制改革加快国家创新体系建设的意见》明确提出,到2015年我国公民基本科学素质比例要达到5%

本报告以使用百度搜索的中国网民为研究对象。研究内容包括当前中国网民的科普搜索行为特点、科普主题搜索份额、科普搜索人群的年龄、地域、性别等结构特征,并对不同终端上的搜索行为进行分析,以期了解中国网民的科普需求状况。

本报告根据2011—2015年的科普热点研究提出8—10个科普主题,根据科普主题及种子词,百度通过数据分析对种子词进行衍生,然后产生衍生词库,由各领域专家对衍生词进行归并,根据一定科学原则进行取舍,进行数据的统计和筛选。

第一期确定的8个科普主题分别是:健康与医疗、食品安全、航空航天、信息科技、前沿技术、气候与环境、能源利用和应急避险。

四年来,中国网民科普搜索需求增长178%,增长主要发生在移动端

科普搜索指数日均值由2011年第一季度的2517175增长到2015年第一季度的6992853,同比增长178%。其中PC端搜索指数基本持平,4年多的增长主要发生在移动端。移动端科普搜索指数日均值从637394增长到4640849,增长了6倍多,在2013年9月首次超过PC端单日科普搜索指数。

2015年第一季度PC和移动端的科普搜索占比

北上广及其他信息科技发达城市成为互联网科普用户的集中地

科普搜索指数排名前十城市依次为:北京、广州、上海、杭州、郑州、成都、苏州、深圳、武汉和西安。

从区域看,科普搜索指数华东地区明显领先,后面依次是华北、华南、华中、西南、东北和西北。

中国网民科普搜索指数城市排名

地震频发掀起了应急避险的新一轮搜索热潮;在前沿技术领域,先进制造和智能技术的普及带来了两倍的同比增长

应急避险主题2015年第一季度的同比增幅达到198%,相较于2014年第一季度同比有显著增长;2015年1月14日四川乐山市地震、1月18日河南濮阳市地震、2月2日阿根廷地震、2月7日四川宜宾地震、2月17日日本地震,3月15日安徽阜阳市地震等事件激发了搜索指数的大幅增长。

前沿技术主题2015年第一季度的同比增幅为38%,相较于2014年同比增长速度增加了2倍。机器人、3D打印、纳米技术及智能技术的迅速发展和推广应用引发中国网民的广泛关注。

“地震”是本季度排名第一的科普热词

地震在种子词搜索中位居榜首。原因是第一季度河南濮阳、安徽阜阳以及日本东海岸海域等多地发生了地震,引起中国网民高度关注。地震及相关预防、避险、救援等科普搜索在全国范围内都有明显提高。按区域划分,西南地区对“地震”的搜索份额高达38.19%,作为对比,该地区对应急避险主题的搜索份额为13.13%,对全部8个主题的搜索份额为9.71%。

第一季度通常是雾霾高发期,对于不同的主题,一级城市对气候的关注比较突出,在一级城市中北京、上海、杭州、成都等地都非常关注雾霾。

  中国网民科普搜索热词TOP10

健康与医疗成为最受关注的科普主题,互联网成为常见疾病的问询平台

健康与医疗在8个主题的搜索中占比为57.01%,最受关注;信息科技占比为12.20%,位居第二;应急避险占比为11.47%,位居第三。

在健康与医疗主题中,咳嗽、感冒等常见病是第一季度关注热点,尤其以上海、安徽等长江以南、无供暖的区域较明显。

健康与医疗科普主题热搜词TOP10

短期科普需求集中于应急避险,中长期需求集中在健康与医疗和航空航天领域

根据33个省份、自治区及直辖市、香港特别行政区(澳门特别行政区无数据)搜索指数的同比和环比、新闻与突发事件的综合分析,在此列出各个省份科普需求的短期、中期和长期科普主题推荐,为各个省份科普工作提供指导。建议短期为1个季度,中期为1年,长期为2至3年。

应急避险科普需求增长很快;健康与医疗是中国网民长期关注的焦点,相关需求持续走高;但不同省份在航空航天、气候与环境、信息科技和前沿技术都有科普需求的增长,食品安全的科普需求增长放缓,甚至出现负增长。

各地区科普需求主题的推荐

以移动端为代表的即时型搜索以应急避险和健康与医疗主题为主;以PC端为代表的学习型搜索以前沿技术和气候与环境主题为主

从PC端和移动端对8个主题的搜索指数看,移动端是PC端的2倍。其中,应急避险和健康与医疗的移动端搜索份额超过70%,说明该领域的科普搜索主要来源于移动端,这种应急与健康等常识性科普需求的特点为内容碎片化和即时型获得,建议这两个领域的科普内容以移动端的形式推送。

PC端搜索份额排名前两位的科普主题分别是前沿技术和气候与环境,二者份额均超过了50%,说明该领域的科普需求是深度学习的需求,内容专业性比较强,建议以PC端推送为主。

各年龄段关注的科普主题同中有异

健康与医疗是各年龄段最关注主题,信息科技在20岁以上年龄段人群中排名第二,应急避险在30岁以上年龄段中排名第三。29岁以下年轻人呈现出对航空航天主题的偏好,尤其是19岁以下青少年对航空航天的关注排名第二。

对于每个主题,30—39和20—29岁人群占据了大部分的搜索份额。

2015年第一季度中国网民各年龄段的科普主题搜索排名

■术语释义

搜索指数:以搜索次数为基础,经过加权处理,反映特定内容在百度上被搜索的热度。

用户占比:科普搜索用户中性别、各年龄段、PC和移动终端所占的比例。


本文作者:佚名

来源:51CTO

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
6月前
|
SQL JSON 大数据
ElasticSearch的简单介绍与使用【进阶检索】 实时搜索 | 分布式搜索 | 全文搜索 | 大数据处理 | 搜索过滤 | 搜索排序
这篇文章是Elasticsearch的进阶使用指南,涵盖了Search API的两种检索方式、Query DSL的基本语法和多种查询示例,包括全文检索、短语匹配、多字段匹配、复合查询、结果过滤、聚合操作以及Mapping的概念和操作,还讨论了Elasticsearch 7.x和8.x版本中type概念的变更和数据迁移的方法。
ElasticSearch的简单介绍与使用【进阶检索】 实时搜索 | 分布式搜索 | 全文搜索 | 大数据处理 | 搜索过滤 | 搜索排序
|
消息中间件 分布式计算 大数据
大数据Spark实时搜索日志实时分析
大数据Spark实时搜索日志实时分析
197 1
|
6月前
|
消息中间件 数据采集 JSON
大数据 - DWD&DIM 行为数据
大数据 - DWD&DIM 行为数据
83 1
|
8月前
|
数据采集 搜索推荐 大数据
基于大数据的市场分析与消费者行为研究
【6月更文挑战第5天】大数据在市场分析与消费者行为研究中扮演关键角色。通过海量数据分析,企业能更全面、精准地了解消费者偏好和市场趋势。Python等工具帮助处理数据,揭示购买习惯,支持个性化营销策略。同时,大数据使深入理解消费者心理、决策过程成为可能,助力企业优化产品,提升客户满意度和忠诚度。在这个数据驱动的时代,大数据是洞悉市场和消费者的魔法力量。
267 2
|
7月前
|
运维 监控 Java
在大数据场景下,Elasticsearch作为分布式搜索与分析引擎,因其扩展性和易用性成为全文检索首选。
【7月更文挑战第1天】在大数据场景下,Elasticsearch作为分布式搜索与分析引擎,因其扩展性和易用性成为全文检索首选。本文讲解如何在Java中集成Elasticsearch,包括安装配置、使用RestHighLevelClient连接、创建索引和文档操作,以及全文检索查询。此外,还涉及高级查询、性能优化和故障排查,帮助开发者高效处理非结构化数据。
97 0
|
前端开发 JavaScript 大数据
24jqGrid -搜索大数据
24jqGrid -搜索大数据
50 0
|
9月前
|
SQL 分布式计算 MaxCompute
在MaxCompute中,如果你想让Spark的行为更接近Hive
在MaxCompute中,如果你想让Spark的行为更接近Hive
55 1
|
大数据
阿里云产品体系分为6大分类——大数据——大数据的5种模块——大数据搜索与分析
阿里云产品体系分为6大分类——大数据——大数据的5种模块——大数据搜索与分析自制脑图
411 1
|
存储 数据采集 XML
大数据数据采集的数据来源的日志数据之搜索类数据
在大数据领域,数据采集是一个非常重要的环节。日志数据已经成为了大数据应用中不可或缺的一部分,尤其是搜索类数据。本文将介绍搜索类日志数据作为数据来源的特点以及其采集流程。
202 0
|
前端开发 JavaScript 搜索推荐
select2,利用ajax高效查询大数据列表 1(可搜索、可分页)
select2,利用ajax高效查询大数据列表(可搜索、可分页)
516 0
select2,利用ajax高效查询大数据列表 1(可搜索、可分页)