用Hue分析马老师的B站视频弹幕----我发现了一个新词

简介: 用Hue分析马老师的B站视频弹幕----我发现了一个新词
CREATE DATABASE IF NOT EXISTS test;
use  test;

创建数据库

create external table MBGAnalyse (dm_time STRING,send_date STRING,send_month STRING,send_time STRING,text STRING,user_id STRING) row format delimited fields terminated by ',';
load data inpath '/user/hive/warehouse/ababaaba/biliMBG.csv' into table MBGAnalyse;

创建表导入关于马老师的B站弹幕数据

SELECT word ,count(1) as count FROM 
(SELECT explode(split(regexp_replace(ma.text,'[^A-Za-z0-9\\u4e00-\\u9fa5]',''),' '))as word  FROM mbganalyse ma) W
GROUP BY word
ORDER BY word desc ;

正则匹配马老师的中文弹幕,

最后对筛选的数据做词频统计

词频第一竟然不是脱口而出的"不讲武德"

而是"鳎目说"

第二,第三的分别是鳎蟆说,鸪鹧

关于鸪鹧是什么,笔者特意搜狗了一下


原来如此,学费了学费了


目录
相关文章
|
应用服务中间件 Shell nginx
mac m1笔记本docker 安装nginx
mac m1笔记本docker 安装nginx
547 4
从文件中读取一行
从文件中读取一行。
74 5
|
小程序
基于微信小程序的电器维修系统设计与实现(源码+lw+部署文档+讲解等)
基于微信小程序的电器维修系统设计与实现(源码+lw+部署文档+讲解等)
319 0
基于微信小程序的电器维修系统设计与实现(源码+lw+部署文档+讲解等)
|
算法 安全 Java
Java Review - 并发编程_ConcurrentLinkedQueue原理&源码剖析
Java Review - 并发编程_ConcurrentLinkedQueue原理&源码剖析
218 0
|
开发框架 JavaScript 前端开发
在Vue前端界面中,几种数据表格的展示处理,以及表格编辑录入处理操作。
在Vue前端界面中,几种数据表格的展示处理,以及表格编辑录入处理操作。
|
存储 Python
Python中的for循环
Python中的for循环
|
SQL 数据采集 存储
Dataphin V3.6版本发布啦!多项能力升级,助力企业提升全链路数据治理能力!
Dataphin V3.6版本全新上线概念建模、基线运维、全域数据质量监控、数据标准标准落标映射等核心功能,为企业建设贯穿事前、事中、事后的全链路数据治理能力添砖加瓦,助力提升资产价值。
38168 1
Dataphin V3.6版本发布啦!多项能力升级,助力企业提升全链路数据治理能力!
|
存储 NoSQL Ubuntu
MongoDB的「Linux」安装及基本使用
MongoDB的「Linux」安装及基本使用
1356 0
MongoDB的「Linux」安装及基本使用
|
分布式计算 资源调度 算法
5万字长文!搞定Spark方方面面(一)
5万字长文!搞定Spark方方面面
631 0
5万字长文!搞定Spark方方面面(一)
|
缓存 JavaScript 前端开发
客户端渲染
什么是客户端渲染页面呢?
114 2