一名大数据专业学生
matplotlib.pyplot contourf()函数的使用
SparkStreaming(SparkStreaming概述、入门、Kafka数据源、DStream转换、输出、关闭)(一)
数仓学习---数仓开发之DWS层
RoaringBitmap的原理与应用
Spark学习---SparkSQL(概述、编程、数据的加载和保存、自定义UDFA、项目实战)
Spark学习---day07、Spark内核(源码提交流程、任务执行)
Spark学习---day06、Spark内核(源码提交流程、任务执行)
Spark学习--day05、SparkCore电商网站实操、SparkCore-工程代码
金融审批数仓(离线)--DWD层、ADS层
pandas读取某列、某行数据——loc、iloc用法总结
python进行数据处理——pandas的drop函数
数仓学习---数仓开发之DWD
pyspark--完美解决 Could not find a version that satisfies the requirement 安装包名字 (from versions: )
数仓学习---数仓开发之ADS层
Hive中日期处理函数的使用(date_format、date_add、date_sub、next_day)
大数据离线数仓---金融审批数仓
Spark学习---day02、Spark核心编程 RDD概述、RDD编程(创建、分区规则、转换算子、Action算子))(一)
Spark学习--day04、RDD依赖关系、RDD持久化、RDD分区器、RDD文件读取与保存
Spark学习---day02、Spark核心编程 RDD概述、RDD编程(创建、分区规则、转换算子、Action算子))(一)
离线数仓--大数据技术之DolphinScheduler
Spark学习--1、Spark入门(Spark概述、Spark部署、Local模式、Standalone模式、Yarn模式)(一)
Scala学习--day04--集合、常用方法、案例实操 - WordCount TopN、不同省份的商品点击排行
Scala学习--day03--函数式编程
计算机网络 经典面试题
设计模式--- 桥接模式、JDBC 源码剖析(桥接)
JAVA--内部类和静态内部类、单例模式---静态内部类剖析
Scala学习--day02---控制流、“九层妖塔—杨辉三角”
Spark实时(数据采集)项目
ResourceBundle.getBundle()来读取自定义的properties配置文件
Spark实时(数据采集)项目小知识点--sed -i命令详解及入门攻略
数仓学习---数仓开发之DIM层 维度建模、维度表介绍、
Git学习---Git快速入门、Git基础使用、Git进阶使用、Git服务器使用(IDEA集成GitHub、Gitee、GitLab)、GitHub Desktop客户端
数仓学习-----named_struct和collect_set函数
数仓模型建设
java使用apache-commons-lang3生成随机字符串(可自定义规则、RandomUtils
数据仓库设计
hive窗口函数应用实例
HQL的中级题目---炸裂函数、窗口函数
SQL 的 with as 临时中间表
Kafka学习---消费者(分区消费、分区平衡策略、offset、漏消费和重复消费)
Hive中的DECIMAL类型
SQL基础题----基本的SELECT语句 ambiguous 模糊
HIVE启动错误:org.apache.hadoop.ipc.RemoteException(org.apache.hadoop.hdfs.server.namenode.SafeModeExcept
数仓学习---数仓开发之ODS层
离线数仓6.0--- 数据仓库 ER模型-范式理论,维度模型、维度建模理论之事实表、维度建模理论之维度表
大数据学习
大数据学习 Shell基础学习---1、Shell概述、脚本入门、变量
数仓学习---7、数据仓库设计、数据仓库环境准备
Flink--day022、Flink部署(Yarn集群搭建下的会话模式部署、单作业模式部署、应用模式部署)
spark 与 scala 的对应版本查看、.在idea中maven版本不要选择17,弄了好久,换成11就可以啦