暂时未有相关云产品技术能力~
暂无个人介绍
深入理解SPARK SQL 中HashAggregateExec和ObjectHashAggregateExec以及UnsafeRow
SPARK Expand问题的解决(由count distinct、group sets、cube、rollup引起的)
SPARK统计信息的来源-通过优化规则来分析
SPARK SQL中 CTE(with表达式)会影响性能么?
spark shuffle(ExchangeExec)过多导致任务运行过慢甚至超时
spark task过多导致任务运行过慢甚至超时
Spark中的WholeStageCodegenExec(全代码生成)
Spark DPP(动态分区裁剪)导致的DataSourceScanExec NullPointerException问题分析以及解决
spark hiveUDF 不要定义static成员变量
spark在生产中是否要禁止掉BHJ(BroadcastHashJoin)
spark hiveUDF transient的重要性
Spark expression Codegen 之code代码块
Spark AQE中的CoalesceShufflePartitions和OptimizeLocalShuffleReader
spark CTAS union all (union all的个数很多)导致超过spark.driver.maxResultSize配置(1G)
spark outer join push down filter rule(spark 外连接中的下推规则)
spark hive类总是优先记载应用里面的jar包,跟spark.{driver/executor}.userClassPathFirst无关
spark on k8s的动态资源分配和external shuffle Service以及任务的队列资源管理
关于page Cache和memory mappped Files 和zero copy
基于 k8s 调度遇到的问题
spark on k8s 镜像构建
spark 3.x Plugin Framework
spark 对于hive metastore的兼容性随笔--通过classloader实现
Spark SQL中掌控sql语句的执行 - 了解你的查询计划
spark 3.1.x支持(兼容)hive 1.2.x以及hadoop cdh版本的尝试
yarn和k8s(kubernetes)混合部署初步方案(利用cgroup资源限制)
【spark系列12】spark remote shuffle service(RSS)杂谈
【spark系列11】spark 的动态分区裁剪下(Dynamic partition pruning)-物理计划
【spark系列10】spark logicalPlan Statistics (逻辑计划阶段的统计信息)
【spark系列9】spark 的动态分区裁剪上(Dynamic partition pruning)-逻辑计划
【spark系列8】spark delta读数据实现分析
【spark系列7】spark delta写操作ACID事务实现分析
【spark系列6】spark delta写操作ACID事务前传--写文件基础类FileFormat/FileCommitProtocol分析
spark needsUnsafeRowConversion java.util.NoSuchElementException: None.get
【spark系列5】spark 3.0.1集成delta 0.7.0原理解析--delta如何进行DDL DML操作以及Catalog plugin API
【spark系列4】spark 3.0.1集成delta 0.7.0原理解析--delta自定义sql
【mlflow 系列8】向 mlflow 提交pr(pull request)
【mlflow系列7】flask VS Gunicorn
scala中的self =>
【openJDK系列3】java OOM 分析(mat工具的使用)
【go系列5】golang中的通道
【go系列4】golang 函数命名返回值
【go系列3】go 的包管理工具go modules的使用
【spark系列3】spark 3.0.1 AQE(Adaptive Query Exection)分析(二)
【spark系列3】spark 3.0.1 AQE(Adaptive Query Exection)分析(一)
go系列2】 关于go中与java C++中应该注意的语法糖以及不同点
【openJDK系列1】macos编译openJDK 8
【k8s系列5】KubernetesClientException: too old resource version 原因分析
【mflow系列6】mlflow model registry
【go系列1】go的安装(mac)
【mlflow系列5】一站式开源测试平台MeterSphere