封神个人页面-阿里云开发者社区

个人头像照片

个人介绍

封神 09年加入阿里巴巴,阿里云高级技术专家、架构师;专注在大数据、分布式数据库领域,10年分布式研发经验;参与研发万台大数据Hadoop离线计算平台;负责研发多款阿里云一级大数据及数据库产品,如云Cassandra

擅长的技术

  • Java
  • 前端开发
  • 数据库
获得更多能力
通用技术能力:

暂时未有相关通用技术能力~

云产品技术能力:

暂时未有相关云产品技术能力~

阿里云技能认证

详细说明
  • 高分内容
  • 最新动态
  • 文章
  • 问答
正在加载, 请稍后...
滑动查看更多

2020年03月

  • 03.22 12:16:13
    回答了问题 2020-03-22 12:16:13

    请问java有必要转大数据吗?

    目前大数据基本是用java的。不过java要必要转大数据吗,看起来就不太懂大数据。 大数据其实分很多领域:有基础组件、有大数据业务系统、也有机器学习等。 就看题目理解的大数据是什么,想做什么。

    踩0 评论0
  • 03.22 12:10:48
    回答了问题 2020-03-22 12:10:48

    能不能使用 Presto 实现 C* 的表关联?

    可以参考使用阿里云的数据湖分析服务:https://www.aliyun.com/product/datalakeanalytics

    踩0 评论0
  • 03.22 12:07:12
    回答了问题 2020-03-22 12:07:12

    RDS如何做大数据分析

    可以参考使用阿里云数据湖分析服务DLA image.png

    具体参考:https://help.aliyun.com/document_detail/129965.html?spm=a2c4g.11186623.6.592.1cf6d4fbVj5JL0

    踩0 评论0
  • 03.22 12:06:12
    回答了问题 2020-03-22 12:06:12

    如何进行探索性数据分析(EDA)?

    可以使用阿里云数据湖分析服务DLA来做探索性的分析。

    踩0 评论0
  • 03.22 12:04:07
    回答了问题 2020-03-22 12:04:07

    重置了 dla 的主用户密码, 用 mysql client 连接不了数据库, 这个怎么处理?

    这个账号没有权限的,文中有一些提示的。

    踩0 评论0
  • 03.22 12:02:23
    回答了问题 2020-03-22 12:02:23

    针对高校大数据解决方案有哪些?

    hadoop 还是过于复杂,可以考虑 阿里云数据湖分析服务DLA。大数据的能力、数据库的体验。

    踩0 评论0
  • 03.22 12:00:23
    回答了问题 2020-03-22 12:00:23

    你眼里的大数据是什么?

    未来的大数据一定的按需付费Serverless化的。当前很多项目的大数据的实施成本过高。

    踩0 评论0
  • 03.22 11:59:42
    回答了问题 2020-03-22 11:59:42

    您有大数据相关经验吗?如果有,请分享一下。

    最近几年业内分享大数据的技术与案例比较多,不过大数据发展还是比较快的。 从10年前的google三篇论文,到最近的 很火的Serverless的数据湖分析服务,发展还是相当快的。

    踩0 评论0
  • 03.22 11:56:10
    回答了问题 2020-03-22 11:56:10

    大数据和python有什么区别

    核心在于科学家及分析师需要一种简单实用的语言,而Python比较合适,或者Python后续的设计就倾向于此。

    踩0 评论0
  • 03.22 11:54:30
    回答了问题 2020-03-22 11:54:30

    Apache spark如何在数据湖中更新海量原始数据?

    hudi的出现确实为了解决类似的问题

    踩0 评论0
  • 03.22 11:53:57
    回答了问题 2020-03-22 11:53:57

    为什么Hadoop可用于大数据分析?

    哲学的回答:因为hadoop设计就是为了解决大数据分析问题,如果不能解决就没有hadoop 实际的原因:hadoop核心分为3个层次:存储hdfs、计算mr&tez、调度yarn 不过最近随着社区及云的发展,慢慢演变为:存储HDFS换成了S3或者OSS,调度Yarn换成了k8s,再计算引擎百花齐放,比如spark、比如各家云产商提供的数据湖分析服务,bigquery,阿里云数据湖分析dla等。

    踩0 评论0
  • 03.22 11:48:02
    回答了问题 2020-03-22 11:48:02

    Flink相比Spark Streaming有什么区别?

    简单讲:flink是实时流,Spark Streaming是用批模拟流。

    踩0 评论0
  • 03.22 11:46:43
    回答了问题 2020-03-22 11:46:43

    Spark 的提交方式?

    还有一种主流的方式,是直接提交到k8s

    踩0 评论0
  • 03.22 11:44:43
    回答了问题 2020-03-22 11:44:43

    如何排查伸缩活动异常?

    一般需要有监控的服务,设定一定的预期,后续检测是否符合预期。

    一般情况下,弹性伸缩都有一定的度,比如min ~ max ,如果不在此区间视为异常。

    踩0 评论0
  • 03.22 11:40:57
    回答了问题 2020-03-22 11:40:57

    如何使用数据湖分析DLA分析JSON的数据?

    可以参考:https://help.aliyun.com/document_detail/109858.html?spm=a2c4g.11186623.6.626.13cf7aaebUvMd1

    踩0 评论0
  • 03.22 11:38:52
    提交了问题 2020-03-22 11:38:52

    如何使用数据湖分析DLA分析JSON的数据?

  • 03.22 11:24:28
    回答了问题 2020-03-22 11:24:28

    serverless云数据库如何调用

    阿里云有一款数据湖分析DLA:https://www.aliyun.com/product/datalakeanalytics 是Serverless的数据湖分析服务 可以了解下

    踩0 评论0
  • 03.22 11:15:59
    回答了问题 2020-03-22 11:15:59

    什么是云计算?什么是大数据?二者有何联系?

    云计算与大数据在网上单独讲的挺多的,可以看看。我讲下我的理解: 从业务层面看:云计算与大数据是两个业务,在公司很小,业务量很小的时候。往往是没有大数据的。在ecs上买几个机器就可以解决问题。当数据量多了以后,慢慢会有云计算的技术。 从技术层面看:云计算往往是IAAS层的,大数据一般是在PAAS层,PAAS层使用IAAS的技术。不过有一些大数据到业务层面,就直接到SAAS层了。

    今天 AI大数据云计算 是非常能代表未来的词汇,所以就用这个这些词汇了。假以时日,可能会出现其他的此。

    踩0 评论0
  • 03.22 11:10:26
    回答了问题 2020-03-22 11:10:26

    弹性伸缩如何事件通知?

    一般是调度程序在添加服务器时,主动推送一个消息到MQ。另外一种是主动轮询,一般效率相对低一点。不过 如果不敏感的业务,其实也是可以解决问题的。

    踩0 评论0
  • 03.22 11:07:54
    回答了问题 2020-03-22 11:07:54

    为什么RDS那么贵?

    RDS是多种规格的,在一般的mysql的基础之上提供了很多好用的功能。 - 保障性能与稳定性肯定是必要的 - 提供HA切换机制,很多是2台起步的 - 支持性能分析 - 提供数据备份的机制 - 支持跟数据湖分析DLA一起联合分析 等等

    踩0 评论0
正在加载, 请稍后...
滑动查看更多
  • 发表了文章 2019-06-21

    欢迎加盟云智能数据库BigData NoSQL团队

  • 发表了文章 2018-11-27

    HBase实战 | HBase在人工智能场景的使用

  • 发表了文章 2018-11-06

    HBase多模式

  • 发表了文章 2018-04-17

    云HBase集群的规划

  • 发表了文章 2018-03-21

    再谈全局网HBase八大应用场景

  • 发表了文章 2017-09-22

    学术界关于HBase在物联网/车联网/互联网/金融/高能物理等八大场景的理论研究

  • 发表了文章 2017-09-01

    ApsaraDB for HBase - 规格的的选择

  • 发表了文章 2017-08-13

    HBase全网最佳学习资料汇总

  • 发表了文章 2017-05-18

    HBase Phoenix助力海量数据实时分析

  • 发表了文章 2017-05-17

    欢迎加入阿里云 HBase+Spark技术交流群

  • 发表了文章 2017-03-13

    云HBase建设之开篇

  • 发表了文章 2017-03-13

    云HBase助力物联网建设

  • 发表了文章 2017-02-23

    云时代的大数据存储-云HBase

  • 发表了文章 2017-01-19

    Hadoop黑客赎金事件解读及防范

  • 发表了文章 2016-12-22

    分布式(hadoop)内核研发面试指南

  • 发表了文章 2016-12-01

    ROLAP与大数据

  • 发表了文章 2016-10-27

    阿里云开源大数据内核团队招聘人才

  • 发表了文章 2016-06-30

    5W1H(六何分析法)全景洞察大数据

  • 发表了文章 2016-06-05

    2016年杭州第四次spark meetup见闻

  • 发表了文章 2016-05-23

    开源大数据技术社区召集令

正在加载, 请稍后...
滑动查看更多
  • 回答了问题 2020-03-22

    请问java有必要转大数据吗?

    目前大数据基本是用java的。不过java要必要转大数据吗,看起来就不太懂大数据。 大数据其实分很多领域:有基础组件、有大数据业务系统、也有机器学习等。 就看题目理解的大数据是什么,想做什么。

    踩0 评论0
  • 回答了问题 2020-03-22

    能不能使用 Presto 实现 C* 的表关联?

    可以参考使用阿里云的数据湖分析服务:https://www.aliyun.com/product/datalakeanalytics

    踩0 评论0
  • 回答了问题 2020-03-22

    RDS如何做大数据分析

    可以参考使用阿里云数据湖分析服务DLA image.png

    具体参考:https://help.aliyun.com/document_detail/129965.html?spm=a2c4g.11186623.6.592.1cf6d4fbVj5JL0

    踩0 评论0
  • 回答了问题 2020-03-22

    如何进行探索性数据分析(EDA)?

    可以使用阿里云数据湖分析服务DLA来做探索性的分析。

    踩0 评论0
  • 回答了问题 2020-03-22

    重置了 dla 的主用户密码, 用 mysql client 连接不了数据库, 这个怎么处理?

    这个账号没有权限的,文中有一些提示的。

    踩0 评论0
  • 回答了问题 2020-03-22

    针对高校大数据解决方案有哪些?

    hadoop 还是过于复杂,可以考虑 阿里云数据湖分析服务DLA。大数据的能力、数据库的体验。

    踩0 评论0
  • 回答了问题 2020-03-22

    你眼里的大数据是什么?

    未来的大数据一定的按需付费Serverless化的。当前很多项目的大数据的实施成本过高。

    踩0 评论0
  • 回答了问题 2020-03-22

    您有大数据相关经验吗?如果有,请分享一下。

    最近几年业内分享大数据的技术与案例比较多,不过大数据发展还是比较快的。 从10年前的google三篇论文,到最近的 很火的Serverless的数据湖分析服务,发展还是相当快的。

    踩0 评论0
  • 回答了问题 2020-03-22

    大数据和python有什么区别

    核心在于科学家及分析师需要一种简单实用的语言,而Python比较合适,或者Python后续的设计就倾向于此。

    踩0 评论0
  • 回答了问题 2020-03-22

    Apache spark如何在数据湖中更新海量原始数据?

    hudi的出现确实为了解决类似的问题

    踩0 评论0
  • 回答了问题 2020-03-22

    为什么Hadoop可用于大数据分析?

    哲学的回答:因为hadoop设计就是为了解决大数据分析问题,如果不能解决就没有hadoop 实际的原因:hadoop核心分为3个层次:存储hdfs、计算mr&tez、调度yarn 不过最近随着社区及云的发展,慢慢演变为:存储HDFS换成了S3或者OSS,调度Yarn换成了k8s,再计算引擎百花齐放,比如spark、比如各家云产商提供的数据湖分析服务,bigquery,阿里云数据湖分析dla等。

    踩0 评论0
  • 回答了问题 2020-03-22

    Flink相比Spark Streaming有什么区别?

    简单讲:flink是实时流,Spark Streaming是用批模拟流。

    踩0 评论0
  • 回答了问题 2020-03-22

    Spark 的提交方式?

    还有一种主流的方式,是直接提交到k8s

    踩0 评论0
  • 回答了问题 2020-03-22

    如何排查伸缩活动异常?

    一般需要有监控的服务,设定一定的预期,后续检测是否符合预期。

    一般情况下,弹性伸缩都有一定的度,比如min ~ max ,如果不在此区间视为异常。

    踩0 评论0
  • 回答了问题 2020-03-22

    如何使用数据湖分析DLA分析JSON的数据?

    可以参考:https://help.aliyun.com/document_detail/109858.html?spm=a2c4g.11186623.6.626.13cf7aaebUvMd1

    踩0 评论0
  • 提交了问题 2020-03-22

    如何使用数据湖分析DLA分析JSON的数据?

  • 回答了问题 2020-03-22

    serverless云数据库如何调用

    阿里云有一款数据湖分析DLA:https://www.aliyun.com/product/datalakeanalytics 是Serverless的数据湖分析服务 可以了解下

    踩0 评论0
  • 回答了问题 2020-03-22

    什么是云计算?什么是大数据?二者有何联系?

    云计算与大数据在网上单独讲的挺多的,可以看看。我讲下我的理解: 从业务层面看:云计算与大数据是两个业务,在公司很小,业务量很小的时候。往往是没有大数据的。在ecs上买几个机器就可以解决问题。当数据量多了以后,慢慢会有云计算的技术。 从技术层面看:云计算往往是IAAS层的,大数据一般是在PAAS层,PAAS层使用IAAS的技术。不过有一些大数据到业务层面,就直接到SAAS层了。

    今天 AI大数据云计算 是非常能代表未来的词汇,所以就用这个这些词汇了。假以时日,可能会出现其他的此。

    踩0 评论0
  • 回答了问题 2020-03-22

    弹性伸缩如何事件通知?

    一般是调度程序在添加服务器时,主动推送一个消息到MQ。另外一种是主动轮询,一般效率相对低一点。不过 如果不敏感的业务,其实也是可以解决问题的。

    踩0 评论0
  • 回答了问题 2020-03-22

    为什么RDS那么贵?

    RDS是多种规格的,在一般的mysql的基础之上提供了很多好用的功能。 - 保障性能与稳定性肯定是必要的 - 提供HA切换机制,很多是2台起步的 - 支持性能分析 - 提供数据备份的机制 - 支持跟数据湖分析DLA一起联合分析 等等

    踩0 评论0
正在加载, 请稍后...
滑动查看更多