团队承担了阿里巴巴集团内的数据中台建设任务,现将多年实战积累下的经验通过云上环境对外输出至更多的政企业。
2017年,出版的《大数据之路:阿里巴巴大数据实践》,书中总结了阿里巴巴数据中台多年的技术经验,为广大数据领域从业者提供了重要的实践指导。
2018年,我们又推出了智能数据构建与管理平台Dataphin —— 从数据接入到数据消费全链路,提供一站式的大数据能力,助力企业打造标准统一、融会贯通、资产化、服务化、闭环自优化的智能数据体系。
云上数据中台,未来无限可能,我们需要以下岗位:
实时大数据研发工程师
• 职位描述:基于flink开源大数据计算平台,在阿里集团整体业务场景下
- 研发实时流计算数据研发平台,支持包括核心电商、云计算、大文娱、创新业务在内的等各个综合业务板块务
- 研发实时OLAP(ElasticSearch,Druid)赋能业务
- 研发实时智能化(算法加工程)赋能业务
• 职位要求:
- 具备扎实的计算机理论基础, 对数据结构及算法有较强的功底
- 精通Java语言编程,具备优秀的系统Debug/Profiling能力和经验
- 熟悉常见的面向对象设计模式,具备优秀的系统架构设计能力
- 熟悉Hadoop/HBase/Flink/Spark Streaming等开源大数据技术,在开源社区活跃者优先
- 熟悉ElasticSearch/Druid 等OLAP开源技术优先
- 具备实际的大数据业务开发经验以及良好的项目沟通和协调能力
- 具备实时流计算数据开发经验、全栈开发经验优先
数据研发工程师
• 职位描述:
- 负责大规模分布式系统、数据库系统以及复杂业务系统的元数据采集、建模及服务,建立统一、规范、智能的元数据服务中心,如计算、存储、质量、安全、成本、模型等多维度元数据的建设、管理及应用
- 负责超大规模计算平台的数据治理、性能优化及资源调控,构建数据资产的健康度分析及评估模型,打造数据治理的闭环体系,实现数据治理的智能化,以及资源利用的最大化
- 负责EB级数据资产的分析及评估,构建数据知识图谱,实现数据资产的自动化打标及分类,智能化识别数据内容并对数据进行画像,基于业务视角盘点数据资产、评估业务价值、挖掘应用场景
- 负责对数据采集、数据处理、数据消费的各个环节进行全链路的追踪与溯源,实现对数据资产应用的全景分析及ROI评估、全链路智能监控及保障、全链路数据安全风险评估与合规治理等
- 负责数据资产及元数据管理相关领域的标准规范制定以及解决方案设计,同时孵化产品打造平台,赋能阿里生态及外部客户
• 职位要求:
- 熟悉数据仓库的完整流程,具备三年及以上大型数据仓库架构、建模、开发及运维经验者优先
- 熟悉Hadoop/HBase/Storm/Spark等分布式计算技术,具备丰富的海量数据处理、运维及调优经验
- 熟悉机器学习及算法相关知识经验,有自然语义分析、知识图谱、图计算等相关项目开发经验者优先
- 具备多种分布式计算及存储平台、数据库系统的元数据的构建及管理经验者优先
- 具有JAVA或者Python语言的开发能力,具备一定的系统架构及设计能力
- 良好的语言沟通与表达能力和自我驱动力,有海外学习或工作经验、英语听说流利者优先
Java研发工程师
• 职位描述:
- 负责智能数仓引擎架构设计和研发,帮助企业搭建大数据研发平台以及研发大数据相关产品。包括:企业数仓基础建设、实时和离线大数据研发平台、分布式任务调度和监控、交互式查询引擎、在线查询服务引擎(日均40亿调用)、算法研发平台等。
• 职位要求:
- 5-15年工作经验,软件工程理论基础扎实,熟悉分布式服务理论基础。有软件分层概念,熟悉设计模式及原则。
- java基础扎实,熟悉jvm内存管理、GC算法,熟悉JVM参数调优,熟悉java集合类、多线程;熟练使用guava和apache commons lang。熟悉并发编程。有良好的编程习惯。
- 精通java web开发。掌握spring(springboot、spring mvc)、mybatis应用及其原理。
- 精通SOA架构、微服务架构、springcloud及其原理。
- 熟悉linux和shell编程。
• 有以下经验者优先:
- 有大型分布式、高并发、高负载、高可用性系统设计和稳定性经验;
- 熟悉OLAP,数据数据建模,有海量数据即席查询系统设计和研发经验;
- 熟悉BI套件设计和研发。
- 对hadoop生态比较熟悉或者有数据挖掘算法经验或者有上云经验更佳。
- 在hadoop数仓建设某一领域专长的优先
以上职位,投递简历时请注明职位名称,有意向者简历请投递至云栖社区官方邮箱:yqgroup@service.aliyun.com ,收到简历后我们会及时回复您。
阿里巴巴招聘专家:江岚