【14点正式开始】技术与架构,解析如何将大数据最快落地到实践

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 6位阿里技术大咖与4位行业资深实践者将从技术与业务两个方面,与大家探讨大数据如何最快落地到实践。
3月9日14点,业内首个结合技术与应用的 在线大数据技术峰会即将展开,届时6位阿里技术大咖与4位行业资深实践者将从技术与业务两个方面,与大家 探讨大数据如何最快落地到实践。较为有看点的是:

最深入的实践:本次在线峰会上,6个阿里规模的大数据实践将被深入分享,包括大数据平台的性能调优、流式增量计算、持续发布与演进、机器学习平台打造等。同时,在技术分享之外,你还可以与嘉宾进行问答互动,免费的学习机会就在这里!

最真实的应用:技术的价值在于赋能业务,然而真正结合起来并不简单,本次峰会上,地产、医疗、电商、社区等实际场景大数据应用案例将被放出,这里有帮助你打开大数据赋能的钥匙。

5b3898074e560eb383cb6b1ab7cdd78ba698e935

技术实践篇

伟林 阿里云资深专家

22b7eec4c026d5b252c8d23c37997f7bf12f0d5f

嘉宾简介:阿里巴巴大数据事业部资深架构师,原微软Cosmos/Scope核心开发人员, 现负责阿里巴巴大数据计算平台总体架构,该平台是阿里巴巴核心计算分析平台,承担阿里内部绝大数计算任务。林伟作为一名分布式系统研究员,在国外一流会议OSDI, SIGMOD, NSDI, VLDB发表多篇论文。是大数据存储,分布式计算,数据查询优化,分布式调度等领域的专家。具有10多年研究和开发经历,分别打造微软和阿里内部大型数万台级别数据中心的计算平台。

演讲议题:MaxCompute 2.0 性能优化揭秘
直播时间:3月9日 14:00-14:40
议题简介:分布式系统性能优化核心,以及基于代价的大数据平台优化器打造。

振禹 阿里云高级专家

7635a6b7cd6dc661b8dfc53078ef972e8f04a9c1

嘉宾简介:20年业界经验,在数据与分布式系统的应用与开发方面有丰富的经验。目前负责MaxCompute SQL大数据语言的设计与开发,致力于提高MaxCompute的用户体验。

演讲议题:MaxCompute——大数据语言的新发展
直播时间:3月9日 14:40-15:20

议题简介:MaxCompute是全新一代的ODPS,基于完全自主研发的ODPS2.0 SQL引擎。MaxCompute SQL大数据语言在易用性,兼容性,性能与可扩展性方面取得长足进步。此演讲将向您逐一介绍这些新功能。

听众预计受益:对于MaxCompute的现有用户,能够知道基于ODPS2.0的SQL引擎给大家带来的易用性改进与新功能,提高开发效率,降低维护成本,提高性能。对于潜在用户,能够知道基于ODPS2.0的SQL引擎在兼容性方面的改进,知道如何利用这些特性方便迁移使用MaxCompute,并知道使用MaxCompute在易用性与可扩展性方面的优势。

布民 阿里云高级专家

0a3187d15d15a3cdbd4d6ec5d5b0de58a217d33e

嘉宾简介:2015年加入阿里巴巴,现为阿里云高级专家、技术委员会成员,及大规模流计算与图计算平台负责人。布民之前在微软亚洲研究院任主管研究员,主要研究兴趣为大规模分布式计算。至今已在相关领域顶级会议(如OSDI,NSDI,EuroSys等)发表多篇论文,曾获得EuroSys 2012的最佳论文奖(亚洲首篇)。多项研究成果已被转化为产品并应用于实际生产。

演讲议题:大规模流式增量计算及其在阿里巴巴的应用
直播时间:3月9日 15:20-16:00

议题简介:实时化是大数据应用及分布式系统设计的重要发展趋势,其中流式数据处理又是核心场景之一。本演讲首先介绍一系列典型场景以及它们带来的商业价值。随后结合阿里巴巴真实场景,谈谈流式计算的技术挑战及系统设计的关键问题。特别的,将介绍独特的增量计算需求,及其与系统其它关键能力(如容错)的设计交互和抽象。最后结合我们过去几年的工作和思考,谈谈对未来流式计算应用及系统发展的展望。

听众预计受益:听众可以了解PAI机器学习平台的模型演进,尤其是阿里在面对大规模分布式机器学习难题的时候的解决思路。
  1. 了解大数据应用实时化趋势下,流式数据处理的典型应用场景和商业价值。
  2. 了解流式数据处理在阿里巴巴真实场景中的应用与技术挑战。
  3. 了解真实场景驱动的系统设计核心问题,及阿里云在服务阿里巴巴集团内外场景中积累的思考和对未来的展望。
九丰 阿里云高级专家

dd13b68279e52b8f3e7de61aaefe2fee408bd3f8

嘉宾简介:九丰,阿里云大数据事业部高级专家,14年加入阿里云,一直从事PAI机器学习平台的建设。

演讲议题:PAI分布式机器学习平台计算模型演进之路
直播时间:3月9日 16:00-16:40

议题简介:随着训练数据规模的持续扩大,模型特征的持续增长,常用的机器学习算法面临着越来越多的挑战。从很多人熟悉的R语言,到基于MPI的多机的计算框架,再到支持超大规模特征的Parameter Server架构,再到如今的深度学习计算框架,机器学习平台上的编程模型也在不断演进,以满足业务上持续的挑战。本次主题主要和大家分享PAI分布式机器学习平台的多种编程模型的演进过程。

听众预计受益:听众可以了解PAI机器学习平台的模型演进,尤其是阿里在面对大规模分布式机器学习难题的时候的解决思路。

朋春 阿里云高级技术专家

5fbeb897768081232dfd2d400f196e84785db4f6

嘉宾简介:阿里云高级技术专家,5年以上高吞吐数据传输平台的研发经验,目前是MaxCompute数据通道团队负责人。

演讲议题:MaxCompute数据上云与生态
直播时间:3月9日 16:40-17:20

议题简介:玩大数据的第一件事情是如何将数据上传到MaxCompute。在前台存储多样化的形式下,数据上传存在着多种多样的需求;另一方面,网络质量的好坏又对传输过程中的时效性、吞吐量和容错能力带来了不小的挑战。

本次演讲会从MaxCompute提供的离线、实时数据通道入手,延伸到DTS、Logstash、DataX等官方/开源软件,向大家介绍如何从数据库、本地文件等多种存储向MaxCompute导入数据。除此之外,还会涉及一些在Python和R语言中使用MaxCompute的介绍。

听众预计受益:1、了解如何利用现有工具,快速地向MaxCompute导入数据;2、了解不同网络环境和存储类型下的导入导出工具选择;3、通过示例了解如何在Python和R环境中使用MaxCompute。

无庸 阿里云高级技术专家

af0a748775b64f8835058e183adaeb2751c5d7be

嘉宾简介:阿里云大数据计算服务MaxCompute框架负责人、高级技术专家,专注于高可用大规模分布式系统的平台开发。

演讲议题:高可用大数据计算平台如何持续发布和演进
直播时间:3月9日 16:40-17:20

议题简介:大数据服务如何持续发布和演进一直是业界的一个难题。成熟的大数据服务必须具备高可用、高稳定、高安全、高效率等特点,与此同时,为了满足用户不断增长的需求和规模,大数据服务需要不断地完善功能提高性能,两者之间存在着天然的矛盾。本次演讲将会介绍阿里云大数据计算服务MaxCompute在解决这个难题中的一些方案和实践。

听众预计受益:1) 大数据服务新功能在保障数据安全和用户知识产权的前提下高覆盖、高效率的测试方法;2) 大数据服务保证高可用高可靠前提下灰度发布上线的方法。

场景应用篇

许鹏 佰腾科技CTO

43e661b6a4d3fd255dde14a298cae3a16f7c57dd

演讲议题:专利大数据的云上裂变之路
直播时间:3月9日 14:00-14:40

议题简介:专利大数据的大不在于数据的“多”,而在于数据的“宽”,专利数据每拓宽一个比特都需要对原始数据进行多次的拆解和分析,传统的计算技术很难满足这种大规模的数据挖掘需求,而阿里云的数加平台为我们提供了更大的存储、更高的性能、更好的分析,让我们实现了专利数据的快速裂变。

刘峥 明源云大数据负责人

bec9c6590e339c94bdec8261c29df1c268343bc4

嘉宾简介:明源云大数据负责人,多年来探索传统行业大数据应用与变现,现在地产垂直领域负责行业大数据管理平台整体规划与建设。

演讲议题:地产大数据趋势与应用实践
直播时间:3月9日 14:40-15:20

议题简介:大数据能够对地产行业的拿地决策、营销、服务等业务带来哪些帮助;明源如何通过阿里云将大数据业务场景落地;明源云大数据管理平台的技术架构

王洋 小红唇

3f3561912797f5dcc53241f22afadc13836de27e

个人简介:王洋, 毕业于北京邮电大学计算机科学与技术系,研究生学历。曾在IBM中国研发中心和Polycom中国研发中心从事软件开发及管理工作。2014年作为创始团队加入北京小鱼儿科技有限公司,负责管理云端及移动端APP的开发。2016年加入小红唇网络科技有限公司,全面负责公司的研发管理。精通云服务、移动APP的架构设计与开发,在大数据、实时音视频系统等方面具有丰富的经验。

演讲议题:用大数据打造你的变美频道
直播时间:3月9日 15:20-16:00

议题简介:阿里数加平台完整的大数据技术栈和易用性,使小红唇公司快速建立了自己的数据分析、个性化推荐、机器学习等大数据核心应用。为小红唇不断扩大的业务提供了强有力的数据支撑,使用户获取变美内容和商品变得易如反掌。普通的开发人员通过数加平台迅速转变为数据工程师,而几乎零运维又使得工程师们能够专注于数据,不断使数据产生的收益最大化。

刘立兼 网聚宝首席架构师

fe5066d09b6813d0ae795bcc6c40b9fc5d81bd8e

个人简介:上海云贝网络科技有限公司首席架构师,数年来一直奋战在电商大数据领域。经历了一个又一个618/1111/1212。对面向大数据的高可用、高性能、易扩展的分布式架构技术有着深刻的理解,特别擅长基于云计算的系统架构。

演讲议题:云上大数据,零售新思维
直播时间:3月9日 16:00-16:40

议题简介:大数据的发展给各行各业都带来了变化。网聚宝基于5年的零售业的数据服务沉淀,结合云上大数据能力,给企业客户带去了更多的可能性。

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
1天前
|
Cloud Native 持续交付 云计算
云原生技术:重塑软件开发与架构的未来
在云计算的推动下,云原生技术正逐渐成为软件开发的新标准,强调利用容器、服务网格、微服务等技术实现敏捷开发与高效运维。本文探讨了云原生技术如何重塑软件开发与架构的未来,介绍了其核心概念(如容器化、微服务架构、CI/CD)及优势(如敏捷性、可扩展性、成本效益),并讨论了其在金融服务、电子商务和物联网等领域的实际应用及面临的挑战。尽管存在技术复杂性和人才短缺等问题,云原生技术仍将成为软件开发的主流趋势。
|
3天前
|
设计模式 消息中间件 监控
深入探索微服务架构的核心要素与实践策略
本文旨在解析微服务架构的关键概念、优势以及实施过程中的最佳实践。通过对微服务架构的基本原则、组件和技术选型的讨论,帮助读者理解如何构建高效、可扩展的微服务系统。同时,文章还将探讨在实践中可能遇到的挑战和解决方案,以期为后端开发者提供有价值的参考。
|
3天前
|
消息中间件 安全 Kafka
Kafka支持SSL/TLS协议技术深度解析
SSL(Secure Socket Layer,安全套接层)及其继任者TLS(Transport Layer Security,传输层安全)是为网络通信提供安全及数据完整性的一种安全协议。这些协议在传输层对网络连接进行加密,确保数据在传输过程中不被窃取或篡改。
9 0
|
3天前
|
分布式计算 Java Apache
Apache Spark Streaming技术深度解析
【9月更文挑战第4天】Apache Spark Streaming是Apache Spark生态系统中用于处理实时数据流的一个重要组件。它将输入数据分成小批次(micro-batch),然后利用Spark的批处理引擎进行处理,从而结合了批处理和流处理的优点。这种处理方式使得Spark Streaming既能够保持高吞吐量,又能够处理实时数据流。
12 0
|
3天前
|
存储 安全 算法
探索操作系统的心脏:内核技术与架构
本文深入探讨了现代操作系统中至关重要的部分——内核。通过分析其功能、架构以及在系统性能和稳定性中的作用,揭示了内核技术背后的复杂性及其对操作系统整体表现的影响。我们将从基本概念入手,逐步深入到内核的具体实现细节,旨在为读者提供一个全面而清晰的理解框架。
|
4天前
|
存储 负载均衡 数据库
探索后端技术:从服务器架构到数据库优化的实践之旅
在当今数字化时代,后端技术作为支撑网站和应用运行的核心,扮演着至关重要的角色。本文将带领读者深入后端技术的两大关键领域——服务器架构和数据库优化,通过实践案例揭示其背后的原理与技巧。无论是对于初学者还是经验丰富的开发者,这篇文章都将提供宝贵的见解和实用的知识,帮助读者在后端开发的道路上更进一步。
|
19天前
|
Kubernetes Cloud Native Docker
云原生之旅:从容器到微服务的架构演变
【8月更文挑战第29天】在数字化时代的浪潮下,云原生技术以其灵活性、可扩展性和弹性管理成为企业数字化转型的关键。本文将通过浅显易懂的语言和生动的比喻,带领读者了解云原生的基本概念,探索容器化技术的奥秘,并深入微服务架构的世界。我们将一起见证代码如何转化为现实中的服务,实现快速迭代和高效部署。无论你是初学者还是有经验的开发者,这篇文章都会为你打开一扇通往云原生世界的大门。
|
4天前
|
运维 Cloud Native Devops
云原生架构的崛起与实践云原生架构是一种通过容器化、微服务和DevOps等技术手段,帮助应用系统实现敏捷部署、弹性扩展和高效运维的技术理念。本文将探讨云原生的概念、核心技术以及其在企业中的应用实践,揭示云原生如何成为现代软件开发和运营的主流方式。##
云原生架构是现代IT领域的一场革命,它依托于容器化、微服务和DevOps等核心技术,旨在解决传统架构在应对复杂业务需求时的不足。通过采用云原生方法,企业可以实现敏捷部署、弹性扩展和高效运维,从而大幅提升开发效率和系统可靠性。本文详细阐述了云原生的核心概念、主要技术和实际应用案例,并探讨了企业在实施云原生过程中的挑战与解决方案。无论是正在转型的传统企业,还是寻求创新的互联网企业,云原生都提供了一条实现高效能、高灵活性和高可靠性的技术路径。 ##
12 3
|
8天前
|
监控 负载均衡 应用服务中间件
探索微服务架构下的API网关设计与实践
在数字化浪潮中,微服务架构以其灵活性和可扩展性成为企业IT架构的宠儿。本文将深入浅出地介绍微服务架构下API网关的关键作用,探讨其设计原则与实践要点,旨在帮助读者更好地理解和应用API网关,优化微服务间的通信效率和安全性,实现服务的高可用性和伸缩性。
26 3
|
12天前
|
存储 Java Maven
从零到微服务专家:用Micronaut框架轻松构建未来架构
【9月更文挑战第5天】在现代软件开发中,微服务架构因提升应用的可伸缩性和灵活性而广受欢迎。Micronaut 是一个轻量级的 Java 框架,适合构建微服务。本文介绍如何从零开始使用 Micronaut 搭建微服务架构,包括设置开发环境、创建 Maven 项目并添加 Micronaut 依赖,编写主类启动应用,以及添加控制器处理 HTTP 请求。通过示例代码展示如何实现简单的 “Hello, World!” 功能,并介绍如何通过添加更多依赖来扩展应用功能,如数据访问、验证和安全性等。Micronaut 的强大和灵活性使你能够快速构建复杂的微服务系统。
33 5

热门文章

最新文章

相关产品

  • 云原生大数据计算服务 MaxCompute
  • 推荐镜像

    更多