大数据&AI产品月刊【2022年3月】

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介: 大数据&AI产品技术月刊(2022年3月),涵盖本月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据&AI方面最新动态。

一、本月产品功能发布

【新版本】云原生大数据计算服务 MaxCompute - 兼容开源 Spark 的计算服务全新支持 3.1 版本

MaxCompute 兼容开源 Spark 的计算服务继1.6、2.3、2.4 版本之后,全新支持Spark 3.1 版本

 

【新功能】机器学习 PAI-Blade 新增支持Tensorflow 2.7版本

Blade 新增支持Tensorflow 2.7版本,目前已支持 1.15、2.4、2.7 三个版本

 

【新地域】检索分析服务 Elasticsearch版 - 在成都、广州区域上线7.10/7.16版本

 

阿里云Elasticsearch上线广州、成都区域,支持7.10及7.16全新版本,基于全新云原生ACK架构实现运管提效,集群创建仅需5min,您可在控制台及购买页按需开通

 

【新功能】云原生大数据计算服务 MaxCompute - 支持压缩TEXTFILE 格式文件的 Skip header/ footer

MaxCompute支持Gzip,bzip2,LZO压缩TEXTFILE 格式文件的 Skip header/ footer

 

【新功能】云原生大数据计算服务 MaxCompute - 增强物化视图自动改写能力

物化视图新增outer join和Union/Union All的自动改写能力,提高数据计算速度,减省查询时间,提高用户体验

 

【新功能】云原生大数据计算服务 MaxCompute - 增强TRIM/LTRIM/RTRIM函数能力

MaxCompute支持用TRIM/LTRIM/RTRIM函数去除字符串左端,右端或者两端的指定字符功能

 

【新功能】机器学习 PAI - EAS新增定时伸缩功能,支持grpc/websocket协议的镜像部署发布

EAS新增定时伸缩功能,支持客户定时对部署的服务进行实例的扩缩容

 

【新功能】实时数仓 Hologres - HoloWeb支持慢Query甘特图分析功能

HoloWeb支持慢Query甘特图分析功能

 

【新功能】实时数仓 Hologres - 管理控制台升级,网络配置支持绑定指定VPC

Hologres管控台升级,网络配置支持绑定指定VPC

 

【新版本】实时计算 Flink版 -新版本发布

新版本聚焦开发运维两方面能力,全方面提升用户体验

 

【新功能】开源大数据平台 E-MapReduce - StarRocks 在新版控制台上线,致力于构建极速统一分析体验

EMR StarRocks 致力于构建极速统一分析体验,满足用户多种数据分析场景,支持多种数据模型,多种导入方式,多种现有系统

 

二、产品快讯

阿里巴巴开源深度学习训练框架EPL 可支持10万亿参数超大模型

EPL是PAI团队一次面向大规模深度学习分布式自动化训练的探索,EPL希望能够简化深度学习模型从单机训练到分布式开发调试的流程。EPL通过对不同并行化策略进行统一抽象、封装,在一套分布式训练框架中支持多种并行策略,并进行显存、计算、通信等全方位优化来提供易用、高效的分布式训练框架。


image.png

 

阿里开源大规模稀疏模型训练/预测引擎DeepRec,助力开发者提升稀疏模型训练性能和效果

DeepRec(PAI-TF)是阿里巴巴集团统一的大规模稀疏模型训练/预测引擎,广泛应用于淘宝、天猫、阿里妈妈、高德、淘特、AliExpress、Lazada等,支持了淘宝搜索、推荐、广告等核心业务,支撑着千亿特征、万亿样本的超大规模稀疏训练。

 

云原生大数据运维平台 SREWorks 正式开源,助力用户“数智”思想做好高效运维

阿里巴巴云原生大数据运维平台 SREWorks,沉淀了团队近10年经过内部业务锤炼的 SRE 工程实践,今天正式对外开源,秉承“数据化、智能化”运维思想,帮助运维行业更多的从业者采用“数智”思想做好高效运维。

 

 

三、产品学习指南

 

【产品运维】对接Flink常见问题诊断

Hologres对接Flink/Blink时的常见问题以及对应的诊断方法。

 

【产品运维】监控告警常见问题

使用Hologres时常见的监控告警相关问题,以帮助用户能更好的使用Hologres。

 

【最佳实践】Fixed Plan加速SQL执行

在Hologres中如何通过fixed plan加速SQL运行。

 

【最佳实践】基于Confluent+Flink的实时数据分析最佳实践

在实际业务使用中,需要实时做一些数据分析,包括实时PV和UV展示,实时销售数据,实时店铺UV以及实时推荐系统等,基于此类需求,Confluent+实时计算Flink版是一个高效的方案。

 


 

了解更多阿里云大数据产品:https://www.aliyun.com/product/bigdata/apsarabigdata

了解更多阿里云AI产品:https://ai.aliyun.com

了解大数据&AI开源项目:https://www.aliyun.com/activity/bigdata/opensource_bigdata__ai

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
18天前
|
人工智能 Cloud Native 数据管理
媒体声音|重磅升级,阿里云发布首个“Data+AI”驱动的一站式多模数据平台
在2024云栖大会上,阿里云瑶池数据库发布了首个一站式多模数据管理平台DMS:OneMeta+OneOps。该平台由Data+AI驱动,兼容40余种数据源,实现跨云数据库、数据仓库、数据湖的统一数据治理,帮助用户高效提取和分析元数据,提升业务决策效率10倍。DMS已服务超10万企业客户,降低数据管理成本高达90%。
|
14天前
|
存储 人工智能 分布式计算
大数据& AI 产品月刊【2024年10月】
大数据& AI 产品技术月刊【2024年10月】,涵盖本月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据& AI 方面最新动态。
|
1月前
|
SQL 存储 人工智能
【产品升级】Dataphin V4.3重大升级:AI“弄潮儿”,数据资产智能化
DataAgent如何助理业务和研发成为业务参谋?如何快速低成本的创建行业数据分类标准?如何管控数据源表的访问权限?如何满足企业安全审计需求?
582 1
【产品升级】Dataphin V4.3重大升级:AI“弄潮儿”,数据资产智能化
|
25天前
|
机器学习/深度学习 人工智能 运维
智能运维:大数据与AI的融合之道###
【10月更文挑战第20天】 运维领域正经历一场静悄悄的变革,大数据与人工智能的深度融合正重塑着传统的运维模式。本文探讨了智能运维如何借助大数据分析和机器学习算法,实现从被动响应到主动预防的转变,提升系统稳定性和效率的同时,降低了运维成本。通过实例解析,揭示智能运维在现代IT架构中的核心价值,为读者提供一份关于未来运维趋势的深刻洞察。 ###
77 10
zdl
|
7天前
|
消息中间件 运维 大数据
大数据实时计算产品的对比测评:实时计算Flink版 VS 自建Flink集群
本文介绍了实时计算Flink版与自建Flink集群的对比,涵盖部署成本、性能表现、易用性和企业级能力等方面。实时计算Flink版作为全托管服务,显著降低了运维成本,提供了强大的集成能力和弹性扩展,特别适合中小型团队和业务波动大的场景。文中还提出了改进建议,并探讨了与其他产品的联动可能性。总结指出,实时计算Flink版在简化运维、降低成本和提升易用性方面表现出色,是大数据实时计算的优选方案。
zdl
31 0
|
29天前
|
Oracle 大数据 数据挖掘
企业内训|大数据产品运营实战培训-某电信运营商大数据产品研发中心
本课程是TsingtaoAI专为某电信运营商的大数据产品研发中心的产品支撑组设计,旨在深入探讨大数据在电信运营商领域的应用与运营策略。通过密集的培训,从数据的本质与价值出发,系统解析大数据工具和技术的最新进展,深入剖析行业内外的实践案例。课程涵盖如何理解和评估数据、如何有效运用大数据技术、以及如何在不同业务场景中实现数据的价值转化。
38 0
|
1月前
|
SQL 运维 大数据
大数据实时计算产品的对比测评
在使用多种Flink实时计算产品后,我发现Flink凭借其流批一体的优势,在实时数据处理领域表现出色。它不仅支持复杂的窗口机制与事件时间处理,还具备高效的数据吞吐能力和精准的状态管理,确保数据处理既快又准。此外,Flink提供了多样化的编程接口和运维工具,简化了开发流程,但在界面友好度上还有提升空间。针对企业级应用,Flink展现了高可用性和安全性,不过价格因素可能影响小型企业的采纳决策。未来可进一步优化文档和自动化调优工具,以提升用户体验。
121 0
|
1月前
|
存储 机器学习/深度学习 分布式计算
大数据技术——解锁数据的力量,引领未来趋势
【10月更文挑战第5天】大数据技术——解锁数据的力量,引领未来趋势
|
7天前
|
存储 分布式计算 数据挖掘
数据架构 ODPS 是什么?
数据架构 ODPS 是什么?
61 7
|
7天前
|
存储 分布式计算 大数据
大数据 优化数据读取
【11月更文挑战第4天】
20 2

相关产品

  • 云原生大数据计算服务 MaxCompute