一、产品功能发布
【云原生大数据计算服务 MaxCompute】新功能 - 支持Hologres外部表存储直读
支持Hologres存储直读,直读Hologres存数据时可以减少Hologres的连接数和提高读取数据的速度。
【云原生大数据计算服务 MaxCompute】新功能 - Quota使用规则发布
通过对MaxCompute Quota配置规则条件,实现满足规则条件的作业可调度到对应Quota,可更灵活的管理Quota的使用。
【云原生大数据计算服务 MaxCompute】新功能 - 支持标签分账
MaxCompute支持为项目(Project)、一级配额(Quota)绑定标签,并实现标签分账。
【云原生大数据计算服务 MaxCompute】新功能 - 增强显示数据对象SHOW命令
SHOW命令可以列出更细分类下的数据对象,包括表,视图和函数。
【大数据开发治理平台 DataWorks】新功能 - 数据治理中心支持任务批量下线的治理计划
数据治理中心提供面向场景的专项治理计划,针对无效/重复任务需要批量安全下线的场景,提供「优
雅下线」治理计划。
【大数据开发治理平台 DataWorks】新功能 - 管控台新增已购资源进行商品管理
展示当前所有已购买且未释放的DataWorks下属商品,可以方便快速进行升降退续等操作。
【大数据开发治理平台 DataWorks】新功能 - DataStudio简单模式支持代码评审
除标准模式外,简单模式也支持代码评审,并且可以开启强制代码评审,评审通过后方在生产环境生效。
【实时数仓 Hologres】新功能 - Hologres基于Delta Lake实现湖仓一体
为您介绍Hologres基于Delta Lake实现湖仓一体的背景、架构、环境准备及使用说明等信息。
【实时数仓 Hologres】新功能 - 数据写入、更新、点查场景压测最佳实践
Hologres在数据写入、数据更新、点查场景的性能测试方法与结果。
【实时数仓 Hologres】新地域/可用区 - 共享集群发布深圳Region
共享集群发布深圳Region。
【检索分析服务 Elasticsearch版】新功能 - Serverless版本应用Demo上线
上线Demo体验功能,帮助用户快速创建Demo应用并进行数据管理和可视化。
【检索分析服务 Elasticsearch版】新功能 - Serverless版本应用及数据流管理功能优化|支持Beats采集写入
新增多种常用指标,支持指标数据Downsample采样精度配置。支持开源Beats采集写入。
【检索分析服务 Elasticsearch版】新地域/可用区 - 8.5版本在多个地域正式开服
开放区域:华北2(北京)、华北6(乌兰察布)、华东2(上海)、华南1(深圳)、华南3(广州)、西南1(成都)、中国香港。
【检索分析服务 Elasticsearch版】新地域/可用区 - 日志增强版上线新加坡区域
日志增强版新增开通新加坡区域。
【开源大数据平台 E-MapReduce】新功能 - 访问链接与端口功能升级
访问链接与端口新增服务原生UI地址,用户在不同集群环境下均可通过该模块访问服务UI。
【开源大数据平台 E-MapReduce】新功能 - 支持数据盘加密
EMR集群支持数据盘加密。
【实时计算 Flink版】新功能 - VVR 6.0.5版本发布|多功能发布更有StarRocks连接器新增
修复了Apache Flink 1.15.3的全部缺陷。同时正式发布StarRocks连接器,方便对StarRocks进行读写。
【机器学习 PAI】新功能 - Designer支持将离线数据处理及预测全链路pipeline一键部署为在线服务 Designer支持将数据预处理、特征工程、模型预测的串行Pipeline部署至EAS,并提供了常用的CTR预估场景模板。
PAI-EAS部署环节支持多规格实例选择,通过遍历配置文件中提供的规格列表来拉起资源,从而降低单一规格库存不足带来的部署风险。
【机器学习 PAI】新功能 - EAS支持抢占式资源实例(Spot Instance)
EAS支持部署服务时选择使用成本更低的抢占式资源实例(Spot Instance),指定价格上限的抢占模式,极大降低客户资源成本。
丰富了对推荐结果多样性、时效性、相关度的干预能力,可以有效提升用户体验。
【智能开放搜索 OpenSearch】新功能 - 实时热搜、个性化底纹发布
智能开放搜索OpenSearch推出实时热搜、个性化底纹功能,为用户提供更加精准的搜索引导服务。
二、产品快讯
Apache Flink入选 2022 年“科创中国”开源创新榜
近日,中国科协召开 2023“科创中国”年度会议。在本次会议上,“科创中国”联合体理事长、中国工程院院士周济,中国科协副主席、中国工程院院士陈学东,中国科学院院士陈润生等评审专家代表共同揭晓榜单,Apache Flink 以及 Flink 开源社区重要推动者阿里巴巴,分别入选开源创新榜“开源产品”和“开源机构”。
阿里云高级产品专家何源(荆杭)在阿里云EMR2.0线上发布会分享介绍了阿里云E-MapReduce的开发历程,EMR 2.0的新特性、产品架构,以及EMR 2.0在平台体验、数据开发、资源形态及分析场景等方面的全面突破与创新,重新定义新一代开源大数据平台。
阿里云PAI-Diffusion功能再升级,全链路支持模型调优,平均推理速度提升75%以上
阿里云PAI-Diffusion功能再升级,全链路支持模型调优。在模型推理方面,结合由PAI自主研发的编译优化工具PAI-Blade,支持对PAI-Diffusion模型的端到端的导出和推理加速,在A10机器下做到了1s内的中文大图生成。
阿里巴巴一直将数据作为自己的核心资产与能力之一,从最早的淘宝、天猫等电商业务,到后续的优酷、高德、菜鸟等板块,DataWorks、MaxCompute、Hologres等产品用一套技术体系来支持不同业务的发展与创新,为企业带来整体的“数据繁荣”。数据繁荣为我们带来了红利,同时也带动了各类数据治理需求的井喷,特别是降本等需求的不断出现,阿里云DataWorks团队将13年的产品建设经验整理成最佳实践,从数据生产规范性治理、数据生产稳定性治理、数据生产质量治理、数据应用提效治理、数据安全管控治理、数据成本治理、数据治理组织架构及文化建设等7个方面为大家揭秘数据治理平台建设实践。
GPT模型能较好的处理文本生成领域的各种任务,比如文本补全,自由问答,完形填空,写作文,写摘要,写小说,写诗歌等等。但针对GPT基础模型参数量大,训练&推理硬件资源消耗过高等问题,采用GPT+MoE的技术架构路线,探索单机最高能效的绿色低碳GPT大模型训练&推理软硬一体化适配技术在中文文本生成场景的落地可行性。
三、产品学习指南
【产品运维】EasyNLP集成K-Global Pointer算法,支持中文信息抽取
EasyNLP⽀持常⽤的中⽂预训练模型和⼤模型落地技术,并且提供了从训练到部署的⼀站式 NLP 开发体验。本⽂简要介绍 K-Global Pointer 的技术解读,以及如何在 EasyNLP 框架中使⽤K-Global Pointer 模型。
【产品运维】实时数仓Hologres新一代弹性计算组实例技术揭秘
Hologres新一代弹性计算组实例,旨在通过更强的隔离和弹性能力,进一步提高业务系统的稳定性。本文会详细介绍Hologres弹性计算组实例的实现原理,助力更多业务进一步提升企业级资源隔离和弹性能力。
【最佳实践】Flink X Hologres构建企业级Streaming Warehouse
Hologres跟Flink深度整合,构建强大的Streaming Warehouse。全链路都可以用SQL表示,并且只需要用到 Flink 和 Hologres 两个组件,操作非常方便。用户可以基于这个方案,利用Hologres强大的百万QPS点查能力和高性能OLAP能力构建各种实时应用。
【最佳实践】开源大数据可观测性方案实践 - 助力集群运维智能化、便捷化
在本篇文章中,将介绍大数据集群领域所需的可观测性,实践大数据集群可观测所需要的条件和面临的挑战,以及阿里云EMR产品如何通过EMR Doctor 实现大数据可观测并向用户提供相关能力。