大数据&AI产品月刊【2023年12月】

本文涉及的产品
实时计算 Flink 版,5000CU*H 3个月
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
大数据开发治理平台 DataWorks,不限时长
简介: 大数据&AI产品技术月刊【2023年12月】,涵盖本月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据&AI方面最新动态。

一、产品功能发布

【人工智能平台 PAI】新功能/规格 - PAI发布基于Quota队列的4大调度策略功能

发布智能、遍历、均衡、FIFO 4大调度策略,提升客户AI算力利用效率。


【人工智能平台 PAI】新功能/规格 - DSW实例支持SSH直连访问    

帮助客户在自己VPC内部机器/本地代码开发环境中更方便访问DSW实例。


【人工智能平台 PAI】新地域/新可用区 - Designer在印度尼西亚(雅加达)正式开服

Designer新增开通印度尼西亚(雅加达)地域,可以在PAI控制台上按需使用。


【云原生大数据计算服务 MaxCompute】新功能/规格 - 控制台上线迁移服务    

MaxCompute支持在控制台上可视化界面配置轻松迁移Hive数据上云。


【实时数仓 Hologres】新功能/规格 - 新增hg_relation_size函数查看表明细存储    

新增hg_relation_size函数查看表明细存储。


【实时数仓 Hologres】新功能/规格 - 支持区间漏斗函数,分组分析流量转化    

该函数用于计算时间窗口的分组统计结果及聚合计算总结果。


【实时数仓 Hologres】新功能/规格 - 支持通过Terraform管理Hologres实例    

支持通过Terraform管理Hologres实例。


【实时数仓 Hologres】功能优化 - COUNT DISTINCT自动优化,提升查询效率    

单条/多条COUNT DISTINCT自动性能优化,提升查询效率。


【智能开放搜索 OpenSearch】新功能/规格 - LLM智能问答版文档总结功能发布    

OpenSearch智能问答版推出文档总结功能,提供单篇文档摘要总结能力。


【图计算服务 Graph Compute】新功能/规格 - GraphCompute最短路径算法    

帮助客户简化查询逻辑,基于在线引擎提供最短路径算法能力。


【图计算服务 Graph Compute】新功能/规格 - GraphCompute数据支持导出MaxCompute,构建在离线一体化数据方案    

帮助客户将在线图数据与离线分析数据存储统一链路,保证数据一致性。


二、产品活动

PAIxEasyPhoto,制作专属AI新年写真

EasyPhoto 是一个WebUI插件,用于生成AI肖像画。基于StableDiffusion + 人物定制Lora + ControlNet 的方式实现,支持低代码操作、自定义风格,内置丰富模版,让更多开发者可以灵活地开发自己的风格化的艺术照生成。 本教程基于阿里云人工智能平台PAI,低代码高效率启动EasyPhoto,实现节日氛围美图的快速生成。


企业级AI问答知识库训练营,火热开营中!    

大语言模型具备强大的逻辑推理、对话能力,如何结合企业自身数据搭建问答知识库,是很多企业关注的话题。本次实战营汇聚多位阿里云技术专家,基于人工智能平台PAI、实时数仓Hologres,手把手带您从LLM入门到数据向量化处理再到模型在线部署,了解企业级AI问答知识库搭建全流程。



三、产品快讯

首批!阿里云MaxCompute完成中国信通院基于无服务器架构大数据平台测试    

近日,阿里云计算有限公司MaxCompute产品顺利完成中国信通院首批无服务器架构(Serverless)大数据平台测试。MaxCompute是一款多功能、低成本、高性能、高可靠、易于使用的数据仓库和支持数据湖能力的大数据平台。测试过程依据标准在资源调度、数据应用、应用管理三大能力域的相关要求,测试结果表明,MaxCompute产品在资源管理、资源弹性、编排调度、数据管理、存储服务、应用调度、安全管理、免运维等方面均符合标准要求。

image.png


从OLAP到湖仓,阿里云与StarRocks的共创共荣    

StarRocks Summit 2023上,阿里云资深技术专家,阿里云开源大数据平台EMR负责人李钰围绕阿里云EMR和StarRocks社区及镜舟的深度合作、阿里云EMR在StarRocks社区的主要贡献、阿里云EMR Serverless StarRocks产品的核心能力及产品未来规划多维度展开分享介绍。


阿里云人工智能平台PAI多篇论文入选EMNLP 2023    

近期,阿里云人工智能平台PAI主导的多篇论文在EMNLP2023上入选。EMNLP是人工智能自然语言处理领域的顶级国际会议,聚焦于自然语言处理技术在各个应用场景的学术研究,尤其重视自然语言处理的实证研究。该会议曾推动了预训练语言模型、文本挖掘、对话系统、机器翻译等自然语言处理领域的核心创新,在学术和工业界都有巨大的影响力。此次入选意味着阿里云人工智能平台PAI自研的自然语言处理算法达到了全球业界先进水平,获得了国际学者的认可,展现了中国人工智能技术创新在国际上的竞争力。

四、产品学习指南

【最佳实践】通义千问开源模型在PAI灵骏的最佳实践    

12月1日,通义千问再次宣布重磅开源,目前通义千问已推出1.8B、7B、14B、72B 四款不同尺寸的开源大语言模型。阿里云PAI灵骏智算服务,是面向大规模深度学习场景的智算产品,一站式提供异构算力底座及AI工程平台。本实践将展示如何基于阿里云PAI灵骏智算服务,在通义千问开源模型之上进行高效分布式继续预训练、指令微调、模型离线推理验证以及在线服务部署。


【最佳实践】松柏之志,下聚百川-松下中国阿里云大数据实践    

松下集团在中国及东北亚地区拥有有64家法人公司,业务范围涉及研究开发,养老、铸件、汽车、车载、能源、电池等多个方面,这些多元化的业务组合为松下常年可持续性发展提供坚实保障。互联网浪潮下,松下作为百年传统制造业企业,在务实的坚实基础上进行创新,本文将围绕数字化改革中所遇挑战,松下数据治理实践及未来期待三部分进行说明。

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
6天前
|
人工智能 安全 算法
AI与大数据:智慧城市安全的护航者与变革引擎
AI与大数据:智慧城市安全的护航者与变革引擎
|
10天前
|
分布式计算 调度 MaxCompute
实时计算 Flink版产品使用合集之maxcompute更新写入如何解决
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
|
18天前
|
分布式计算 Java 数据库连接
实时数仓 Hologres产品使用合集之该创建外部表maxCompute的这个服务器列表如何解决
实时数仓Hologres是阿里云推出的一款高性能、实时分析的数据库服务,专为大数据分析和复杂查询场景设计。使用Hologres,企业能够打破传统数据仓库的延迟瓶颈,实现数据到决策的无缝衔接,加速业务创新和响应速度。以下是Hologres产品的一些典型使用场景合集。
|
18天前
|
人工智能 分布式计算 Cloud Native
大数据&AI产品月刊【2024年4月】
大数据&AI产品技术月刊【2024年4月】,涵盖本月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据&AI方面最新动态。
|
18天前
|
机器学习/深度学习 人工智能 大数据
AI时代Python金融大数据分析实战:ChatGPT让金融大数据分析插上翅膀
AI时代Python金融大数据分析实战:ChatGPT让金融大数据分析插上翅膀
164 6
|
18天前
|
消息中间件 人工智能 监控
|
18天前
|
分布式计算 大数据 BI
MaxCompute产品使用合集之MaxCompute项目的数据是否可以被接入到阿里云的Quick BI中
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
18天前
|
SQL 分布式计算 大数据
MaxCompute产品使用合集之怎样可以将大数据计算MaxCompute表的数据可以导出为本地文件
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
18天前
|
分布式计算 DataWorks 关系型数据库
MaxCompute产品使用合集之可以使用什么方法将MySQL的数据实时同步到MaxCompute
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
18天前
|
分布式计算 DataWorks 数据库
DataWorks操作报错合集之DataWorks使用数据集成整库全增量同步oceanbase数据到odps的时候,遇到报错,该怎么处理
DataWorks是阿里云提供的一站式大数据开发与治理平台,支持数据集成、数据开发、数据服务、数据质量管理、数据安全管理等全流程数据处理。在使用DataWorks过程中,可能会遇到各种操作报错。以下是一些常见的报错情况及其可能的原因和解决方法。
28 0

相关产品

  • 云原生大数据计算服务 MaxCompute