大数据&AI产品月刊【2023年12月】

本文涉及的产品
实时计算 Flink 版,5000CU*H 3个月
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
智能开放搜索 OpenSearch行业算法版,1GB 20LCU 1个月
简介: 大数据&AI产品技术月刊【2023年12月】,涵盖本月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据&AI方面最新动态。

一、产品功能发布

【人工智能平台 PAI】新功能/规格 - PAI发布基于Quota队列的4大调度策略功能

发布智能、遍历、均衡、FIFO 4大调度策略,提升客户AI算力利用效率。


【人工智能平台 PAI】新功能/规格 - DSW实例支持SSH直连访问    

帮助客户在自己VPC内部机器/本地代码开发环境中更方便访问DSW实例。


【人工智能平台 PAI】新地域/新可用区 - Designer在印度尼西亚(雅加达)正式开服

Designer新增开通印度尼西亚(雅加达)地域,可以在PAI控制台上按需使用。


【云原生大数据计算服务 MaxCompute】新功能/规格 - 控制台上线迁移服务    

MaxCompute支持在控制台上可视化界面配置轻松迁移Hive数据上云。


【实时数仓 Hologres】新功能/规格 - 新增hg_relation_size函数查看表明细存储    

新增hg_relation_size函数查看表明细存储。


【实时数仓 Hologres】新功能/规格 - 支持区间漏斗函数,分组分析流量转化    

该函数用于计算时间窗口的分组统计结果及聚合计算总结果。


【实时数仓 Hologres】新功能/规格 - 支持通过Terraform管理Hologres实例    

支持通过Terraform管理Hologres实例。


【实时数仓 Hologres】功能优化 - COUNT DISTINCT自动优化,提升查询效率    

单条/多条COUNT DISTINCT自动性能优化,提升查询效率。


【智能开放搜索 OpenSearch】新功能/规格 - LLM智能问答版文档总结功能发布    

OpenSearch智能问答版推出文档总结功能,提供单篇文档摘要总结能力。


【图计算服务 Graph Compute】新功能/规格 - GraphCompute最短路径算法    

帮助客户简化查询逻辑,基于在线引擎提供最短路径算法能力。


【图计算服务 Graph Compute】新功能/规格 - GraphCompute数据支持导出MaxCompute,构建在离线一体化数据方案    

帮助客户将在线图数据与离线分析数据存储统一链路,保证数据一致性。


二、产品活动

PAIxEasyPhoto,制作专属AI新年写真

EasyPhoto 是一个WebUI插件,用于生成AI肖像画。基于StableDiffusion + 人物定制Lora + ControlNet 的方式实现,支持低代码操作、自定义风格,内置丰富模版,让更多开发者可以灵活地开发自己的风格化的艺术照生成。 本教程基于阿里云人工智能平台PAI,低代码高效率启动EasyPhoto,实现节日氛围美图的快速生成。


企业级AI问答知识库训练营,火热开营中!    

大语言模型具备强大的逻辑推理、对话能力,如何结合企业自身数据搭建问答知识库,是很多企业关注的话题。本次实战营汇聚多位阿里云技术专家,基于人工智能平台PAI、实时数仓Hologres,手把手带您从LLM入门到数据向量化处理再到模型在线部署,了解企业级AI问答知识库搭建全流程。



三、产品快讯

首批!阿里云MaxCompute完成中国信通院基于无服务器架构大数据平台测试    

近日,阿里云计算有限公司MaxCompute产品顺利完成中国信通院首批无服务器架构(Serverless)大数据平台测试。MaxCompute是一款多功能、低成本、高性能、高可靠、易于使用的数据仓库和支持数据湖能力的大数据平台。测试过程依据标准在资源调度、数据应用、应用管理三大能力域的相关要求,测试结果表明,MaxCompute产品在资源管理、资源弹性、编排调度、数据管理、存储服务、应用调度、安全管理、免运维等方面均符合标准要求。

image.png


从OLAP到湖仓,阿里云与StarRocks的共创共荣    

StarRocks Summit 2023上,阿里云资深技术专家,阿里云开源大数据平台EMR负责人李钰围绕阿里云EMR和StarRocks社区及镜舟的深度合作、阿里云EMR在StarRocks社区的主要贡献、阿里云EMR Serverless StarRocks产品的核心能力及产品未来规划多维度展开分享介绍。


阿里云人工智能平台PAI多篇论文入选EMNLP 2023    

近期,阿里云人工智能平台PAI主导的多篇论文在EMNLP2023上入选。EMNLP是人工智能自然语言处理领域的顶级国际会议,聚焦于自然语言处理技术在各个应用场景的学术研究,尤其重视自然语言处理的实证研究。该会议曾推动了预训练语言模型、文本挖掘、对话系统、机器翻译等自然语言处理领域的核心创新,在学术和工业界都有巨大的影响力。此次入选意味着阿里云人工智能平台PAI自研的自然语言处理算法达到了全球业界先进水平,获得了国际学者的认可,展现了中国人工智能技术创新在国际上的竞争力。

四、产品学习指南

【最佳实践】通义千问开源模型在PAI灵骏的最佳实践    

12月1日,通义千问再次宣布重磅开源,目前通义千问已推出1.8B、7B、14B、72B 四款不同尺寸的开源大语言模型。阿里云PAI灵骏智算服务,是面向大规模深度学习场景的智算产品,一站式提供异构算力底座及AI工程平台。本实践将展示如何基于阿里云PAI灵骏智算服务,在通义千问开源模型之上进行高效分布式继续预训练、指令微调、模型离线推理验证以及在线服务部署。


【最佳实践】松柏之志,下聚百川-松下中国阿里云大数据实践    

松下集团在中国及东北亚地区拥有有64家法人公司,业务范围涉及研究开发,养老、铸件、汽车、车载、能源、电池等多个方面,这些多元化的业务组合为松下常年可持续性发展提供坚实保障。互联网浪潮下,松下作为百年传统制造业企业,在务实的坚实基础上进行创新,本文将围绕数字化改革中所遇挑战,松下数据治理实践及未来期待三部分进行说明。

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
4天前
|
数据采集 分布式计算 大数据
MaxCompute MaxFrame 产品评测报告
MaxCompute MaxFrame是阿里云自研的分布式计算框架,专为Python开发者设计。它支持Python接口,充分利用MaxCompute的大数据资源,提升大规模数据分析效率。本文分享了MaxFrame在分布式Pandas处理和大语言模型数据预处理中的最佳实践,展示了其在数据清洗、特征工程等方面的强大能力,并提出了改进建议。
30 13
|
1天前
|
数据采集 人工智能 分布式计算
探索 MaxCompute MaxFrame:AI 数据预处理的高效之选
探索 MaxCompute MaxFrame:AI 数据预处理的高效之选
|
4天前
|
机器学习/深度学习 分布式计算 数据处理
MaxCompute MaxFrame 产品评测报告
MaxCompute MaxFrame 产品评测报告
19 4
|
8天前
|
SQL 分布式计算 DataWorks
DataWorks产品测评|基于DataWorks和MaxCompute产品组合实现用户画像分析
本文介绍了如何使用DataWorks和MaxCompute产品组合实现用户画像分析。首先,通过阿里云官网开通DataWorks服务并创建资源组,接着创建MaxCompute项目和数据源。随后,利用DataWorks的数据集成和数据开发模块,将业务数据同步至MaxCompute,并通过ODPS SQL完成用户画像的数据加工,最终将结果写入`ads_user_info_1d`表。文章详细记录了每一步的操作过程,包括任务开发、运行、运维操作和资源释放,帮助读者顺利完成用户画像分析。此外,还指出了文档中的一些不一致之处,并提供了相应的解决方法。
|
18天前
|
机器学习/深度学习 人工智能 运维
智能化运维:AI与大数据在IT运维中的应用探索####
本文旨在探讨人工智能(AI)与大数据分析技术如何革新传统IT运维模式,提升运维效率与服务质量。通过具体案例分析,揭示AI算法在故障预测、异常检测及自动化修复等方面的实际应用成效,同时阐述大数据如何助力实现精准运维管理,降低运营成本,提升用户体验。文章还将简要讨论实施智能化运维面临的挑战与未来发展趋势,为IT管理者提供决策参考。 ####
|
27天前
|
人工智能 自然语言处理 算法
【AI问爱答-双十一返场周直播】AI产品专家直播解读重点AI应用场景怎么用?
阿里云【AI问爱答】栏目强势回归,11月25日至28日每晚19:00,连续四天直播,涵盖AI营销、企业办公、社交娱乐及大模型推理调优四大主题,助您深入了解AI应用,解决实际问题。欢迎预约观看!
|
3天前
|
分布式计算 DataWorks 搜索推荐
DataWorks产品评测:大数据开发治理平台的最佳实践与体验
DataWorks是阿里云推出的一款大数据开发治理平台,集成了多种大数据引擎,支持数据集成、开发、分析和任务调度。本文通过用户画像分析的最佳实践,评测了DataWorks的功能和使用体验,并提出了优化建议。通过实践,DataWorks在数据整合、清洗及可视化方面表现出色,适合企业高效管理和分析数据。
37 0
|
16天前
|
人工智能 分布式计算 DataWorks
大数据& AI 产品月刊【2024年11月】
大数据& AI 产品技术月刊【2024年11月】,涵盖本月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据& AI 方面最新动态。
|
18天前
|
人工智能 Kubernetes Cloud Native
荣获2024年AI Cloud Native典型案例,阿里云容器产品技术能力获认可
2024全球数字经济大会云·AI·计算创新发展大会,阿里云容器服务团队携手客户,荣获“2024年AI Cloud Native典型案例”。
|
1月前
|
存储 分布式计算 数据挖掘
数据架构 ODPS 是什么?
数据架构 ODPS 是什么?
293 7

相关产品

  • 云原生大数据计算服务 MaxCompute