大数据&AI产品月刊【2023年10月】

本文涉及的产品
实时计算 Flink 版,1000CU*H 3个月
智能开放搜索 OpenSearch行业算法版,1GB 20LCU 1个月
实时数仓Hologres,5000CU*H 100GB 3个月
简介: 大数据&AI产品技术月刊【2023年10月】,涵盖本月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据&AI方面最新动态。

一、产品功能发布


【云原生大数据计算服务 MaxCompute】新功能/规格 - MapReduce支持SQL运行时执行模式    

MaxCompute新增将MapReduce作业指定为SQL运行时执行。


【实时数仓 Hologres】新功能/规格 - Hologres监控指标支持内存细分类    

监控指标支持内存细分类,可查看meta、缓存、query等内存使用。


【实时数仓 Hologres】新功能/规格 - Postgres实时同步Hologres    

Postgres数据实时同步Hologres。


【实时数仓 Hologres】功能优化 - 云监控支持Hologres实例类别的监控    

云监控支持Hologres实例类别的监控,可按实例类型查看专属监控指标。


【检索分析服务 Elasticsearch版】新功能/规格 - Serverless支持创建企业版应用    

可创建生产级别的企业版应用并在北京区域开服,支持更高计算和存储资源上限。


【检索分析服务 Elasticsearch版】新地域/新可用区 - 最新8.9版本支持国内外15个地域    

最新8.9版本新增开通华东1(杭州)、华东2(上海)、华南1(深圳)、西南1(成都)、华南3(广州)、华北6(乌兰察布)、华北3(张家口)、华北1(青岛)、中国香港、新加坡、印度尼西亚(雅加达)、日本(东京)、美国(弗吉尼亚)、美国(硅谷)、德国(法兰克福)地域,可以在控制台上按需求开通集群。


【开源大数据平台 E-MapReduce】新功能/规格 - StarRocks支持存算分离    

EMR Serverless Starrocks 开始支持存算分离模式。


【人工智能平台 PAI】新功能/规格 - 灵骏智算版的快速开始(QuickStart)正式发布

基于开源大模型,支持零代码实现从训练到部署再到推理的全部过程。


【人工智能平台 PAI】新功能/规格 - 支持Stable Diffusion微调部署    

PAI支持Stable Diffusion模型微调训练、推理服务等。


【人工智能平台 PAI】新功能/规格 - 工作空间消息中心支持电话、短信、邮箱通知告警功能    

工作空间消息中心支持电话、短信、邮箱通知告警功能。


【人工智能平台 PAI】新地域/新可用区 - AI训练(预付费)在国际站(北京等5个地域)正式开服    

PAI-AI训练(预付费)国际站新增开通华北2(北京)、华东2(上海)、华东1(杭州)、华南1(深圳)、新加坡地域,可以在控制台上包年包月进行购买。


【人工智能平台 PAI】功能优化 - DLC 新增多个重点监控指标的订阅和告警    

DLC新增卡维度、PCIe、NVLink、吞吐等重点监控指标的订阅告警。


【智能开放搜索 OpenSearch】新功能/规格 - 行业算法版新增日语、韩语分词

OpenSearch新增日语、韩语分词,方便有日韩搜索需求的开发者使用。


【智能开放搜索 OpenSearch】新地域/新可用区 - 智能问答版在新加坡正式开服

OpenSearch LLM智能问答版新增开通新加坡地域,可以在控制台上按需购买实例。


【智能开放搜索 OpenSearch】功能优化 - 向量检索版简化操作流程、支持OSS数据源    

客户仅需5步即可完成向量版实例配置,并支持将OSS作为全量数据源使用。


二、产品快讯


【云栖2023】大模型时代的人工智能+大数据平台,加速创新涌现    

2023云栖大会上,阿里云副总裁、阿里云计算平台事业部负责人汪军华宣布阿里云人工智能+大数据平台升级发布,以及大数据AI产品全面完成Serverless化,致力于给客户提供开箱即用、按需付费的高性价比产品。作为大模型时代AI的基础设施,阿里云人工智能+大数据平台将坚定、持续的投入研发资源,服务各行各业的业务创新。

IMG_2934.HEIC.JPG


【云栖2023】林伟:大数据AI一体化的解读    

2023云栖大会上,阿里云研究员,阿里云计算平台事业部首席架构师,阿里云人工智能平台PAI和大数据开发治理平台DataWorks负责人林伟围绕“以模型为中心”和“以数据为中心”的模型开发方式演进、大数据AI一体化的应用场景、大数据AI一体化的技术实现对AI和大数据的一体化的演进过程进行解读。


【云栖2023】张治国:MaxCompute架构升级及开放性解读    

2023云栖大会上,阿里云智能计算平台研究员、阿里云MaxCompute负责人张治国提出MaxCompute4.0开放一体架构,围绕近实时,开放性、性价比、Data+AI一体化等多维度进行升级。


【云栖2023】王峰:开源大数据平台3.0技术解读    

2023云栖大会上,阿里云研究员,阿里云计算平台事业部开源大数据平台负责人王峰围绕新一代的流式湖仓、全面 Serverless 化、更智能的开源大数据多维度对开源大数据平台3.0的核心技术架构以及技术发展趋势展开分享。


【万字长文】基于阿里云PAI平台搭建知识库检索增强的大模型对话系统    

ChatGPT和通义千问等大语言模型(LLM),凭借其强大的自然语言处理能力,正引领着人工智能技术的革命。当前业界主流的解决方案是基于 LangChain,进行LLM检索增强并生成回复。基于原始的阿里云计算平台产技文档,搭建一套基于大模型检索增强答疑机器人的链路。本方案已在阿里云线上多个场景落地,将覆盖阿里云官方答疑群聊、研发答疑机器人、钉钉技术服务助手等。线上工单拦截率提升10+%,答疑采纳率70+%,显著提升答疑效率。


CV领域再创佳绩!阿里云机器学习平台 PAI 多篇论文入选 ICCV 2023    

近期,阿里云人工智能平台 PAI发表的多篇论文在ICCV 2023上入选。ICCV是国际计算机视觉大会是由电气和电子工程师协会每两年举办一次的研究大会。汇聚了来自世界各地的学者、工程师和研究人员,分享最新的计算机视觉研究成果和技术进展。阿里云PAI此次3篇文章入选ICCV 2023,意味着阿里云PAI在国际计算机视觉领域进一步提升了影响力。


阿里云人工智能平台 PAI扩散模型加速采样算法论文入选 CIKM 2023    

近日CIKM 2023上,阿里云人工智能平台PAI和华东师范大学陈岑副教授团队主导的扩散模型加速采样算法论文入选。论文提出了OLSS (Optimal Linear Subspace Search) 算法,这是一种针对扩散模型的采样加速算法。论文通过对扩散模型加速算法的本质被建模成线性子空间的扩张过程,给出了目前方法的统一分析,并基于此设计了新的加速算法,大幅度提升了扩散模型的生成速度。


三、产品学习指南


【客户案例】MaxCompute&人力家:借助Information Schema合理治理费用    

人力家是由阿里钉钉和人力窝共同投资成立,帮助客户进入人力资源数字化,依靠产品技术创新驱动战略的互联网公司。目前处于一个竞争激烈的市场环境中,针对这一问题,人力家借助Information Schema合理治理费用,满足了内部的数据需求,也在计算的成本上实现优化。


【最佳实践】基于阿里云OpenSearch搭建企业专属对话搜索系统    

本文将介绍如何使用OpenSearch 向量检索版和智能问答版,搭建灵活自定义的企业专属对话搜索系统。OpenSearch LLM智能问答版提供了多种LLM、向量化模型、切片模型等丰富的内置模型,帮助企业快速搭建专属对话式搜索服务。

相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
相关文章
|
1月前
|
存储 人工智能 安全
拔俗AI临床大数据科研分析平台:让医学研究更智能、更高效
阿里云原生AI临床大数据科研平台,打通异构医疗数据壁垒,实现智能治理、可视化分析与多中心安全协作,助力医院科研提速增效,推动精准医疗发展。
|
1月前
|
人工智能 Cloud Native 算法
拔俗云原生 AI 临床大数据平台:赋能医学科研的开发者实践
AI临床大数据科研平台依托阿里云、腾讯云,打通医疗数据孤岛,提供从数据治理到模型落地的全链路支持。通过联邦学习、弹性算力与安全合规技术,实现跨机构协作与高效训练,助力开发者提升科研效率,推动医学AI创新落地。(238字)
|
1月前
|
传感器 人工智能 监控
拔俗多模态跨尺度大数据AI分析平台:让复杂数据“开口说话”的智能引擎
在数字化时代,多模态跨尺度大数据AI分析平台应运而生,打破数据孤岛,融合图像、文本、视频等多源信息,贯通微观与宏观尺度,实现智能诊断、预测与决策,广泛应用于医疗、制造、金融等领域,推动AI从“看懂”到“会思考”的跃迁。
|
2月前
|
机器学习/深度学习 传感器 分布式计算
数据才是真救命的:聊聊如何用大数据提升灾难预警的精准度
数据才是真救命的:聊聊如何用大数据提升灾难预警的精准度
192 14
|
4月前
|
数据采集 分布式计算 DataWorks
ODPS在某公共数据项目上的实践
本项目基于公共数据定义及ODPS与DataWorks技术,构建一体化智能化数据平台,涵盖数据目录、归集、治理、共享与开放六大目标。通过十大子系统实现全流程管理,强化数据安全与流通,提升业务效率与决策能力,助力数字化改革。
167 4
|
3月前
|
机器学习/深度学习 运维 监控
运维不怕事多,就怕没数据——用大数据喂饱你的运维策略
运维不怕事多,就怕没数据——用大数据喂饱你的运维策略
153 0
|
4月前
|
分布式计算 DataWorks 数据处理
在数据浪潮中前行:记录一次我与ODPS的实践、思考与展望
本文详细介绍了在 AI 时代背景下,如何利用阿里云 ODPS 平台(尤其是 MaxCompute)进行分布式多模态数据处理的实践过程。内容涵盖技术架构解析、完整操作流程、实际部署步骤以及未来发展方向,同时结合 CSDN 博文深入探讨了多模态数据处理的技术挑战与创新路径,为企业提供高效、低成本的大规模数据处理方案。
297 3
|
4月前
|
SQL 人工智能 分布式计算
ODPS:数据浪潮中的成长与突围
本文讲述了作者在大数据浪潮中,通过引入阿里云ODPS体系(包括MaxCompute、DataWorks、Hologres)解决数据处理瓶颈、实现业务突破与个人成长的故事。从被海量数据困扰到构建“离线+实时”数据架构,ODPS不仅提升了数据处理效率,更推动了技术能力与业务影响力的双重跃迁。
|
2月前
|
传感器 人工智能 监控
数据下田,庄稼不“瞎种”——聊聊大数据如何帮农业提效
数据下田,庄稼不“瞎种”——聊聊大数据如何帮农业提效
142 14

相关产品

  • 云原生大数据计算服务 MaxCompute