开发者社区> 大数据与机器学习> 大数据计算 MaxCompute

大数据计算 MaxCompute

关注

MaxCompute(原ODPS)是一项面向分析的大数据计算服务,它以Serverless架构提供快速、全托管的在线数据仓库服务,消除传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,使您经济并高效的分析处理海量数据。

0
今日
8268
内容
12
活动
348207
关注
|
数据可视化 关系型数据库 MySQL
|

课时1:Github实时数据分析与可视化

课时1:Github实时数据分析与可视化

522 0
|
SQL 分布式计算 监控
|

使用内置公开数据集快速体验MaxCompute

本教程会指导您基于MaxCompute提供的TPC-DS样例数据和GitHub公开事件样例数据,通过MaxCompute SQL分析,快速体验MaxCompute产品,完成开通、执行SQL语句查询数据。您无需进行数据同步,可直接上手体验数据分析。

430 1
|
SQL 存储 分布式计算
|

基于MaxCompute的热门话题分析

本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。

446 0
|
存储 JSON 分布式计算
|

MaxCompute半结构化数据思考与创新

本文将介绍MaxCompute在半结构化数据方面的一些思考与创新,围绕半结构化数据简析、传统方案优劣对比、MaxCompute半结构化数据解决方案、收益分析。

694 11
|
分布式计算 数据挖掘 调度
|

阿里云 MaxCompute 2023-5~8 月刊

【MaxCompute已发布免费试用计划,为数仓建设提速】新用户可0元领取5000CU*小时计算资源与100GB存储,有效期3个月。

695 2
|
弹性计算 分布式计算 网络性能优化
|

【VLDB 2023】基于预测的云资源弹性伸缩框架MagicScaler,实现“高QoS,低成本”双丰收

近日,由阿里云计算平台大数据基础工程技术团队主导,与计算平台MaxCompute团队、华东师范大学数据科学与工程学院、达摩院合作,基于预测的云计算平台资源弹性伸缩框架论文《MagicScaler: Uncertainty-aware, Predictive Autoscaling 》被数据库领域顶会VLDB 2023接收。

944 5
|
弹性计算 分布式计算 大数据
|

阿里云计算平台大数据基础工程技术论文入选 VLDB 2023

近日,在 VLDB 2023 上,由阿里云计算平台大数据基础工程技术团队主导,与计算平台 MaxCompute 团队、华东师范大学数据科学与工程学院、达摩院合作的论文入选 Industrial Track

749 0
|
数据采集 存储 消息中间件
|

《阿里大数据之路》读书笔记:总述

阿里数据体系主要分为数据采集、数据计算、数据服务和数据应用四大层次。

1253 0
|
人工智能 安全
|

复旦大学与阿里巴巴达成战略合作

复旦大学与阿里巴巴集团宣布双方达成全面战略合作,未来将在科研融合创新、科研合作、人才培养等领域展开深入合作,共同促进AI for Science从原始创新到应用落地的全链路发展。

483 2
|
SQL 存储 分布式计算
|

数仓架构“瘦身”,Hologres 5000CU时免费试用

Hologres基于创新的HSAP架构,可以将您原先数仓架构中的OLAP系统(Greenplum、Presto、Impala、ClickHouse)、KV数据库/Serving系统(HBase、Redis)统一在一个大数据计算引擎中,并提供快速的离线实时一体化分析能力。

283 0
|
大数据 数据挖掘 测试技术
|

数据项目交付小记:测试报告&公共层&中台组织

最近项目交付上遇到了一些问题,我把自己的回答和想法记录一下,分享给大家。

17358 1
|
SQL JSON 分布式计算
|

Maxcompute数据上云一致性比对

当把数据集成到Maxcompute上后,用户其实最关心的一个技术问题就是集成数据是否与源端一致,本文中介绍的一致性方案比对方案是基于阿里云多个大数据项目实际项目交付实践总结。

1077 0
|
数据采集 存储 人工智能
|

Maxcomputer表判定联系方式是否是正常的联系方式的两个方式

在数据预处理的过程中,手机号作为联系方式的一种重要形式,经常需要进行格式验证和去重等操作。然而,在实际应用中,我们常常遇到手机号格式不统一、线上业务还好点,但是有部分线下的业务手机号是手工录入的数据等问题。这些问题导致正则清洗的工作量很大,而且容易出现错误,影响数据的质量。为了解决这些问题,本文提出了一些可能的优化方案,希望能够为数据预处理工作提供一些参考。

459 0
|
SQL 数据采集 分布式计算
|

如何学习大数据计算maxcompute

学习大数据计算maxcompute需要掌握步骤

366 0
|
存储 分布式计算 运维
|

阿里云 MaxCompute 2023-1~4 月刊

MaxCompute 发布新人特惠免费试用规格,5000CU*H计算资源和100GB存储,3个月免费用,让您0元体验MaxCompute 强劲的产品力。

1267 0
|
存储 分布式计算 MaxCompute
|

MaxCompute 包年包月套餐与非预留计算资源将于北京时间2023年4月30日00:00:00停止续订

若您当前保有MaxCompute包年包月“特价套餐”(含“存储密集型160特价套餐”、“存储密集型320特价套餐”、“存储密集型600特价套餐”)或包年包月“非预留计算资源”,请您详细阅读本文。

441 0
|
SQL 数据采集 分布式计算
|

MaxCompute中如何处理异常字符

在处理数据时,当业务数据同步至MaxCompute后,会产生一些含异常字符的脏数据,比如字段中包含了一个不可见字符,在DataWorks中显示不出来,但在BI界面又会显示成其他字符,影响整体观感。这种情况,通常我们的解法是,将异常的字符洗掉,下面来介绍几种常见的处理异常字符的方法。

1058 0
|
存储 XML JSON
|

如何选择离线数据集成方案-全量&增量

如何选择数据离线集成方式,哪些表适合全量集成,哪些表适合增量集成

922 0
|
SQL 存储 运维
|

如何选择数据集成方式-离线&实时

如何在项目交付过程中合理经济的选择数据集成方案

1101 1
|
SQL 分布式计算 关系型数据库
|

来自DBMS大牛分享 - MapReduce: 一个巨大的倒退

前言 2011年历史的大数据&数据库论 databasecolumn 的数据库大牛们(其中包括PostgreSQL的最初伯克利领导:Michael Stonebraker)最近写了一篇评论当前如日中天的MapReduce 技术的文章,引发剧烈的讨论。我抽空在这儿翻译一些,一起学习。 译者注:这种 Tanenbaum vs. Linus 式的讨论自然会导致非常热烈的争辩。但是老实说,从 Tanenbaum vs. Linus 的辩论历史发展来看,Linux是越来越多地学习并以不同方式应用了 Tanenbaum 等 OS 研究者的经验(而不是背弃); 所以 MapReduce vs. DBMS

454 0
|
DataWorks
|

维度建模实践一例 (一) 维度还是事实

成本和单价是产品的维度还是事实表中的事实?来看看我对这个问题的思考与分享吧。

569 0
|
存储 机器学习/深度学习 人工智能
|

2022 世界互联网大会:阿里云 ODPS 入选世界互联网领先科技成果

ODPS(Open Data Platform and Service)是阿里云自研的一体化大数据计算平台和数据仓库产品,10 余年来持续迭代,提供了实时离线一体、流批一体、湖仓一体、大数据 AI 一体的多场景能力,是业界少有的完全自主研发,支持 10 万级服务器并行计算、百万级 CPU 可扩展大数据智能计算平台

444 0
|
SQL 存储 分布式计算
|

ODPS是什么/阿里云一体化大数据平台ODPS的前世今生

ODPS(Open Data Processing Service),原是阿里云从 09年开始自研的大规模批量计算引擎,2016 年更名为MaxCompute。2022云栖大会上,阿里云ODPS全新升级为一体化大数据平台,存储、调度、元数据一体化融合 ,从 Processing 升级为 Platform,即 Open Data Platform and Service。提供了离线计算、实时交互式分析、机器学习等可扩展的智能计算引擎,满足用户多元化数据计算需求。

2977 0
|
SQL 分布式计算 数据挖掘
|

阿里云 MaxCompute 2022-12月刊

本刊为您带来 2022年12月 MaxCompute 产品最新动态。

1023 0
|
存储 机器学习/深度学习 SQL
|

大数据&AI产品11月刊

大数据&AI产品技术月刊(2022年11月),涵盖本月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据&AI方面最新动态。

795 6
|
存储 SQL 分布式计算
|

阿里云 MaxCompute 2022-10月11月刊

本刊为您带来 2022年10月、11月 MaxCompute 产品最新动态。

955 0
|
存储 机器学习/深度学习 人工智能
|

大数据&AI产品10月刊

大数据&AI产品技术月刊(2022年10月),涵盖本月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据&AI方面最新动态。

753 0
|
SQL 弹性计算 运维
|

从共建到引领,阿里云开源大数据产品矩阵再升级

一体化大数据智能峰会上,回顾了阿里巴巴开源大数据技术十三载发展历程,从使用回馈到共建引领,兼容并蓄,持续创新。以及对开源大数据产品矩阵再次升级的分享。

1133 0
|
存储 SQL 人工智能
|

贾扬清演讲实录:阿里云一体化大数据智能平台的演进丨2022云栖一体化大数据智能峰会

贾扬清在一体化大数据智能峰会论坛上分享立足于数据这个领域,数据和智能之间创新的火花。

1739 35
|
运维 Kubernetes Cloud Native
|

《SREWorks 云原生数智运维工程实践》电子书重磅来袭!

本书将分为三个主题,共11章节,适合正在向云原生转型的技术老兵,也适合刚入行正在熟悉 k8s 的小白。推荐阅读完本书后配合 SREWorks 进行实践,效果更佳。让我们共同实践,共同努力,推动云原生时代早日到来。

648 0
|
分布式计算 Hadoop 数据挖掘
|

阿里云 MaxCompute 2022-9月刊

本刊为您带来 2022年9月 MaxCompute 产品最新动态

1486 0
|
分布式计算 DataWorks Cloud Native
|

六大能力,助力企业构建全托管的现代化数仓!阿里云云原生一体化数仓新能力解读训练营来袭!

简介: 离线实时一体、分析服务一体、湖仓一体、数据安全、数据建模、数据治理,六大热门主题,六位大数据专家,带你了解当前炙手可热的云数仓产品最新演进趋势。本期训练营带你走进阿里云云原生一体化数仓新能力!

1469 0
|
分布式计算 算法 MaxCompute
|

阿里云 MaxCompute 2022-8月刊

本刊为您带来 2022年8月 MaxCompute 产品最新动态。

1226 0
|
数据采集 运维 安全
|

构建数据中台的组织架构

著名管理大师钱德勒总结过一个黄金定律:战略决定组织,而组织决定成败。

7052 10
|
Oracle 数据挖掘 关系型数据库
|

浅谈数据仓库架构设计

简单的比较了一下数据中台架构与数据仓库、BI、DSS之间的关系,并对比了一下Bill Inmon和Ralph Kimball架构的差异。

2497 3
|
人工智能 分布式计算 Cloud Native
|

IDC:阿里云稳居中国大数据平台公有云市场第一位

8月4日消息,日前国际权威研究机构IDC发布了《中国大数据平台公有云服务市场份额概况,2021》,报告显示,阿里云稳居中国大数据平台公有云服务市场第一位,营收达14.9亿元。

2383 1
|
分布式计算 Cloud Native 数据挖掘
|

阿里云 MaxCompute 2022-7月刊

本刊为您带来 2022年7月 MaxCompute 产品最新动态及精彩活动回顾。

1119 0
|
SQL 机器学习/深度学习 分布式计算
|

阿里云 MaxCompute 2022-6月刊

2022年6月,MaxCompute包年包月规格支持查询加速、独占Quota、以及对单作业设置CU并发上限;同时MaxCompute支持在DataWorks公共表中查看外部数据源的元数据信息。

1492 0
|
数据采集 人工智能 分布式计算
|

大数据&AI产品月刊【2022年6月】

大数据&AI产品技术月刊(2022年6月),涵盖本月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据&AI方面最新动态。

1876 0
|
存储 消息中间件 缓存
|

SREWorks v1.2 版本发布 | 运维市场能力发布

在v1.1版本发布之后,SREWorks团队开始了常态化的功能版本迭代,v1.1提供了组件插拔能力,v1.2更进一步,将会发布规划已久的运维市场,助力团队构筑运维生态,也会发布诸多企业用户关注的纯内网源码构建方案。

840 0
|
SQL 存储 分布式计算
|

MaxCompute-UNION数据类型对齐的方法

怎么对齐两段union脚本的数据类型

1129 0
|
弹性计算 分布式计算 资源调度
|

模拟IDC spark读写MaxCompute实践

现有湖仓一体架构是以 MaxCompute 为中心读写 Hadoop 集群数据,有些线下 IDC 场景,客户不愿意对公网暴露集群内部信息,需要从 Hadoop 集群发起访问云上的数据。本文以 EMR (云上 Hadoop)方式模拟本地 Hadoop 集群访问 MaxCompute数据。

782 0
|
存储 分布式计算 DataWorks
|

如何正确的做增量加工

回到十多年前,增量加工这个方法并不是一种需要特别需要提出的方法,因为关系数据库的存储与计算性能十分有限(即便是MPP数据库平台也不是全都是做全量加工),增量加工是最普遍的方式。本文讲述了如何在MaxCompute上用与关系数据库的不同的方式做增量数据的加工。

1363 3
|
分布式计算 DataWorks Cloud Native
|

2022阿里云大数据公开课第一季 — 云原生一体化数仓产品新能力解读

为培育专业化、场景化的大数据解决方案,构建多层次的工业互联网平台、建设行业的大数据平台,阿里云整合自研大数据产品MaxCompute、DataWorks、Hologres,提出云原生一体化数仓,为企业提供一站式大数据处理平台。

775 0
|
机器学习/深度学习 人工智能 运维
|

大数据&AI产品月刊5月刊

大数据&AI产品技术月刊(2022年5月),涵盖本月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据&AI方面最新动态。

1988 11
|
机器学习/深度学习 分布式计算 Cloud Native
|

阿里云 MaxCompute 2022-4-5月刊合集

MaxCompute 按外表类型对外表计算独立计费;MaxCompute 湖仓一体法兰克福region商业化发布

1013 0
|
分布式计算 DataWorks Cloud Native
|

阿里云云原生一体化数仓入选 2022数博会“十佳大数据案例”

2022年5月26日,中国国际大数据产业博览会(以下简称“数博会”)在贵阳召开,数博会“十佳大数据案例”揭晓,阿里云云原生一体化数仓入选。阿里云云原生一体化数仓可以解决企业在建设大数据平台中对时效性、准确性、性价比、非结构化数据处理,通过精简的架构,支撑分析决策、异构大数据平台之上的全域数据分析需求。

1391 0
|
存储 SQL 分布式计算
|

MaxCompute 公共云多租户设计的技术要点详解及产品实现特色

公共云大数据平台在多租户的设计和实现方式上有所差异。本文主要介绍在公共云大数据平台的多租实现方案中需要考虑的问题和挑战,重点介绍了MaxCompute在计算和存储多租实现上的特点。期望通过这些介绍来让大家了解大数据云平台多租方案需要关注的技术点和MaxCompute在多租实现上的产品特色。

1316 1
|
机器学习/深度学习 人工智能 自然语言处理
|

大数据&AI产品月刊【2022年4月】

大数据&AI产品技术月刊(2022年4月),涵盖本月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据&AI方面最新动态。

2249 1
|
SQL 数据采集 分布式计算
|

【转载】大数据在线离线一体化解决方案最佳实践

本文重点介绍大数据产品集通用解决方案,即大数据在线计算+离线计算一体化解决方案,并通过真实案例模拟来说明此通用解决方案在具体项目中是如何落地的。

16721 0
我要发布