开发者社区> 大数据与机器学习> 大数据计算 MaxCompute

大数据计算 MaxCompute

关注

MaxCompute(原ODPS)是一项面向分析的大数据计算服务,它以Serverless架构提供快速、全托管的在线数据仓库服务,消除传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,使您经济并高效的分析处理海量数据。

0
今日
8268
内容
12
活动
348207
关注
|
SQL 分布式计算 Java
|

MaxCompute 挑战使用SQL进行序列数据处理

MaxCompute 挑战使用SQL进行序列数据处理 --而不是用MR和函数

2840 1
|
存储 SQL 移动开发
|

Maxcompute造数据-方法详解

造一点模拟数据的方法

4061 0
|
分布式计算 MaxCompute 开发工具
|

【文档小窍门】填写用户反馈的正确姿势

在使用产品帮助文档过程中,遇到问题了?更加困惑了?莫慌,手把手教你如何摆好填写用户反馈的正确姿势,助力文档更好地为您服务~~~

1024 0
|
SQL 分布式计算 Java
|

UDF精简使用大全

在MaxCompute开发过程中,开发同学遇到的的一些复杂逻辑该如何处理,如何在MaxCompute开发不同场景下的UDF函数?带着这个问题,本文针对UDF的各方面内容做出介绍,其中涉及UDF对应不同语言的类型映射关系、以及对应UDF在重载、访问网络、引用表与资源、以及第三方包的使用为大家做出展示。

6362 0
|
存储 分布式计算 MaxCompute
|

使用MaxCompute LOAD命令批量导入OSS数据最佳实践—STS方式LOAD开启KMS加密OSS数据

MaxCompute使用load overwrite或load into命令将外部存储的数据(如:oss)导入到MaxCompute前的授权操作。

1178 0
|
存储 分布式计算 Cloud Native
|

数仓架构的持续演进与发展 — 云原生、湖仓一体、离线实时一体、SaaS模式

数据仓库概念从1990年提出,经过了四个主要阶段。从最初的数据库演进到数据仓库,到MPP架构,到大数据时代的数据仓库,再到今天的云原生的数据仓库。在不断的演进过程中,数据仓库面临着不同的挑战。

2701 0
|
存储 SQL 分布式计算
|

如何基于MaxCompute快速打通数据仓库和数据湖的湖仓一体实践

MaxCompute 是面向分析的企业级 SaaS 模式云数据仓库,以 Serverless 架构提供快速、全托管的在线数据仓库服务,消除了传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,使您可以经济并高效的分析处理海量数据。数以万计的企业正基于 MaxCompute 进行数据计算与分析,将数据高效转换为业务洞察。

2006 0
|
机器学习/深度学习 人工智能 分布式计算
|

MaxCompute 产品相关电子书合集(欢迎大家下载阅读~)

MaxCompute (原odps)是面向分析的企业级SaaS模式云数据仓库,以Serverless架构提供全托管的在线数据仓库服务,消除传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入。MaxCompute支持多种经典计算模型(批处理、机器学习、交互式分析等)和完善的企业管理功能,借助MaxCompute,用户可轻松集成和管理企业数据资产,简化数据平台架构,加速价值实现。

801 0
|
存储 分布式计算 大数据
|

MaxCompute非事务表如何更新数据

本文主要讲解如何通过insert overwrite更新数据

2117 0
|
SQL 分布式计算 Java
|

[JDBC] Kettle on MaxCompute 使用指南

Kettle是一款开源的ETL工具,纯Java实现,可以在Windows、Unix和Linux上运行,提供图形化的操作界面,可以通过拖拽控件的方式,方便地定义数据传输的拓扑 。基本讲介绍基于Kettle的MaxCompute插件实现数据上云。

3565 0
|
SQL 分布式计算 运维
|

Azkaban业务流程如何转化为DataWorks业务流程

用户在迁移上云的时候,需要将云下的的Azkaban任务迁移上云,之前通过用户在DataWroks一步步创建对应的业务流程,其转化难度和转化时间都是一定的成本和时间,但如何能做到省时省力的方式迁移,为此本文提供了使用迁移助手解决业务流程上云迁移的的问题,本文模拟Azkaban业务流程到入到DataWorks的操作过程,方便大家参阅。

1586 0
|
存储 机器学习/深度学习 SQL
|

深入解读:获得 2021 Forrester 全球云数仓卓越表现者的阿里云数据仓库

阿里云在最新发布的 The Forrester Wave™: Cloud Data Warehouse, Q1 2021 全球云数据仓库技术评比中进入卓越表现者象限,成为国内唯一入选厂商。本文针对 Forrester 的报告,结合阿里云的以 MaxCompute 为核心的云数仓产品,做一个详细的技术解读。

1685 0
|
SQL JSON 分布式计算
|

阿里云 MaxCompute 2021-3 月刊

2021年3月,MaxCompute管家等多项功能上新,快来一起看看吧。

1789 0
|
分布式计算 DataWorks 大数据
|

文档搜索So easy

本文为您介绍如何通过阿里云官网提供的搜索入口快速检索产品帮助文档。

1254 0
|
机器学习/深度学习 SQL 弹性计算
|

国内唯一,阿里云挺进 Forrester 全球云数据仓库卓越表现者象限

阿里云凭借产品现有能力、产品战略、市场表现三项优势,进入Forrester Wave 2021 Q1云数据仓库卓越表现者象限,成为入选此次评测的唯一中国厂商,并由竞争者象限跃升至卓越表现者象限。

1709 0
|
SQL 分布式计算 DataWorks
|

使用MaxCompute连接访问Hologres开发实践

很多客户使用MaxCompute和Hologres的集成方案同时满足大规模离线分析、实时运营分析、交互式查询及在线Serving等多业务场景。MaxCompute和Hologres之间支持相互读写对方数据,能够消除不必要的数据冗余,形成有效的数据分层并支持离线/实时统一视图和联合分析。本文重点介绍了MaxCompute如何访问Hologres数据的开发实践。

3961 1
|
SQL 存储 分布式计算
|

MaxCompute产品消费相关文章合集

MaxCompute (原odps)是面向分析的企业级SaaS模式云数据仓库,以Serverless架构提供全托管的在线数据仓库服务,消除传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入。MaxCompute支持多种经典计算模型(批处理、机器学习、交互式分析等)和完善的企业管理功能,借助MaxCompute,用户可轻松集成和管理企业数据资产,简化数据平台架构,加速价值实现。

878 0
|
SQL 分布式计算 运维
|

MaxCompute作业日常监控与运维实践

MaxCompute作业日常监控与运维实践

1874 0
|
SQL 分布式计算 运维
|

PyODPS如何确定运行在服务端还是客户端

本文主要讲解编写PyODPS代码时如何确定运行在服务端还是客户端

4760 0
|
存储 算法 NoSQL
|

No.1-时序数据库随笔 - Time Series DBMS 综述

这是一篇无法一口气读完的、文字过万[正文字数14390]的长文,这是一个无法中途不上厕所就看完的、关于时序数据库的视频[时长111分钟]分享的文字整理..

2504 0
|
机器学习/深度学习 分布式计算 运维
|

阿里云2021春招-通用计算平台实习生招聘ING...

MaxCompute(原ODPS)是一项面向分析的大数据计算服务,它以Serverless架构提供快速、全托管的在线数据仓库服务,消除传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,使您经济并高效的分析处理海量数据。阿里云机器学习和大数据分别进入IDC和Forrester领导者象限。

1107 0
|
分布式计算 监控 DataWorks
|

MaxCompute在电商场景中如何进行漏斗模型分析

本文以某电商案例为例,通过案例为您介绍如何使用离线计算并制作漏斗图。

4187 0
|
SQL 机器学习/深度学习 存储
|

阿里云 MaxCompute 2021-2 月刊

2021年2月,MaxCompute发布云数仓内的机器学习 MaxCompute SQLML功能,以及MaxCompute湖仓一体OSS数据湖集成方案等15项新功能,欢迎阅读产品2月刊了解新发功能详情。

5009 0
|
SQL 存储 分布式计算
|

【转载】一次 MySQL 千万级大表的优化过程

使用阿里云rds for MySQL数据库(就是MySQL5.6版本),有个用户上网记录表6个月的数据量近2000万,保留最近一年的数据量达到4000万,查询速度极慢,日常卡死,严重影响业务。老系统,当时设计系统的人大概是大学没毕业,表设计和SQL语句写的不仅仅是垃圾,简直无法直视。原开发人员都已离职,到我来维护,这就是传说中的维护不了就跑路,然后我就是掉坑的那个!!!

1853 0
|
存储 分布式计算 运维
|

阿里云 MaxCompute 2021-1 月刊

2021年1月,SaaS模式云数据仓库MaxCompute存储单价由梯度定价统一下调整为月固定单价,中小规模企业数据仓库存储成本最高降四成。

3698 0
|
SQL 存储 分布式计算
|

MaxCompute Tunnel 技术原理及开发实战

MaxCompute(原名ODPS)是一种快速、完全托管的EB级数据仓库解决方案, 致力于批量结构化数据的存储和计算,为用户提供数据仓库的解决方案及分析建模服务。Tunnel是MaxCompute提供的数据传输服务,提供高并发的离线数据上传下载服务,适合于全量数据或历史数据的批量导入, 并且在MaxCompute的客户端工具中,提供对应的命令实现本地文件与服务数据的互通。

7479 0
|
SQL 存储 分布式计算
|

MaxCompute消费预警与控制

MaxCompute(原名ODPS)是一种快速、完全托管的EB级数据仓库解决方案, 致力于批量结构化数据的存储和计算,为用户提供数据仓库的解决方案及分析建模服务,以及完善的数据导入方案和多种经典的分布式计算模型,帮助用户轻松完成大数据分析。目前,MaxCompute服务已覆盖全球16个国家和地区,为全球用户提供海量数据存储和计算服务。

3174 0
|
分布式计算 DataWorks 网络协议
|

MaxCompute中实现IPv4和IPv6地址归属地转换

大数据平台的成熟使得更多种类的非结构化、半结构化的数据分析成为可能。其中把IP地址转换为归属地又是极为常见的一种场景。本文将介绍在MaxCompute如何根据IPv4和IPv6地址实现归属地转换。

3981 0
|
数据采集 缓存 分布式计算
|

阿里云联合帆软发布企业级BI分析解决方案,解决数据应用难题

MaxCompute 是阿里云提供的云数据仓库服务,服务着数以万计的客户和阿里巴巴集团。MaxCompute 秉持兼容生态的开放技术路线,持续投入产品生态建设。本次将正式发布与帆软FineBI和FineReport官方集成,为双方用户提供更优质的数据分析体验。

3359 0
|
SQL 存储 分布式计算
|

MaxCompute消费监控最佳实践

MaxCompute计费方式有按量计费和包年包月,其中按量计费若使用不当,比较容易出现预料之外的高额消费产生,本文将结合阿里云提供的相关消费监控以及MaxCompute本身的消费监控/限制功能,介绍如何更好的进行MaxCompute按量计费消费监控和限制,更大程度的避免出现不必要的消费。

1897 0
|
SQL 存储 分布式计算
|

MaxCompute按量付费业务流程的计量明细统计

本文针对一个公司有多个部门,一个部门又含有多条业务,另外业务流程中可能包含MapReduce、Spark、SQL,但是如何统计其中一条的业务流程的计费信息。针对这一需求,本文采用的方案是:通过计量计费中获取当前所有project的在某一天的计费信息->采用DataWorks的API获取该project的业务流程下的所有nodeID->通过MaxCompute的SDK将数据写入到MaxCompute表中->最后使用SQL统计出一条业务流程的总的计费统计情况。

2161 0
|
分布式计算 MaxCompute
|

MaxCompute 行转列 列转行

搜了一下行转列、列转行,除了隐林一篇之外,好像没有了 最近在帮助项目组初学者整理初学者文档,刚好用关系型数据库的例子变化实现了一个 借鉴:https://developer.aliyun.com/article/40518 供大家参考

4108 0
|
分布式计算 DataWorks Java
|

MaxCompute Spark 使用和常见问题

本文将就MaxCompute Spark开发环境搭建、常用配置、作业迁移注意事项以及常见问题进行深入介绍。

4370 3
|
SQL 消息中间件 分布式计算
|

阿里云 MaxCompute 2020-12 月刊

2020年12月 MaxCompute 在查询加速、流式数据写入、消费限制、实时作业监控、元数据服务方面有最新发布,欢迎通过本月刊了解12月最新发布详情。

1960 0
|
机器学习/深度学习 算法 数据可视化
|

「直播回顾」Mars应用与最佳实践

本文首先对Mars的概念、功能、优势进行了介绍,随后,对Mars几个典型的应用场景进行介绍,并通过两个Demo展示了在使用Mars后数据科学性能的提升,最后总结了Mars的最佳实践,让使用Mars更高效便捷。

7033 0
|
机器学习/深度学习 分布式计算 数据可视化
|

「直播回顾」Mars:加速数据科学的新方式

本文从数据科学概念、背景和现状切入,引出加速数据科学的新方式Mars,并介绍了Mars具体能解决的一些问题和背后的逻辑、哲学,同时对Mars整体数据处理流程进行了介绍。

2914 0
|
SQL 资源调度 分布式计算
|

MaxCompute Logview2.0 参数详解与常见问题

Logview 2.0 原理与功能简介,Logview 2.0 分析问题作业讲解

4790 1
|
分布式计算 大数据 MaxCompute
|

2020阿里巴巴大数据技术公开课第五季 — SaaS模式云数据仓库MaxCompute开发实战与常见问题

MaxCompute(原ODPS)作为SaaS模式云数据仓库,以Serverless架构提供快速、全托管的在线数据仓库服务,消除传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,使您经济并高效的分析处理海量数据。

1052 0
|
消息中间件 分布式计算 运维
|

阿里云 MaxCompute 2020-11 月刊

2020年11月MaxCompute发布支持以RAM角色身份访问使用服务以及支持消息队列Kafka版通过Connector持续导入数据新功能,详情请查看本月刊内容。

5108 0
|
存储 分布式计算 DataWorks
|

玩物得志:效率为王 基于DataWorks+MaxCompute+Hologres 构建大数据平台

为了支撑业务的快速发展,玩物得志极少自己造轮子,会大量采用云平台提供的 SaaS、PaaS 服务。比如大数据体系是在阿里云 MaxCompute+DataWorks 框架体系上建设起来。使用了其核心存储、计算等组件,上层的可视化以及业务查询部分,在使用过程中也会有大量的定制化需求,玩物得志在开源方案的基础上进行了一些二次开发。

15311 0
|
SQL 分布式计算 运维
|

双11史上作业数最多,人工干预最少—MaxCompute 自适应执行引擎DAG2.0为1.5亿分布式作业提供自动化保障

阿里巴巴双11史上作业数最多,但人工干预最少的一次双11技术保障: 从动态并发调整带来的单日10亿计算节点的节省,到数据智能编排带来的高级基线单个作业数十个小时执行时间的缩短,再到全新Bubble执行模式在百万作业获取的30%以上的性能提升。 本文为大家介绍,在2020年阿里巴巴集团双11海量作业数目与突变的数据特性面前,阿里云MaxCompute 新一代 DAG 2.0 执行引擎,通过其自适应的动态执行能力和新架构上的全新计算模式,如何为双11大促数据的及时产出提供自动化保障。

6638 0
|
机器学习/深度学习 人工智能 分布式计算
|

阿里云机器学习PAI和大数据平台MaxCompute分别进入IDC和Forrester领导者象限

近日,全球权威研究机构Forrester、IDC分别发布《中国预测分析和机器学习Wave,2020Q4》和《Marketscape:中国大数据管理平台厂商评估,2020》报告,阿里云机器学习平台PAI和大数据平台MaxCompute分别位居领导者象限,且在战略维度上双双领先。

7641 0
|
SQL 分布式计算 DataWorks
|

SaaS模式云数据仓库 MaxCompute 问答整理之2020-09~10月

飞天大数据平台计算引擎MaxCompute成为全球首个TPCx-BB认证的公共云产品,是除Hive、Spark以外TPCx-BB第三个标准支持的大数据引擎。

6431 0
|
机器学习/深度学习 分布式计算 DataWorks
|

MaxCompute账号费用及任务耗时TOPN统计

很多数据开发者在使用MaxCompute开发过程中需要统计每个账号所属任务的费用使用情况以及每个任务耗时来做任务的合理性规划和调整。但是在使用MaxCompute的时候通常情况下大多数用户通过DataWorks标准模式下使用MaxCompute,这样在MaxCompute提供的元数据视图信息中将记录所有的生产作业执行账号为同一个主账号,只有小部分的开发作业执行账号为个人RAM子账号。那么如何去做到各个账户的费用分摊和任务时间成本的统计 是大部分MaxCompute使用者关注的问题。本文主要介绍如何通过MaxCompute元数据统计账号费用及任务耗时,同时定时通过钉钉推送到客户群。

5412 0
|
分布式计算 Cloud Native 双11
|

云原生实时数仓首次在2020双11核心数据场景落地

这是史上数据量、计算量最大的一年,是实时处理要求最高、与机器智能结合性最强的一次双11,也是全球最大规模的一次云原生实践。背后作为数据核心支撑的大数据平台更是创下新的世界纪录。

22901 0
|
存储 人工智能 分布式计算
|

【干货整理】MaxCompute 持续定义 SaaS 模式云数据仓库 — 2020阿里巴巴大数据技术公开课第四季

数据管理领域的技术演进以及云计算的蓬勃发展催生了基于云提供开箱即用的数据仓库服务的产品模式-Data Warehouse as a Service(DWaaS),最终用户无需关心基础设施、平台软件管理以及平台运维和优化升级工作。这部分工作由服务提供商完全托管并提供满足SLA要求的高质量服务,减少用户的前期投入并加速价值实现,让数据仓库服务回归服务的本质。阿里云MaxCompute正是基于云构建的SaaS模式的数据仓库服务。本季直播将重点从SaaS模式云数据仓库按需使用的核心能力-Serverless能力、"云数据仓库+价值场景" 两个方面做深入解读。

5276 0
|
SQL 存储 分布式计算
|

阿里云 MaxCompute 2020-10 月刊

MaxCompute10月新发布功能在sql的产品能力、易用性、性能以及存储优化方面持续增强,欢迎阅读月刊了解最新feature及用法。

14035 0
|
机器学习/深度学习 人工智能 分布式计算
|

开放下载!《SaaS模式云数据仓库实践手册》

本书的制作目的在于让MaxCompute帮助企业构建全托管的现代化数仓,简化数据洞察、加速价值实现。

44205 0
|
存储 机器学习/深度学习 分布式计算
|

用 Mars Remote API 轻松分布式执行 Python 函数

Mars 是一个并行和分布式 Python 框架,能轻松把单机大家耳熟能详的的 numpy、pandas、scikit-learn 等库,以及 Python 函数利用多核或者多机加速。这其中,并行和分布式 Python 函数主要利用 Mars Remote API。

23539 0
|
机器学习/深度学习 分布式计算 DataWorks
|

大数据上手实战!训练营“9营齐开”第二季限时免费报名啦

首期大数据“9营齐开”计划吸引了10000+开发者报名参与,成为今夏最火爆的大数据训练营!伴随着第一季训练营的完美落幕,大数据训练营“九营齐开”第二季已蓄势待发!

19872 0
我要发布