三分钟教你学会分析MaxCompute消费明细

简介: 很多用户经常被MaxCompute收费所困扰,比如执行了一条 select xxx from yyy 然后扣费1元 ,不知道如何查询到明细,也无法做优化。 接下来,我来教大家学习如何通过控制台消费功能查看你在MaxCompute(DataWorks/Studio)中的每一条SQL/MR计算、存储、下载的消费明细。

很多用户经常被MaxCompute收费所困扰,比如执行了一条 select xxx from yyy 然后扣费1元 ,使用了机器学习后扣了1分钱,不知道如何查询到明细,也无法做优化。

接下来,我来教大家学习如何通过控制台消费功能查看你在MaxCompute(DataWorks/Studio)中每一条SQL/MR计算、存储、下载的消费明细。

概要:

场景1,查看昨天的收费情况
场景2,分析某一天计算收费“贵“原因

场景3,分析存储收取1分钱的原因

场景4,分析数据上传和下载是否产生了费用

场景5,分析“不足一天”的数据存储费用

场景6,分析"消费贵"的MR计算费用


cff0c40c580c2460f701c9896ebcb919474d834f


场景1,查看昨天的收费情况


出账后,通过控制台消费明细来查看。


出账时间:

预付费出账单时间次日12点

后付费出账单时间是次日9点


step1 进入阿里云控制台-消费,https://expense.console.aliyun.com/#/

step2 打开消费总览,看到当月账单。

bd01ab276680b343c0bc5eaa0a70290ba96d59b0


step3 点击左侧消费明细,根据产品分类Maxcompute及时间来筛选昨天的消费金额,https://expense.console.aliyun.com/#/consumption/list/flow/afterpay

a2d9a70a11ffd83f925090cb5f5487e0bb587968


step4 点击详情,展开每个项目的消费情况,查看有无“贵”收费

b6bb8ed60c99a94bdf85b4cd1d7823a6ba6f2d09

如发现“贵“的项目,可根据存储、计算、下载几个场景对应到下面的解决方法。


场景2,分析某一天计算收费“贵“原因


通过导出使用记录,分析消费多的作业instance具体情况。


ca2b409604464aef5720c9ab173def56b724c26e


step1 打开消费明细后,看到账单异常后,请到左侧消费记录下载导出使用记录。

a975fb98163160f9a43961cdf7241bb74461230e


step2下载记录后,打开excel表,数据分类 ComputationSql代表SQL计算项 定位异常数据的instanceid。
比如,计量信息编号20171106100629865g4iplf9这个SQL任务,产生的费用是SQL读取量(7352600872Byte/1024/1024/1024)*SQL复杂度 1 * 0.3元/GB/复杂度=2元 ,计算公式参考官网:https://help.aliyun.com/document_detail/27989.html?spm=5176.product27797.6.559.QL7dYV#h2-u6309u91CFu540Eu4ED8u8D39

ec020770b80bd08cc2f590907dd6f64fd1345f0a


step3 查看这个“贵”instanceID 的logview

【获取logview信息】wait 20171106100629865g4iplf9  或者 【快速查看SQL语句】desc instance 20171106100629865g4iplf9

22b4eb00118952b051e64f2b20400354b874a031

step4 通过Logview我们发现产生了全表扫描、长尾计算等问题,及时优化我们的SQL/MR作业。

7675c02a43a0cc2e9e40cde46f055703fe0df01b

长尾优化参考:


场景3,分析存储收取1分钱的原因

通过导出使用记录,分析消费多的存储Storage明细。

step1 下载记录后,打开excel表。

65c1a3969db948369828e2deb04930936a279207


step2 查看数据分类中的Storage存储计费项,会发现在yinlin_test_huabei2_io Project下存储了384字节数据。
按照官网存储定价规则,存储(384 Byte /1024/1024/1024)*0.0192元/GB<0.01元,但官网提到小于等于512M数据最低收取1分钱 。计算公式参考官网: https://help.aliyun.com/document_detail/27989.html?spm=5176.product27797.6.559.QL7dYV#h1-u5B58u50A8u8BA1u8D39

92b88a035d11fac086156815b4945f3592f7dc03

step3 如果这份数据是用来测试的,你可以通过IDE删除Project下的表数据。


场景4,分析数据上传和下载是否产生了费用

部分用户总担心数据同步会产生费用,我们可以通过分析账单来解决。


step1 点击消费明细详情,查看上行、下载有无收费。

我们可以看到收费明细里面并没有上行(UploadIn,UploadEx)计费项,所以用户不必担心数据上传产生了费用。

同时,我们看到了下载产生了0.028元。

67531c72971138f811bbabfbb414cbe6be4fbb8d

step2 通过导出使用记录,分析消费多的下载消耗明细,数据分类DownloadEx代表公网下载计费项

0557e5f98bf1f7388b3cb5b17109ba26b9d22367

step3 可以看到公网下行流量产生了一条约0.036GB(38199736byte)的下行流量,根据官网收费标准,38199736byte/1024/1024/1024)*0.8 元/GB=0.028元。计费公式参考:https://help.aliyun.com/document_detail/27989.html?spm=5176.product27797.6.559.QL7dYV#h1-u4E0Bu8F7Du8BA1u8D39


step4 下行优化


a 查看你的tunnel设置的service,是否设置成了公共网络。参考:https://help.aliyun.com/document_detail/34951.html

b 如果你本地在苏州,Region在华东2上海,那么你可以先通过华东2的ECS把数据下载到虚机,然后利用ECS包月下载资源。


场景5,分析“不足一天”的数据存储费用


通过导出使用记录,分析存储Storage明细。

step1 下载记录后,打开excel表。

c8222ab07eb1c3ff26fd643ba6646dd04f5bdd69

step2 查看数据分类中的Storage存储计费项,会发现在alian Project下存储了 333507833900 字节数据,由于是8点上传的数据,所以从9:07点开始计量存储费用,一共计量15小时,注意:天计量范围以结束时间为准,所以最后一条数据不包括在4月4号账单中。
按照官网存储定价规则,

先计算24小时存储价格,

100GB*0.0192 元/GB/天

+(333507833900 Byte/1024/1024/1024-100)GB*0.0096 元/GB/天

=1.92+2.02=3.94元/天
再根据实际存储15小时计算,3.94*15/24=2.46元/天


场景6,分析"消费贵"的MR计算费用

通过导出使用记录,分析消费贵的MR计算作业。

step1 下载记录后,打开excel表。

72240d6c3e8f45ca94dc6801d1fe8d4354f742e9

step2 数据分类 MapReduce代表MR计算项 定位异常数据的instanceid,对应到计量信息编号。
比如,计量信息编号20171031142154750gyz2qqet这个MR任务,产生的费用是114000Core*Second/3600*0.46计算时/元=14.57元 ,计算公式参考官网:https://help.aliyun.com/document_detail/27989.html

总结:通过上述几个场景,带大家学习MaxCompute账单的分析方法,希望能够帮到更多的用户。


MaxCompute招聘信息:DT时代,与坚持梦想者同行!

阿里巴巴大数据-玩家社区 https://yq.aliyun.com/teams/6/

---阿里大数据博文,问答,社群,实践,有朋自远方来,不亦说乎……

bba01b493e1c5d904e882b1c380673c6ebe49a98

 

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps&nbsp;
目录
相关文章
|
21天前
|
存储 消息中间件 监控
【Flume】Flume在大数据分析领域的应用
【4月更文挑战第4天】【Flume】Flume在大数据分析领域的应用
|
1月前
|
Cloud Native 数据处理 云计算
探索云原生技术在大数据分析中的应用
随着云计算技术的不断发展,云原生架构作为一种全新的软件开发和部署模式,正逐渐引起企业的广泛关注。本文将探讨云原生技术在大数据分析领域的应用,介绍其优势与挑战,并探讨如何利用云原生技术提升大数据分析的效率和可靠性。
|
1月前
|
存储 消息中间件 大数据
Go语言在大数据处理中的实际应用与案例分析
【2月更文挑战第22天】本文深入探讨了Go语言在大数据处理中的实际应用,通过案例分析展示了Go语言在处理大数据时的优势和实践效果。文章首先介绍了大数据处理的挑战与需求,然后详细分析了Go语言在大数据处理中的适用性和核心技术,最后通过具体案例展示了Go语言在大数据处理中的实际应用。
|
1月前
|
数据采集 运维 数据挖掘
API电商接口大数据分析与数据挖掘 (商品详情店铺)
API接口、数据分析以及数据挖掘在商品详情和店铺相关的应用中,各自扮演着重要的角色。以下是关于它们各自的功能以及如何在商品详情和店铺分析中协同工作的简要说明。
|
3月前
|
关系型数据库 MySQL Serverless
高顿教育:大数据抽数分析业务引入polardb mysql serverless
高顿教育通过使用polardb serverless形态进行数据汇总,然后统一进行数据同步到数仓,业务有明显高低峰期,灵活的弹性伸缩能力,大大降低了客户使用成本。
|
3月前
|
机器学习/深度学习 数据采集 算法
大数据分析技术与方法探究
在当今信息化时代,数据量的增长速度远快于人类的处理能力。因此,如何高效地利用大数据,成为了企业和机构关注的焦点。本文将从大数据分析的技术和方法两个方面进行探究,为各行业提供更好的数据应用方向。
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
大数据分析的技术和方法:从深度学习到机器学习
大数据时代的到来,让数据分析成为了企业和组织中不可或缺的一环。如何高效地处理庞大的数据集并且从中发现潜在的价值是每个数据分析师都需要掌握的技能。本文将介绍大数据分析的技术和方法,包括深度学习、机器学习、数据挖掘等方面的应用,以及如何通过这些技术和方法来解决实际问题。
52 2
|
3月前
|
机器学习/深度学习 人工智能 运维
大数据分析:探索信息世界的钥匙
在当今信息爆炸的时代,大数据分析成为挖掘宝藏般的技术和方法。本文将介绍大数据分析的基本概念、技术与方法,并探讨其在商业、科学和社会领域中的广泛应用。从数据收集和预处理到模型构建和结果解读,大数据分析为我们揭示了信息世界的钥匙,为决策者提供了有力的支持。
|
2月前
|
API
GEE案例分析——利用sentinel-3数据计算空气污染指数(Air Pollution Index,简称API)
GEE案例分析——利用sentinel-3数据计算空气污染指数(Air Pollution Index,简称API)
108 0
|
3月前
|
数据挖掘
离线大数据分析的应用
离线大数据分析的应用

相关产品

  • 云原生大数据计算服务 MaxCompute