三分钟教你学会分析MaxCompute消费明细

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介: 很多用户经常被MaxCompute收费所困扰,比如执行了一条 select xxx from yyy 然后扣费1元 ,不知道如何查询到明细,也无法做优化。 接下来,我来教大家学习如何通过控制台消费功能查看你在MaxCompute(DataWorks/Studio)中的每一条SQL/MR计算、存储、下载的消费明细。

很多用户经常被MaxCompute收费所困扰,比如执行了一条 select xxx from yyy 然后扣费1元 ,使用了机器学习后扣了1分钱,不知道如何查询到明细,也无法做优化。

接下来,我来教大家学习如何通过控制台消费功能查看你在MaxCompute(DataWorks/Studio)中每一条SQL/MR计算、存储、下载的消费明细。

概要:

场景1,查看昨天的收费情况
场景2,分析某一天计算收费“贵“原因

场景3,分析存储收取1分钱的原因

场景4,分析数据上传和下载是否产生了费用

场景5,分析“不足一天”的数据存储费用

场景6,分析"消费贵"的MR计算费用


cff0c40c580c2460f701c9896ebcb919474d834f


场景1,查看昨天的收费情况


出账后,通过控制台消费明细来查看。


出账时间:

预付费出账单时间次日12点

后付费出账单时间是次日9点


step1 进入阿里云控制台-消费,https://expense.console.aliyun.com/#/

step2 打开消费总览,看到当月账单。

bd01ab276680b343c0bc5eaa0a70290ba96d59b0


step3 点击左侧消费明细,根据产品分类Maxcompute及时间来筛选昨天的消费金额,https://expense.console.aliyun.com/#/consumption/list/flow/afterpay

a2d9a70a11ffd83f925090cb5f5487e0bb587968


step4 点击详情,展开每个项目的消费情况,查看有无“贵”收费

b6bb8ed60c99a94bdf85b4cd1d7823a6ba6f2d09

如发现“贵“的项目,可根据存储、计算、下载几个场景对应到下面的解决方法。


场景2,分析某一天计算收费“贵“原因


通过导出使用记录,分析消费多的作业instance具体情况。


ca2b409604464aef5720c9ab173def56b724c26e


step1 打开消费明细后,看到账单异常后,请到左侧消费记录下载导出使用记录。

a975fb98163160f9a43961cdf7241bb74461230e


step2下载记录后,打开excel表,数据分类 ComputationSql代表SQL计算项 定位异常数据的instanceid。
比如,计量信息编号20171106100629865g4iplf9这个SQL任务,产生的费用是SQL读取量(7352600872Byte/1024/1024/1024)*SQL复杂度 1 * 0.3元/GB/复杂度=2元 ,计算公式参考官网:https://help.aliyun.com/document_detail/27989.html?spm=5176.product27797.6.559.QL7dYV#h2-u6309u91CFu540Eu4ED8u8D39

ec020770b80bd08cc2f590907dd6f64fd1345f0a


step3 查看这个“贵”instanceID 的logview

【获取logview信息】wait 20171106100629865g4iplf9  或者 【快速查看SQL语句】desc instance 20171106100629865g4iplf9

22b4eb00118952b051e64f2b20400354b874a031

step4 通过Logview我们发现产生了全表扫描、长尾计算等问题,及时优化我们的SQL/MR作业。

7675c02a43a0cc2e9e40cde46f055703fe0df01b

长尾优化参考:


场景3,分析存储收取1分钱的原因

通过导出使用记录,分析消费多的存储Storage明细。

step1 下载记录后,打开excel表。

65c1a3969db948369828e2deb04930936a279207


step2 查看数据分类中的Storage存储计费项,会发现在yinlin_test_huabei2_io Project下存储了384字节数据。
按照官网存储定价规则,存储(384 Byte /1024/1024/1024)*0.0192元/GB<0.01元,但官网提到小于等于512M数据最低收取1分钱 。计算公式参考官网: https://help.aliyun.com/document_detail/27989.html?spm=5176.product27797.6.559.QL7dYV#h1-u5B58u50A8u8BA1u8D39

92b88a035d11fac086156815b4945f3592f7dc03

step3 如果这份数据是用来测试的,你可以通过IDE删除Project下的表数据。


场景4,分析数据上传和下载是否产生了费用

部分用户总担心数据同步会产生费用,我们可以通过分析账单来解决。


step1 点击消费明细详情,查看上行、下载有无收费。

我们可以看到收费明细里面并没有上行(UploadIn,UploadEx)计费项,所以用户不必担心数据上传产生了费用。

同时,我们看到了下载产生了0.028元。

67531c72971138f811bbabfbb414cbe6be4fbb8d

step2 通过导出使用记录,分析消费多的下载消耗明细,数据分类DownloadEx代表公网下载计费项

0557e5f98bf1f7388b3cb5b17109ba26b9d22367

step3 可以看到公网下行流量产生了一条约0.036GB(38199736byte)的下行流量,根据官网收费标准,38199736byte/1024/1024/1024)*0.8 元/GB=0.028元。计费公式参考:https://help.aliyun.com/document_detail/27989.html?spm=5176.product27797.6.559.QL7dYV#h1-u4E0Bu8F7Du8BA1u8D39


step4 下行优化


a 查看你的tunnel设置的service,是否设置成了公共网络。参考:https://help.aliyun.com/document_detail/34951.html

b 如果你本地在苏州,Region在华东2上海,那么你可以先通过华东2的ECS把数据下载到虚机,然后利用ECS包月下载资源。


场景5,分析“不足一天”的数据存储费用


通过导出使用记录,分析存储Storage明细。

step1 下载记录后,打开excel表。

c8222ab07eb1c3ff26fd643ba6646dd04f5bdd69

step2 查看数据分类中的Storage存储计费项,会发现在alian Project下存储了 333507833900 字节数据,由于是8点上传的数据,所以从9:07点开始计量存储费用,一共计量15小时,注意:天计量范围以结束时间为准,所以最后一条数据不包括在4月4号账单中。
按照官网存储定价规则,

先计算24小时存储价格,

100GB*0.0192 元/GB/天

+(333507833900 Byte/1024/1024/1024-100)GB*0.0096 元/GB/天

=1.92+2.02=3.94元/天
再根据实际存储15小时计算,3.94*15/24=2.46元/天


场景6,分析"消费贵"的MR计算费用

通过导出使用记录,分析消费贵的MR计算作业。

step1 下载记录后,打开excel表。

72240d6c3e8f45ca94dc6801d1fe8d4354f742e9

step2 数据分类 MapReduce代表MR计算项 定位异常数据的instanceid,对应到计量信息编号。
比如,计量信息编号20171031142154750gyz2qqet这个MR任务,产生的费用是114000Core*Second/3600*0.46计算时/元=14.57元 ,计算公式参考官网:https://help.aliyun.com/document_detail/27989.html

总结:通过上述几个场景,带大家学习MaxCompute账单的分析方法,希望能够帮到更多的用户。


MaxCompute招聘信息:DT时代,与坚持梦想者同行!

阿里巴巴大数据-玩家社区 https://yq.aliyun.com/teams/6/

---阿里大数据博文,问答,社群,实践,有朋自远方来,不亦说乎……

bba01b493e1c5d904e882b1c380673c6ebe49a98

 

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps&nbsp;
目录
相关文章
|
16天前
|
分布式计算 Hadoop 大数据
Jupyter 在大数据分析中的角色
【8月更文第29天】Jupyter Notebook 提供了一个交互式的开发环境,它不仅适用于 Python 编程语言,还能够支持其他语言,包括 Scala 和 R 等。这种多语言的支持使得 Jupyter 成为大数据分析领域中非常有价值的工具,特别是在与 Apache Spark 和 Hadoop 等大数据框架集成方面。本文将探讨 Jupyter 如何支持这些大数据框架进行高效的数据处理和分析,并提供具体的代码示例。
25 0
|
2天前
|
存储 大数据 测试技术
用于大数据分析的数据存储格式:Parquet、Avro 和 ORC 的性能和成本影响
在大数据环境中,数据存储格式直接影响查询性能和成本。本文探讨了 Parquet、Avro 和 ORC 三种格式在 Google Cloud Platform (GCP) 上的表现。Parquet 和 ORC 作为列式存储格式,在压缩和读取效率方面表现优异,尤其适合分析工作负载;Avro 则适用于需要快速写入和架构演化的场景。通过对不同查询类型(如 SELECT、过滤、聚合和联接)的基准测试,本文提供了在各种使用案例中选择最优存储格式的建议。研究结果显示,Parquet 和 ORC 在读取密集型任务中更高效,而 Avro 更适合写入密集型任务。正确选择存储格式有助于显著降低成本并提升查询性能。
21 1
用于大数据分析的数据存储格式:Parquet、Avro 和 ORC 的性能和成本影响
|
9天前
|
存储 大数据 数据挖掘
【数据新纪元】Apache Doris:重塑实时分析性能,解锁大数据处理新速度,引爆数据价值潜能!
【9月更文挑战第5天】Apache Doris以其卓越的性能、灵活的架构和高效的数据处理能力,正在重塑实时分析的性能极限,解锁大数据处理的新速度,引爆数据价值的无限潜能。在未来的发展中,我们有理由相信Apache Doris将继续引领数据处理的潮流,为企业提供更快速、更准确、更智能的数据洞察和决策支持。让我们携手并进,共同探索数据新纪元的无限可能!
52 11
|
17天前
|
分布式计算 数据可视化 大数据
Vaex :突破pandas,快速分析100GB大数据集
Vaex :突破pandas,快速分析100GB大数据集
|
15天前
|
大数据 机器人 数据挖掘
这个云ETL工具配合Python轻松实现大数据集分析,附案例
这个云ETL工具配合Python轻松实现大数据集分析,附案例
|
16天前
|
数据采集 人工智能 安全
AI大数据处理与分析实战--体育问卷分析
本文是关于使用AI进行大数据处理与分析的实战案例,详细记录了对深圳市义务教育阶段学校“每天一节体育课”网络问卷的分析过程,包括数据概览、交互Prompt、代码处理、年级和学校维度的深入分析,以及通过AI工具辅助得出的分析结果和结论。
|
18天前
|
消息中间件 前端开发 安全
第三方数据平台技术选型分析
这篇文章分析了第三方数据平台的技术选型,涵盖了移动统计平台、自助分析平台和BI平台的不同代表厂商,讨论了它们的数据源、使用要求和适用场景。
31 2
|
19天前
|
存储 JSON 关系型数据库
MySQL与JSON的邂逅:开启大数据分析新纪元
MySQL与JSON的邂逅:开启大数据分析新纪元
|
20天前
|
存储 SQL 分布式计算
Hadoop生态系统概述:构建大数据处理与分析的基石
【8月更文挑战第25天】Hadoop生态系统为大数据处理和分析提供了强大的基础设施和工具集。通过不断扩展和优化其组件和功能,Hadoop将继续在大数据时代发挥重要作用。
|
14天前
|
存储 分布式计算 数据处理
MaxCompute 的成本效益分析与优化策略
【8月更文第31天】随着云计算技术的发展,越来越多的企业选择将数据处理和分析任务迁移到云端。阿里云的 MaxCompute 是一款专为海量数据设计的大规模数据仓库平台,它不仅提供了强大的数据处理能力,还简化了数据管理的工作流程。然而,在享受这些便利的同时,企业也需要考虑如何有效地控制成本,确保资源得到最优利用。本文将探讨如何评估 MaxCompute 的使用成本,并提出一些优化策略以降低费用,提高资源利用率。
14 0

热门文章

最新文章

相关产品

  • 云原生大数据计算服务 MaxCompute