大数据计算MaxCompute可以进行标准差的计算吗?我最近研究了一下transaction 2.0表的小文件和存储,你可以作为参考。其实底层的存储逻辑应该不会透出的很细致,实际存储的话还是建议看收费明细。1. 首先我大概测试了一下合并transaction 2.0表的小文件,发现合并命令的运行日志中会打印出合并效果,比如起始file num=99,合并后为17;随机用desc extended命令看了下,file num=133,不减反增了。2. 这个情况我咨询了下研发,对于transaction 2.0表desc结果中的file num包含了历史版本的文件,因为transaction 2.0表 会对历史版本保留一段时间;而即使被合并的表小文件最终是多少,可以在合并日志中看到明细。所以结论:最新版本的按合并日志来看,普通全量查询只会查询到最新版本。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
MaxCompute提供了统计函数来计算标准差。你可以使用stddev
函数来计算标准差。
下面是一个示例:
SELECT stddev(column_name) FROM your_table;
在上述示例中,将column_name
替换为你要计算标准差的列名,your_table
替换为你要进行计算的表名。
关于你提到的Transaction 2.0表的小文件和存储情况,确实底层的存储逻辑不会直接透露给用户。根据你的描述,合并命令的运行日志会打印出合并效果,这可以作为参考来了解合并操作的影响。
同时,在Transaction 2.0表的desc extended
结果中,包含了历史版本的文件数量,因为Transaction 2.0表会保留一段时间的历史版本。而合并日志会显示被合并的小文件的详细信息。
根据你的结论,普通全量查询只会查询到最新版本的数据,这与Transaction 2.0表的设计和工作原理相符。
请注意,MaxCompute的具体存储细节可能会因版本、配置和实际使用情况而有所不同。如果需要更详细的存储和收费明细,建议查看相关文档或联系MaxCompute提供商获取准确信息。
标准差看看STDDEV这个函数呢
https://help.aliyun.com/zh/maxcompute/user-guide/aggregate-functions?spm=a2c4g.11186623.0.i58#section-gg5-dv1-wdb,此回答整理自钉群“MaxCompute开发者社区2群”
MaxCompute(原ODPS)是一项面向分析的大数据计算服务,它以Serverless架构提供快速、全托管的在线数据仓库服务,消除传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,使您经济并高效的分析处理海量数据。