大数据

首页 标签 大数据
# 大数据 #
关注
48942内容
Flink入坑指南 第四章:SQL中的经典操作Group By+Agg
Flink入坑指南系列文章,从实际例子入手,一步步引导用户零基础入门实时计算/Flink,并成长为使用Flink的高阶用户。 简介 Group By + Agg这个最经典的SQL使用方式。Group By是SQL中最基础的分组操作,agg的全称是aggregation(聚合操作),是一类SQL算子的统称,Flink中最常用的Agg操作有COUNT/SUM/AVG等,详情参见Flink支持的聚合操作列表。
阿里acp认证是什么 阿里acp认证含金量高吗
很多人互联网的从业人员有时候都不是清楚阿里acp认证是什么,阿里acp认证含金量高吗?做为一个企业推出的资格认证,阿里acp认证的含金量是很高的。由于阿里云在国内市场的领先地位,他们推出的认证资格在市场是很受欢迎和认可的。很多这个行业的从业人员都以拥有阿里acp认证为荣。认证大使和相关企业的招聘人员都认为,如果你获取了阿里acp认证后,你的相关方面的知识就一定是过硬了,是值得信赖的。
如何提高光伏发电效能异常检出效率的实践案例
国家能源安全,及双碳战略大背景下,光伏产业发展迅猛,累计装机容量增长迅速。随着装机规模的逐步增大,同时伴随着国家上网电价的政策补贴消退,行业逐步走向精细化运营,来保障企业利润。而运营成本主要是设备的折旧和运维成本,其中运维成本构成比例中,人员成本约占比约50%,测试设备占比约15%。 在一个光伏电站大概25年的生命周期中,运维成本是随着使用年限而增长的。是否可以解决好运维效率,关系到企业效益。
大数据之路:阿里巴巴大数据实践——OneData数据中台体系
OneData是阿里巴巴内部实现数据整合与管理的方法体系与工具,旨在解决指标混乱、数据孤岛等问题。通过规范定义、模型设计与工具平台三层架构,实现数据标准化与高效开发,提升数据质量与应用效率。
终于有人把数据倾斜讲清楚了
本文深入剖析大数据处理中的“数据倾斜”问题,从现象到本质,结合真实踩坑经历,讲解数据倾斜的成因、典型场景及四步精准定位方法,帮助开发者从根本上理解和解决这一常见难题。
| |
来自: 数据库
专访李飞飞 :从清华附中高材生到阿里飞刀,一口井钻出「云原生」
他初三上清华,如今是达摩院数据库首席科学家。李飞飞从学术界走向工业界,带领阿里云技术团队一手打造了云原生分布式数据库,让阿里「全面上云」的战役再下一城。今天,他用一口水井为我们道出了云原生!
图解机器学习 | 聚类算法详解
聚类是最常见的无监督学习算法。本文讲解聚类问题常见算法及用途,包括划分聚类的K-Means算法、K-Medoids算法,层次聚类的Single-Linkage 算法、Complete-Linkage算法,和DB-SCAN算法。
免费试用