开发者社区大数据文章正文

第五期轻松入门学习大数据学习报告

2022-03-04 234

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 离线数据分析；阿里云Elasticsearch 智能运维商品推荐湖仓一体日志全观测

第一课学习了通过EMR集群，如何使用hive从hadoop批量导入数据，然后做离线数据分析
第二课学习了如何创建阿里云Elasticsearch集群，学习了nginx服务，以及数据采集，配置分析看板，体验采集，分析全流程
第三课学习了通过阿里云PAI平台搭建基于协同过滤算法的商品推荐系统，体验了从基础数据，然后数据分析，到推荐结果流程
第四课老师带领学习了快速搭建企业数据中台，以及数据入湖，存储和管理，探索和分析
第五课老师带领学习了基于Elasticsearch+Fink的日志全观测最佳实践，学习了日志agent,存储和分析的大致介绍，以及阿里云基于这方面的优点

文章标签：

云原生大数据计算服务 MaxCompute

应用服务中间件

数据挖掘

搜索推荐

分布式计算

SQL

nginx

Hadoop

HIVE

算法

存储

关键词：

入门云原生大数据计算服务 MaxCompute

云原生大数据计算服务 MaxCompute入门

云原生大数据计算服务 MaxCompute学习

学习云原生大数据计算服务 MaxCompute

入门学习云原生大数据计算服务 MaxCompute

相关实践学习

基于MaxCompute的热门话题分析

Apsara Clouder大数据专项技能认证配套课程：基于MaxCompute的热门话题分析

pengzezhou007

Echo_Wish

8月前

数据采集分布式计算大数据

不会Python，还敢说搞大数据？一文带你入门大数据编程的“硬核”真相

Echo_Wish

184 1 2

青云交（Java大数据AI云原生Python）

9月前

本文系统阐述 Java 大数据技术在智能教育学习社区中的深度应用，涵盖数据采集架构、核心分析算法、活跃度提升策略及前沿技术探索，为教育数字化转型提供完整技术解决方案。

青云交（Java大数据AI云原生Python）

371 10 10

游客vwx7bav3mqbk6

7月前

SQL 分布式计算大数据

SparkSQL 入门指南：小白也能懂的大数据 SQL 处理神器

在大数据处理的领域，SparkSQL 是一种非常强大的工具，它可以让开发人员以 SQL 的方式处理和查询大规模数据集。SparkSQL 集成了 SQL 查询引擎和 Spark 的分布式计算引擎，使得我们可以在分布式环境下执行 SQL 查询，并能利用 Spark 的强大计算能力进行数据分析。

游客vwx7bav3mqbk6

1034 0 0

Echo_Wish

11月前

数据采集数据可视化大数据

Python入门修炼：开启你在大数据世界的第一个脚本

Echo_Wish

214 6 6

zzy的aly

数据采集数据可视化大数据

大数据体系知识学习（三）：数据清洗_箱线图的概念以及代码实现

这篇文章介绍了如何使用Python中的matplotlib和numpy库来创建箱线图，以检测和处理数据集中的异常值。

zzy的aly

434 1 1

小Lee

存储 SQL 分布式计算

大数据学习

【10月更文挑战第15天】

小Lee

365 1 1

zzy的aly

分布式计算大数据 Linux

大数据体系知识学习（二）：WordCount案例实现及错误总结

这篇文章介绍了如何使用PySpark进行WordCount操作，包括环境配置、代码实现、运行结果和遇到的错误。作者在运行过程中遇到了Py4JJavaError和JAVA_HOME未设置的问题，并通过导入findspark初始化和设置环境变量解决了这些问题。文章还讨论了groupByKey和reduceByKey的区别。

zzy的aly

274 1 1

Echo_Wish

6月前

机器学习/深度学习传感器分布式计算

数据才是真救命的：聊聊如何用大数据提升灾难预警的精准度

Echo_Wish

434 14 14

1062754335

8月前

数据采集分布式计算 DataWorks

ODPS在某公共数据项目上的实践

本项目基于公共数据定义及ODPS与DataWorks技术，构建一体化智能化数据平台，涵盖数据目录、归集、治理、共享与开放六大目标。通过十大子系统实现全流程管理，强化数据安全与流通，提升业务效率与决策能力，助力数字化改革。

1062754335

284 4 4

Echo_Wish

7月前

机器学习/深度学习运维监控

运维不怕事多，就怕没数据——用大数据喂饱你的运维策略

Echo_Wish

519 0 0

第五期轻松入门学习大数据学习报告

热门文章

最新文章

相关课程

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

第五期轻松入门学习大数据学习报告

热门文章

最新文章

相关课程

相关电子书