Apache

首页 标签 Apache
# Apache #
关注
28731内容
【大数据新手上路】“零基础”系列课程--Flume收集网站日志数据到MaxCompute
概述:大数据时代,谁掌握了足够的数据,谁就有可能掌握未来,而其中的数据采集就是将来的流动资产积累。 任何规模的企业,每时每刻都在产生大量的数据,但这些数据如何归集、提炼始终是一个困扰。而大数据技术的意义确实不在于掌握规模庞大的数据信息,而在于对这些数据进行智能处理,从中分析和挖掘出有价值的
Apache Flink 漫谈系列(07) - 持续查询(Continuous Queries)
实际问题 我们知道在流计算场景中,数据是源源不断的流入的,数据流永远不会结束,那么计算就永远不会结束,如果计算永远不会结束的话,那么计算结果何时输出呢?本篇将介绍Apache Flink利用持续查询来对流计算结果进行持续输出的实现原理。
Tachyon已支持阿里云OSS 正式改名Alluxio
人气很火的开源分布式虚拟存储系统Tachyon正式更名为Alluxio,并发布了1.0版本。新的版本新增支持任意存储系统如阿里云对象存储OSS、Amazon S3、OpenStack Swift等。
详解Apache Kylin安装和踩坑
1. 背景 最近在学习kylin,在安装的时候遇到一些坑,特意记录起来,也希望同样在学习kylin的人,少踩一些坑(要是连安装都过不去,还怎么学!!!)。 2. 环境 我选的kylin版本是1.5.4,因为买了一本叫《Apache kylin权威指南》,书中以1.5.x为蓝本,为了避免少踩坑,保持和书中版本一致。
大数据社区整理的Linux运维笔试面试题(47题)
大数据社区整理的Linux运维笔试面试题(47题) Linux操作系统知识 1. Linux开机启动流程详细步骤是什么?忘记密码如何破解? 2. 企业中Linux数据库服务器做raid几,你们原来公司的数据库服务器大小?RAID 0 1 5 10区别,系统分区标准是什么? 3.
EMR Spark Relational Cache如何支持雪花模型中的关联匹配
我们需要找到一种方式可以通过单个Relational Cache支持优化多个关联查询的方式,从而在加速用户查询的同时,减少创建和更新relational cache的代价。Record Preserve Join是支持这种优化的非常有效的方式。
Kafka、RabbitMQ、RocketMQ等消息中间件的对比 —— 消息发送性能和优势
Kafka、RabbitMQ、RocketMQ等消息中间件的对比 —— 消息发送性能和优势http://www.bieryun.com/1354.html 引言 分布式系统中,我们广泛运用消息中间件进行系统间的数据交换,便于异步解耦。
免费试用