开源大数据平台 E-MapReduce-博文-第16页-阿里云开发者社区-阿里云

阿里云E-MapReduce动态 E-MapReduce发布新版本，可以在控制台管理meta表结构。资讯人脸识别，要靠哪些技术支撑，是否会泄露个人隐私？本文介绍人脸识别用到哪些技术，讨论如何保护用户隐私一图看懂AI阵营：学习AI 站错队可导致自取灭亡本文介绍现在AI技术阵营，对AI各流派进行细分，梳理了17种方法，并用图直观展现。

1979 0 0

寒沙牧

分布式计算 MaxCompute Spark

博文

E-MapReduce中Spark 2.x读写MaxCompute数据

最新的`aliyun-emapreduce-sdk`将`MaxCompute`数据以`DataSource`的方式接入Spark 2.x，用户可以使用类似Spark 2.x中读写`json/parquet/csv`的方式来访问MaxCompute.

7306 0 1

开源大数据EMR

机器学习/深度学习存储大数据

博文

开源大数据周刊-第42期

阿里云E-MapReduce动态阿里云HBase支持PB级别的分布式数据库即将开始公测资讯云时代的大数据存储-云HBase 纵观数据库发展的几十年，从网状数据库、层次数据库到RDBMS数据库，在最近几年的NewSQL的兴起，加上开源的运动，再加上云的特性，可以说是日新月异。

2169 0 0

开源大数据EMR

关系型数据库大数据分布式数据库

博文

开源大数据周刊-第41期

云数据库HBase公测开始 EMR产品价格全面优惠，价格和ECS自建一致

2088 0 0

寒沙牧

存储分布式数据库 Apache

博文

E-MapReduce的HBase集群间迁移

E-MapReduce提供HBase服务，本文介绍了几种HBase集群间迁移的方法

3612 0 1

开源大数据EMR

分布式计算关系型数据库大数据

博文

开源大数据周刊-第40期

阿里云HBase支持PB级别的分布式数据库即将开始公测

2874 0 0

开源大数据EMR

分布式计算安全大数据

博文

开源大数据周刊-第39期

2656 0 1

开源大数据EMR

机器学习/深度学习分布式计算大数据

博文

开源大数据周刊-第38期

本期关注：梨视频基于阿里云E-MapReduce搭建视频推荐系统的实践，Apache Eagle成为新的顶级项目，英特尔开源的分布式深度学习库BigDL，Hadoop 3.0新功能测评

2557 0 0

开源大数据EMR

分布式计算大数据 Apache

博文

开源大数据周刊-第37期

[阿里云E-MapReduce动态] E-MapReduce 2.3.1镜像主版本发布基础镜像CentOS 6.5内核版本升级到2.6.32-642；并支持job failover 资讯 2017年数据领域的八大发展趋势在2017年数据社区将会有大量的机会出现，并伴随一些危机性的挑战，

2426 0 0

开源大数据EMR

存储分布式计算监控

博文

梨视频：基于阿里云E-MapReduce搭建视频推荐系统的实践

梨视频由前澎湃新闻掌门人邱兵创立。在上线之前，它就获得了黎瑞刚华人文化近1亿美元投资，旗下《微辣》栏目总播放量已经超过4亿，并在上线1个月后获得“年度视频新媒体”大奖。这样一款脱胎于传统媒体的创业型短视频软件，在视频领域异军突起，不仅让内人士在感叹梨视频内容生产力之强大的同时，也诧异于是谁在

13983 0 2

开源大数据EMR

分布式计算监控 NoSQL

博文

开源大数据周刊-第36期

阿里云E-MapReduce1.6.0版本上线，增加交互式工作台、支持独享机型；国际站上线，海外用户可以购买E-MapReduce服务

2691 0 0

开源大数据EMR

存储 SQL 物联网

博文

首次揭秘|为6.4亿人次出行提供无线网络的技术架构

借助“互联网+大数据+机场”三轮驱动，掌慧纵盈每年为6.4亿人次出行提供无线网络连接服务。随着业务的拓展，随之后来的挑战是数据量的暴增。 2016年，掌慧纵盈（股票代码：835736）通过阿里云产品，率先构建了业界领先的大数据平台。本文阐述了一家物联网企业的业务架构和数据架构，以及技术选型

11106 0 0

开源大数据EMR

分布式计算监控大数据

博文

开源大数据周刊-第35期

2643 0 0

鱼跟猫

消息中间件大数据 Kafka

博文

如何在E-MapReduce上使用引导操作安装kafka组件

当前emr最新版本2.1.1没有kafka组件，需要额外安装。本文介绍如何用E-MapReduce引导操作来安装kafka_2.10-0.10.0.0版本。

4537 0 1

云无谓

存储分布式计算大数据

博文

使用E-MapReduce服务处理阿里云文件存储（NAS）的数据

给大家介绍一个使用场景，可以将E-MapReduce的Hadoop作业和文件存储（NAS）结合在一起，发挥分布式存储和分布式计算在一起的威力

4479 0 0

云无谓

消息中间件分布式计算 Kafka

博文

使用E-MapReduce服务将Kafka数据导入OSS

kafka是一个开源社区常用的消息队列，虽然kafka官方（Confluent公司）提供插件从Kafka直接导入数据到HDFS的connector，但对阿里云对文件存储系统OSS却没有官方的支持。本文会举一个简单的例子，实现kafka的数据写入阿里云OSS。因为阿里云E-MapReduce服...

8211 0 1

开源大数据EMR

SQL 分布式计算搜索推荐

博文

开源大数据周刊-第31期

数据生态治理要啃硬骨头、将人类送上火星、大数据框架对比、SQL on Hadoop

2673 0 0

计算爱好者

SQL 分布式计算大数据

博文

HIVE MapJoin异常问题处理总结

HIVE被很广泛的使用，使用过程中也会遇到各种千奇百怪的问题。这里就遇到的MapJoin Local 内存不足的问题进行讨论，从问题描述、mapjion原理以及产生该问题的原因，解决方案做一下介绍，最后对该问题进行了进一步的思考，希望对解决该类问题的朋友有所帮助。

16071 1 1

开源大数据EMR

分布式计算算法大数据

博文

开源大数据周刊-第29期

1991 0 0

开源大数据EMR

分布式计算大数据 Hadoop

博文

开源大数据周刊-第26期

云栖社区开源大数据专题回顾、后Hadoop时代圆桌讨论、Hadoop上云的冰与火、Flink的未来、城市大脑、大数据时代几个关键问题剖析

2827 0 0

开源大数据EMR

机器学习/深度学习分布式计算大数据

博文

开源大数据周刊-第25期

云栖大会开源大数据分享、空间大数据、银行大数据、Hbase迁移到EMR、机器学习python、R及TensorFlow深度学习

2173 0 0

开源大数据EMR

SQL 分布式计算大数据

博文

开源大数据周刊-第24期

本周关注：意图搜索、hadoop3.0、大数据架构BI、大数据农业应用

2603 0 0

鸿初

Shell 对象存储

博文

E-MapReduce集群脚本-包年包月集群修改软件环境的利器

集群，特别是包年报月集群，在使用过程中，可能会有新的安装第三方软件，修改集群运行环境的需求。 E-MapReduce控制台1.5.0版本提供了集群脚本的功能，可以在集群创建好后批量选择节点，运行您指定的脚本，以实现个性化的需求。

2169 0 1

鸿初

SQL 大数据对象存储

博文

E-MapReduce的Presto组件默认支持访问oss数据

阿里云E-MapReduce从EMR-2.1.0版本镜像开始，Presto组件默认就支持访问oss数据了，不再需要引导操作额外支持。

2805 0 0

鱼跟猫

SQL 分布式计算 Scala

博文

尝新阿里云E-MapReduce MetaService服务

阿里云E-MapReduce从EMR-2.1.0版本镜像开始，将在VPC集群中提供MetaService服务。

4273 0 2

开源大数据EMR

机器学习/深度学习人工智能分布式计算

博文

开源大数据周刊-第22期

本周关注：大数据部门、数据科学家、机器学习发展与机遇、spark2.0 Structured Streaming、Hbase运维、Sqoop、Flink的第一本书籍。

2752 0 0

寒沙牧

资源调度分布式计算 Hadoop

博文

E-MapReduce集群搭建HAWQ实践

HAWQ是一种基于HDFS的MPP(Massively Parallel Processing) SQL引擎，支持标准SQL/事务处理，性能比原生Hive快几百倍。本文介绍在E-MapReduce集群上面如何搭建HAWQ。

6001 0 0

eric-li

SQL 关系型数据库 MySQL

博文

Hive MetaStore同步方法

6416 0 1

开源大数据EMR

分布式计算大数据 Spark

博文

开源大数据周刊-第21期

本周关注：大数据教育、翻译行业应用，大数据与管理的关系、hadoop与mpp的关系、Facebook 60T+的spark应用

3723 0 0

寒沙牧

SQL Java 分布式数据库

博文

csv导入HBase

csv文件导入HBase

7419 0 0

开源大数据EMR

SQL 分布式计算算法

博文

开源大数据周刊-第19期

本周关注：马云谈云计算、大数据、人工智能未来三十年，E-MapReduce存储计算分离，真实的大数据故事，spark session及spark mmlib、presto+oss

4078 0 0

计算爱好者

SQL 分布式计算 Hadoop

博文

E-MapReduce 集群环境小记

大家在使用E-MapReduce的时候，都想对E-MapReduce的集群环境细节有些了解。这里根据实践，总结一下E-MapReduce集群环境与应用启动与停止，供大家在实际使用中进行参考。

3163 0 1

开源大数据EMR

分布式计算 NoSQL 大数据

博文

开源大数据周刊-第16期

spark2.0已经发布，本期整理了一些spark的好文（包括最佳实践、原理等）推荐给大家。

5005 0 0

开源大数据EMR

SQL 分布式计算大数据

博文

开源大数据周刊-第14期

大数据人才状况；大数据平台相关：数据采集、数据指标的量化、大数据平台建设的选型；性能优化相关：hive、hbase、jvm gc的优化；

3649 0 0

开源大数据EMR

分布式计算安全大数据

博文

开源大数据周刊-第12期

本周包括全景洞察大数据全貌、数据分析师的职业规划、打造智能聊天机器人、E-Mapreduce的相关实践及动态、最近值得关注的大数据会议。

5275 0 0

蓝天0802

监控网络安全流计算

博文

如何在E-MapReduce上使用storm

Storm 使用指南集群创建目前E-MapReduce已经支持了apache社区的1.0.1版本的storm。用户可以通过选择E-MapReduce 最新的镜像版本EMR-2.0.0（以及后续的以上版本），通过在控制台软件列表中勾选storm软件进行安装，选择完毕后即可登录到master节点

3968 0 0

封神

存储分布式计算大数据

博文

5W1H(六何分析法)全景洞察大数据

我们从大数据的特征说起，谈到了大数据的价值，再聊什么时候做，谁去做，选择什么平台，最后聊到了怎么做的问题。通过对一些真实的场景分析，了解了大数据的全貌。

11781 58 61

寒沙牧

分布式数据库 Hbase

博文

E-MapReduce的HBase集群使用Hue

E-MapReduce的HBase集群中使用Hue，方便用户访问查询数据

7476 0 1

鸿初

SQL 缓存大数据

博文

Presto实现原理（转）

Presto架构 Presto查询引擎是一个Master-Slave的架构，由一个Coordinator节点，一个Discovery Server节点，多个Worker节点组成，Discovery Server通常内嵌于Coordinator节点中。Coordinator负责解析SQL语句，生

7795 0 0

梅熙

博文

E-MapReduce集群使用Oozie工作流简单示例

本文简单介绍了，如何在E-MapReduce上提交Oozie workflow job。提供了可以直接下载运行的示例代码，欢迎使用。

3249 0 1

阿里云E-MapReduce团队

分布式数据库 Python Hbase

博文

E-MapReduce 2.0.0 版本发布

本次发布包括：修改了界面的版本选择，新增了2.0.0版本，隐去了1.x版本（用SDK仍然可以继续创建，但我们强烈建议升级到最新版本），合并了Hadoop和HBase的版本选择。 Hadoop版本进行了升级，2.6.0 -> 2.7.2 集群JDK版本升级，1.7.0 -> 1.8.0 新增

3879 0 0

寒沙牧

分布式计算 Hadoop Java

博文

E-MapReduce集群支持预装Phoenix

Apache Phoenix是构建在HBase上的SQL中间层，它可以让开发者使用SQL语言对HBase进行相关操作，E-MapReduce在emr-2.0.0版本开始支持集群预装Phoenix，本文对此进行了介绍。

3249 0 0

eric-li

SQL 大数据数据处理

博文

使用Hive进行OSS数据处理的一个最佳实践

12116 2 9

开源大数据EMR

机器学习/深度学习 SQL 分布式计算

博文

开源大数据周刊-第10期

云上Hadoop之最佳实践

2447 0 0

寒沙牧

分布式计算资源调度 Hadoop

博文

E-MapReduce集群如何使用Phoenix on HBase

E-MapReduce的emr-2.0.0以下(emr-2.0.0已默认集成Phoenix)的HBase集群中并不包含Phoenix，也没有启动yarn，下面介绍一种通过创建集群时设置的引导操作来完成集群上Phoenix的部署。

4869 0 0

计算爱好者

SQL 分布式计算大数据

博文

E-MapReduce解决hive comment中文乱码问题

在最新版本的EMR-1.3.0已经解决了hive comment中文乱码问题。如果已经申请了包年包月的集群，用的是老版本，那么可以过下面介绍的步骤解决这个问题。

4775 0 0

开源大数据EMR

分布式计算大数据 Hadoop

博文

开源大数据周刊-第8期

阿里云李津谈布局专有云的深层用意，2016年杭州第四次spark meetup见闻

2933 0 0

鸿初

SQL 分布式计算大数据

博文

【转】Spark 2.0 技术预览版:更简单、更快速、更智

2676 0 0

开源大数据EMR

分布式计算大数据 Hadoop

博文

开源大数据周刊-第7期

运行于云端的Hadoop——数据即服务的论证，预先知晓Hadoop3.0新特性。

3327 0 0

鸿初

Oracle 关系型数据库 Java

博文

使用E-MapReduce集群sqoop组件同步云外Oracle数据库数据到集群hive

2930 0 0

...

你好！

登录掌握更多精彩内容

账号登录

我的内容

我的收藏

EMR 官网

EMR Serverless StarRocks 版

EMR Serverless Spark 版

更多版块

大数据计算 MaxCompute 实时数仓 Hologres 实时计算 Flink 大数据开发治理DataWorks 检索分析服务 Elasticsearch版人工智能平台PAI 智能搜索推荐大数据运维SREWorks 数据可视化DataV 向量检索服务 Milvus 版

展开全部

活跃用户

公有云小学生

阿里云产品新购及多次复够申请优惠可以加钉钉：aliyun2016

开源大数据平台 E-MapReduce

最新

博文

用户案例

免费试用

问答

视频

电子书

学习

活动

开源大数据周刊-第43期

E-MapReduce中Spark 2.x读写MaxCompute数据

开源大数据周刊-第42期

开源大数据周刊-第41期

E-MapReduce的HBase集群间迁移

开源大数据周刊-第40期

开源大数据周刊-第39期

开源大数据周刊-第38期

开源大数据周刊-第37期

梨视频：基于阿里云E-MapReduce搭建视频推荐系统的实践

开源大数据周刊-第36期

首次揭秘|为6.4亿人次出行提供无线网络的技术架构

开源大数据周刊-第35期

如何在E-MapReduce上使用引导操作安装kafka组件

使用E-MapReduce服务处理阿里云文件存储（NAS）的数据

使用E-MapReduce服务将Kafka数据导入OSS

开源大数据周刊-第31期

HIVE MapJoin异常问题处理总结

开源大数据周刊-第29期

开源大数据周刊-第26期

开源大数据周刊-第25期

开源大数据周刊-第24期

E-MapReduce集群脚本-包年包月集群修改软件环境的利器

E-MapReduce的Presto组件默认支持访问oss数据

尝新阿里云E-MapReduce MetaService服务

开源大数据周刊-第22期

E-MapReduce集群搭建HAWQ实践

Hive MetaStore同步方法

开源大数据周刊-第21期

csv导入HBase

开源大数据周刊-第19期

E-MapReduce 集群环境小记

开源大数据周刊-第16期

开源大数据周刊-第14期

开源大数据周刊-第12期

如何在E-MapReduce上使用storm

5W1H(六何分析法)全景洞察大数据

E-MapReduce的HBase集群使用Hue

Presto实现原理（转）

E-MapReduce集群使用Oozie工作流简单示例

E-MapReduce 2.0.0 版本发布

E-MapReduce集群支持预装Phoenix

使用Hive进行OSS数据处理的一个最佳实践

开源大数据周刊-第10期

E-MapReduce集群如何使用Phoenix on HBase

E-MapReduce解决hive comment中文乱码问题

开源大数据周刊-第8期

【转】Spark 2.0 技术预览版:更简单、更快速、更智

开源大数据周刊-第7期

使用E-MapReduce集群sqoop组件同步云外Oracle数据库数据到集群hive

活跃用户

相关产品