• 关于

    是emr错

    的搜索结果
  • E-MapReduce上如何采集Kafka客户端Metrics

    1. 背景 我们知道Kafka提供一套非常完善的Metrics数据,覆盖Broker,Consumer,Producer,Stream以及Connect。E-MapReduce通过Ganglia收集了Kafka Broker metrics信息,可以很好地监控Broker运行状态。但完整的Kafk...

    文章 鱼跟猫 2018-08-09 6066浏览量

  • 利用EMR Hive关联云HBase

    云HBase需要借助外部Hive对多表进行关联分析,后续云HBase将集成Spark,更加建议使用Spark分析HBase数据。本文简单介绍下如何利用EMR的Hive关联云HBase的表。 1. 环境准备 购买按量计费的EMR集群,配置依据实际场景确定,注意要和EMR处在同一VPC下,建议不需开...

    文章 巴客 2018-10-14 1266浏览量

  • 记录在shell脚本中使用sudo echo x > 时,抛Permission denied错误

    1.场景 在一个非root且带有sudo权限的用户,使用shell脚本(单独手工执行命令不会抛错,是成功的):会抛错 点击(此处)折叠或打开 #!/bin/bash -x DNS_SERVER=10.xx...

    文章 sh_jepson 2017-01-12 717浏览量

  • 使用EMR来进行mysqlbinlog日志准实时传输

    简介 本文将介绍如何利用阿里云的sls插件功能和emr来进行mysql binlog的准实时传输 基本架构 rds -> sls -> spark streaming -> spark hdfs 主要包含3个链路: 1. 怎么把rds的binlog收集到sls 2.怎么通过sp...

    文章 qiaozhou 2018-01-04 3771浏览量

  • 基于Spark Streaming 进行 MySQL Binlog 日志准实时传输

    基本架构 RDS -> SLS -> Spark Streaming -> Spark HDFS 上述链路主要包含3个过程: 如何把 RDS 的 binlog 收集到 SLS。 如何通过 Spark Streaming 将 SLS 中的日志读取出来,进行分析。 如何把链路 2 ...

    文章 开源大数据EMR 2019-03-11 9859浏览量

  • E-MapReduce Kafka Kerberos集群授权

    Kafka授权 如果没有开启Kafka认证(如Kerberos认证或者简单的用户名密码),即使开启了Kafka授权,用户也可以伪造身份访问服务。所以建议创建高安全模式(即支持Kerberos)的Kafka集群,详见Kerberos安全文档。 备注: 本文的权限配置只针对E-MapReduce的高安...

    文章 寒沙牧 2018-02-28 3277浏览量

  • [20150318]dg与db_create_file_dest参数

    [20150318]dg与db_create_file_dest参数.txt --今天在例行检查时,发现dataguard上新建立的文件防的位置不对。 RMAN> report schema ; ..... 37   32767    PORTAL_HIS         ...

    文章 lfreeali 2015-03-18 693浏览量

  • 专注年轻一代,基于E-MapReduce梨视频推荐系统

    在2016杭州云栖大会的“开源大数据技术专场”上,梨视频大数据负责人杨智带来了《基于E-MapReduce梨视频推荐系统》的精彩分享。分享中,他重点介绍了梨视频中基于阿里云的数据处理系统和梨视频推荐系统,精彩不容错过。 以下内容根据演讲PPT及现场分享整理。 梨视频简介 梨视频是中国领先的资讯...

    文章 云学习小组 2016-11-04 6252浏览量

  • ORA-01403: no data found

    在项目的存储过程中有这样一句话 select jgdm,jgmc into parm_mrjgdm,parm_mrjgmc From BL_KHXX  where jgdm=PARM_JGDM; 每次调试存储过程总是报错 ORA-01403: 未找到任何数据 ORA-06512: 在 "HISOR...

    文章 developerguy 2016-06-15 883浏览量

  • 免费下载 | 极致酷黑!优酷“暗黑模式”的技术实现 | 开发者必读(131期)

    最炫的技术新知、最热门的大咖公开课、最有趣的开发者活动、最实用的工具干货,就在《开发者必读》! 每日集成开发者社区精品内容,你身边的技术资讯管家。 每日头条 免费下载 | 极致酷黑!优酷“暗黑模式”的技术实现 《优酷 APP 全量支持“暗黑模式” ——设计与技术完整总结》现已发布!设计理念+技术...

    文章 KB小秘书 2020-01-06 404浏览量

  • DataWorks 2020-03 产品月刊

    本月DataWorks产品月刊为您带来1.DataWorks On E-MapReduce功能2020年4月3日正式启动商业化2.技术长文:《一分钟搭建会话机器人,阿里是怎么做到的?》3.AnalyticDB for PostgreSQL+DataWorks深度集成重磅联合发布,推出3个月1折优惠...

    文章 墨祤@DataWorks 2020-04-10 644浏览量

  • Spark内置图像数据源初探 | 6月27号云栖夜读

    点击订阅云栖夜读日刊,专业的技术干货,不容错过! 阿里专家原创好文 1.Spark内置图像数据源初探 作者:林武康,花名知瑕, 阿里巴巴计算平台事业部EMR团队的高级开发工程师,Apache HUE Contributor, 参与了多个开源项目的研发工作,对于分布式系统设计应用有较丰富的经验,目前...

    文章 yq传送门 2019-06-27 2708浏览量

  • Serverless Spark的弹性利器 - EMR Shuffle Service

    背景与动机 计算存储分离下的刚需 计算存储分离是云原生的重要特征。通常来讲,计算是CPU密集型,存储是IO密集型,他们对于硬件配置的需求是不同的。在传统计算存储混合的架构中,为了兼顾计算和存储,CPU和存储设备都不能太差,因此牺牲了灵活性,提高了成本。在计算存储分离架构中,可以独立配置计算机型和存...

    文章 阿里云E-MapReduce团队 2020-09-14 4061浏览量

  • 使用E-MapReduce集群sqoop组件同步云外Oracle数据库数据到集群hive

    E-MapReduce集群sqoop组件可以同步数据库的数据到集群里,不同的数据库源网络配置有一些差异网络配置。最常用的场景是从rds mysql同步数据,最近也有用户询问如何同步云外专有Oracle数据库数据到hive。云外专有数据库需要集群所有节点通过公网访问,要创建VPC网络,使用VPC网络...

    文章 鸿初 2016-05-27 2333浏览量

  • hive在E-MapReduce集群的实践(一)hive异常排查入门

    hive是hadoop集群最常用的数据分析工具,只要运行sql就可以分析海量数据。初学者在使用hive时,经常会遇到各种问题,不知道该怎么解决。 本文是hive实践系列的第一篇,以E-MapReduce集群环境为例,介绍常见的hive执行异常,定位和解决方法,以及hive日志查看方法。 除作者本...

    文章 鸿初 2018-04-11 5529浏览量

  • 如何使用RDS创建Hive元数据库

    1. 问题背景 E-MapReduce中支持的Hive,会默认在Master节点的Mysql数据库中记录元数据信息。通常,用户会将数据存储在E-MapReduce的HDFS中,使用Hive处理HDFS中的数据。当集群释放时,节点的所有数据包括HDFS数据和Hive元数据都会被删除。前面我撰文说过,...

    文章 鱼跟猫 2016-05-05 4536浏览量

  • 降本增效利器!趣头条Spark Remote Shuffle Service最佳实践

    王振华,趣头条大数据总监,趣头条大数据负责人 曹佳清,趣头条大数据离线团队高级研发工程师,曾就职于饿了么大数据INF团队负责存储层和计算层组件研发,目前负责趣头条大数据计算层组件Spark的建设 范振,花名辰繁,阿里云计算平台EMR高级技术专家,目前主要关注开源大数据技术以及云原生技术。 1. ...

    文章 黯灭_邓彬 2020-12-07 4830浏览量

  • SPARK + AI SUMMIT 2020 中文精华版线上峰会—7月5日议题

    Spark中文峰会第二日,就在本周日上午杭州会场,错过悔十年的压轴好戏来了~ SPARK + AI SUMMIT 2020 中文精华版线上峰会,十四位来自北京、上海、杭州、硅谷的PMC和意见领袖,一一还原英文现场的经典分享。 除 Databricks、Facebook、阿里巴巴、Intel 、领英...

    文章 阿里云E-MapReduce团队 2020-07-01 492浏览量

  • 独家下载 |《大数据工程师必读手册》揭秘阿里如何玩转大数据

    点击免费下载《大数据工程师必读手册》 十年磨一剑,今天的飞天大数据平台是阿里巴巴10年大数据平台建设最佳实践的结晶,是阿里经济体大数据生产的基石。飞天大数据平台承载了阿里经济体 99% 的数据业务构建,同时广泛应用于城市大脑、数字政府、电力、金融、新零售、智能制造、智慧农业等各领域的大数据建设。 ...

    文章 公开课小能手 2019-11-15 62574浏览量

  • 【程序员(媛)国人之光】知(美)识(色)贩卖贴】非标题党】

    别瞎想啊,这研究的都是学问。 注意了绝对不是商业小广告 注意了小编没有跳槽到某某佳缘 此时不管你是被困国门、还是被困中高风险地区,我们送ta来到你身边。往年1000美金不含机票的北美Spark男神女神朝圣之旅,我们竟然自带国语bgm打包送送送~ 一个动作 预约直播间 一个时间 **7月4日-5...

    文章 阿里云E-MapReduce团队 2020-06-23 364浏览量

  • PyFlink 在聚美优品的应用实践

    大家好,我是来自聚美优品刷宝大数据部门的吴攀刚,本文将跟大家分享 PyFlink 在刷宝的应用,包括:背景介绍、架构演进、技术选型以及一个问题的解决思路分享。 刷宝是一款短视频 APP,涵盖短视频、直播视频等内容,为用户提供快乐视频和优质的主播。在来到聚美之前,我主要做离线数仓开发和数据开发,来到...

    文章 阿里云实时计算Flink 2020-07-23 653浏览量

  • 利用yarn capacity scheduler在EMR集群上实现大集群的多租户的集群资源隔离和quota限制

    背景 使用过hadoop的人基本都会考虑集群里面资源的调度和优先级的问题,假设你现在所在的公司有一个大hadoop的集群,有很多不同的业务组同时使用。但是A项目组经常做一些定时的BI报表,B项目组则经常使用一些软件做一些临时需求。那么他们肯定会遇到同时提交任务的场景,这个时候到底如何分配资源满足这...

    文章 梅熙 2017-05-10 5179浏览量

  • 兹事体大,DataWorsk消息中心发布啦!

    各位DataWorks用户你们好: 我们产品经理冒着去爬山的危险,用颤抖的双手向DataWorks用户发布了主动推送消息的“消息中心”功能;我们也曾被各种广告推送折腾的不厌其烦,理解大家对于推送消息的抗拒,在我们设计消息中心之初,主要是来源于以下用户反馈的问题,例如:1.部分用户不知道产品发布、...

    文章 墨祤@DataWorks 2020-07-29 306浏览量

  • MaxCompute Spark与Spark SQL对比分析及使用注意事项

    演讲嘉宾简介:沐行,阿里云智能技术支持工程师。 本次直播视频精彩回顾,戳这里!以下内容根据演讲视频以及PPT整理而成。本次分享主要围绕以下三个方面: 一、功能特性二、代码开发三、DataWorks模式 一、功能特性 1.Spark部署模式Spark开源文档中表明部署模式支持几种部署模式,如stan...

    文章 亢海鹏 2020-02-25 905浏览量

  • 大数据上云那些事儿

    1.需求定位 1.1常见痛点 速度 – 慢,基础设施构建和集群搭建周期长。 成本 – 高,硬件要求高,一次性成本高,额外费用比较多,付费模式单一。 弹性 – 无,难以快速应对业务和数据爆炸性增长。 安全 – 没有可靠的防护体系,认证、数据安全差,无法规避风险。 运维 – 强依赖于运维团队,运维能...

    文章 SRE团队技术小编-小兰 2020-09-03 749浏览量

  • DataWorks百问百答37:DataWorks-MaxCompute权限体系有哪些混淆点?

    背景      DataWorks是大数据引擎上层的一个数据开发、生产、治理平台,有自己一套完善的权限体系,但由于下层对接的引擎较多(MaxCompute、EMR、Blink等),因此用户常常对DataWorks权限、引擎权限产生混淆。 常见问题集锦 DataWorks开发角色好像可以读写所有...

    文章 zaid胡振宇 2020-07-03 354浏览量

  • MaxCompute 搬站的原理、实践以及常见问题

    MaxCompute 是阿里巴巴自研的旗舰大数据仓库服务,与开源 Hadoop 搭建的数仓相比,一个很大的不同点是 MaxCompute 并不直接开放类似 HDFS 这样的分布式文件系统的接口,数据进出 MaxCompute 都要经由结构化数据通道 Tunnel。因此已经使用 Hadoop 建仓的...

    文章 MaxCompute铭宥 2020-02-14 353浏览量

  • Flink Weekly | 每周社区动态更新-20200520

    大家好,本文为 Flink Weekly 的第十六期,由王雷整理,张成 Review。本期主要内容包括:近期社区开发进展、邮件问题答疑、Flink 最新社区动态及技术文章推荐等。 Flink 开发进展 1.Release ■ Piotr Nowojski 宣布 release-1.11 分支冻结。...

    文章 阿里云实时计算Flink 2020-05-27 274浏览量

  • Flink Weekly | 每周社区动态更新-20200520

    大家好,本文为 Flink Weekly 的第十六期,由王雷整理,张成 Review。本期主要内容包括:近期社区开发进展、邮件问题答疑、Flink 最新社区动态及技术文章推荐等。 Flink 开发进展 1.Release ■ Piotr Nowojski 宣布 release-1.11 分支冻结。...

    文章 阿里云实时计算Flink 2020-05-27 630浏览量

  • DataWorks百问百答63:DataWorks如何进行离线数据质量监控?

    前言  日常工作中,每时每刻都在产生大量重要的数据,数据质量问题也随之而来。如何用最少的人力、最快的速度,自动完成数据质量校验,对于企业节省成本、上层决策应用等起到关键作用。DataWorks的数据质量模块,为您提供全链路的数据质量方案,让数据监控更加简单、高效。   数据质量最基本、也最关键的功...

    文章 zaid胡振宇 2020-09-11 535浏览量

1 2 >

云产品推荐

上海奇点人才服务相关的云产品 小程序定制 上海微企信息技术相关的云产品 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 自然场景识别相关的云产品 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT