• 关于

    免费hadoop 数组

    的搜索结果
  • [大数据新手上路]“零基础”系列课程--如何将ECS上的Hadoop数据迁移到阿里云数加·MaxCompute

    免费开通大数据服务:https://www.aliyun.com/product/odps  想用阿里云数加·大数据计算服务(MaxCompute),但是现在数据还在hadoop上,怎么办? MaxComp...

    文章 隐林 2016-12-05 14524浏览量

  • 【译】Hadoop发生了什么?我们该如何做?

    原文:https://insidebigdata.com/2019/08/10/what-happened-to-hadoop-and-where-do-we-go-from-here/ 作者:余根茂,阿里巴巴计算平台事业部EMR团队的技术专家,参与了Hadoop,Spark,Kafka等开源项...

    文章 开源大数据EMR 2019-09-17 1011浏览量

  • 大数据简介,技术体系分类整理

    一、大数据简介 1、基础概念 大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。大数据技术则主要用来解决海量数据的存储和分析。 2、特点分析 大数据的5V特点(IBM提出):...

    文章 知了一笑 2020-09-15 152浏览量

  • 万券齐发助力企业上云,爆款产品低至2.2折起!

    限量神券最高减1000,抢完即止!云服务器ECS新用户首购低至0.95折!

    广告

  • Hadoop集群伸缩难?DLA Spark助力集群快速加弹性

    1. 背景介绍 大数据时代早期,Apache Hadoop 是构建具有海量存储能力数据仓库的首选方案,许多企业用户采用在云上购买ECS,自建Hadoop集群来存储和处理数据。Apache Spark作为一个内存计算框架,具有流处理、批处理,图计算,机器学习,SQL查询等多种能力,社区活跃度高,并且...

    文章 云原生数据湖分析DLA 2020-11-18 733浏览量

  • 手把手教你入门Hadoop(附代码&资源)

    GETINDATA公司创始人兼大数据顾问彼得亚·雷克鲁斯基(Piotr Krewski)和GETINDATA公司首席执行官兼创始人亚当·卡瓦(Adam Kawa) 目录 内容简介设计理念HADOOP组件HDFSYARNYARN 应用程序监控 YARN 应用程序用HADOOP处理数据HADOOP 的...

    文章 技术小能手 2018-05-02 2901浏览量

  • (deprecated) 百度开放研究社区-hadoop云平台-mahout兴趣小组

    百度开放研究云平台 百度开放研究云平台由百度开放研究计划支持而建设的。当前已建成基于开源Hadoop 1.0.0而构建的开放数据分析平台,将逐步投入数百台服务器来支持海量数据分析。同时也将不断在平台上放置来自百度产品和系统的数据供学术研究使用。来自学术界的使用者可以在该平台上开展数据分析的研究。 ...

    文章 张包峰 2012-11-10 1178浏览量

  • Hadoop 生态系统

    1.概述 最近收到一些同学和朋友的邮件,说能不能整理一下 Hadoop 生态圈的相关内容,然后分享一些,我觉得这是一个不错的提议,于是,花了一些业余时间整理了 Hadoop 的生态系统,并将其进行了归纳总结,进而将其以表格的形式进行了罗列。涉及的内容有以下几点: 分布式文件系统 分布式编程模型 N...

    文章 玄学酱 2017-07-10 1314浏览量

  • Hadoop和大数据:60款顶级开源工具

    虽然此文尽力做到全面,但难免遗漏,欢迎大家补充,点击文末右下角“写评论”,分享你的观点。 说到处理大数据的工具,普通的开源解决方案(尤其是Apache Hadoop)堪称中流砥柱。弗雷斯特调研公司的分析师Mike Gualtieri最近预测,在接下来几年,“100%的大公司”会采用Hadoop。...

    文章 小旋风柴进 2017-05-02 1433浏览量

  • 开源大数据周刊-第6期

    阿里云E-Mapreduce动态 E-Mapreduce团队 正在研发1.3.2版本及1.4版本,主要包括: Master HA功能 用户执行计划及集群运行状态自定义报警 集群整体运行情况的仪表盘 集群的一些专家建议,例如:扩容提醒 集群一键重启 资讯 腾讯前副总裁、Google科学家吴军...

    文章 开源大数据EMR 2016-05-23 1607浏览量

  • Hadoop 生态系统

    1.概述   最近收到一些同学和朋友的邮件,说能不能整理一下 Hadoop 生态圈的相关内容,然后分享一些,我觉得这是一个不错的提议,于是,花了一些业余时间整理了 Hadoop 的生态系统,并将其进行了归纳总结,进而将其以表格的形式进行了罗列。涉及的内容有以下几点: 分布式文件系统 分布式编程模...

    文章 smartloli 2016-08-31 5083浏览量

  • Docker生态会重蹈Hadoop的覆辙吗?

    今晨在微信组中大家讨论了一篇文章,刚好和第三期云栖说《Hadoop是否已经过时》立意相似。不完全认同作者观点,发出共享以及思考。目测微信组从中午一直吵到现在了,果然是理越辩越明。文章来自科技头条微信号,作者是品刀客。原文链接见此处。目录一、Docker的兴起和Hadoop何其相似二、大数据从狂热走...

    文章 云篆 2018-12-03 4048浏览量

  • Docker生态会重蹈Hadoop的覆辙吗?

    2016-12-02 来源:36大数据 Docker的兴起和Hadoop何其相似 2015年说是Docker之年不为过,Docker热度高涨,IT从业人员要是说自己不知道Docker都不好意说自己是做IT的。2016年开始容器管理、集群调度成为热点,K8s开始成为热点。但这一幕和201...

    文章 【云行】 2016-12-13 3418浏览量

  • 《大数据系统构建:可扩展实时数据系统构建原理与最佳实践》一1.8 技术上的最新趋势

    本节书摘来自华章出版社《大数据系统构建:可扩展实时数据系统构建原理与最佳实践》一书中的第1章,第1.8节,南森·马茨(Nathan Marz) [美] 詹姆斯·沃伦(JamesWarren) 著 马延辉 向 磊 魏东琦 译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。 1.8 技术上...

    文章 华章计算机 2017-05-02 1333浏览量

  • 《大数据架构和算法实现之路:电商系统的技术实战》——1.5 相关软件:R和Mahout

    本节书摘来自华章计算机《大数据架构和算法实现之路:电商系统的技术实战》一书中的第1章,第1.5节,作者 黄 申,更多章节内容可以访问云栖社区“华章计算机”公众号查看。 1.5 相关软件:R和Mahout 了解了机器学习和分类的基本知识之后,你会发现相关算法本身的实现也是需要大量的专业知识的,开发的...

    文章 华章计算机 2017-05-02 1497浏览量

  • 大数据,数据分析,机器学习,架构等相关系统名称名词解释

    常用的一些软件或其他 1.日志(日志收集,日志处理) 风来了.fox 1.1 Logstash Logstash是一款轻量级的日志搜集处理框架,可以方便的把分散的、多样化的日志搜集起来,并进行自定义的处理,然后传输到指定的位置,比如某个服务器或者文件。 1.2 Filebea...

    文章 风来了 2016-09-09 2788浏览量

  • 对话Hadoop之父Doug Cutting|大数据和开源的未来

    前言 对中国大数据产业来说,2016年是从垂直领域野蛮生长到爆发全国范围关注热潮的一个转折点。不论是人山人海巨头云集的贵阳数博会,还是首次在华举办的全球顶级大数据会议Strata + Hadoop World,都揭示了中国大数据产业发展的澎湃动力。 在Hadoop生态领域,Cloudera是规...

    文章 小旋风柴进 2017-05-02 922浏览量

  • 史上最全“大数据”学习资源整理

    史上最全“大数据”学习资源整理 2016-05-17 Hadoop技术博文   当前,整个互联网正在从IT时代向DT时代演进,大数据技术也正在助力企业和公众敲开DT世界大门。当今“大数据”一词的重点其实已经不仅在于数据规模的定义,它更代表着信息技术...

    文章 云雷 2017-06-17 3746浏览量

  • 地铁译:Spark for python developers --- 搭建Spark虚拟环境3

    在VirtualBox 上建Ubantu虚机,安装Anaconda,Java 8,Spark,IPython Notebook,以及和Hello world 齐名的wordcount 例子程序。 搭建Spark 环境 本节我们学习搭建 Spark环境: 在Ubuntu 14.04的...

    文章 abel_cao 2016-05-10 752浏览量

  • 数据让生意更简单,网聚宝创业团队利用数加快速打造核心业务竞争力,在激烈的市场竞争中弯道超车。

    免费开通大数据服务:https://www.aliyun.com/product/odps “我们选择数加平台的主要目的是数加平台本身大数据应用的能力和平台的成熟度,当然背后还有很多能陪我们一起996战斗的数加兄弟们,无论是技术能力的判断,还是从商业合作的角度,这是选择数加的考虑。”“可以毫不保留...

    文章 隐林 2017-01-16 3388浏览量

  • 【大数据技术】什么是HBase ?所有的基础都在这儿了

    2006 年10 月Google 发布三架马车之一的《Bigtable:A Distributed Storage System for Strctured Data》论文之后,Powerset 公司就宣布 HBase 在 Hadoop 项目中成立,作为子项目存在。后来,在2010 年左右逐渐成为...

    文章 小猪佩佩 2019-04-19 1063浏览量

  • 数据科学工具包(万余字介绍几百种工具,经典收藏版!)

    本文简介:数据科学家的常用工具与基本思路,数据分析师和数据科学家使用的工具综合概述,包括开源的技术平台相关工具、挖掘分析处理工具、其它常见工具等几百种,几十个大类,部分网址。为数据科学教育和知识分享,提高数据科学人员素质。 数据科学融合了多门学科并且建立在这些学科的理论和技术之上,包括数学、概率...

    文章 小旋风柴进 2017-05-02 2473浏览量

  • 一共81个,开源大数据处理工具汇总(上)

    本文一共分为上下两部分。我们将针对大数据开源工具不同的用处来进行分类,并且附上了官网和部分下载链接,希望能给做大数据的朋友做个参考。下面是第一部分。 查询引擎 一、Phoenix 贡献者::Salesforce 简介:这是一个Java中间层,可以让开发者在Apache HBase上执行SQL查询。...

    文章 孤剑 2015-10-13 2093浏览量

  • 大数据心法来了!一站式玩转MaxCompute,还有开发者资源等你领!

    阿里云大数据计算平台开发者版2019年3月推出,MaxCompute正在成为开发者的免费大数据平台。今天,MaxCompute在企业构建自己的数据处理平台实践中起到了至关重要的作用,我们特别精选了企业的真实实践案例:从最大的兴趣社群平台小打卡;到90后、00后喜欢的克拉克拉;从互联网金融的典型天弘...

    文章 地町你好 2019-06-28 654浏览量

  • 中国HBase技术社区第四届MeetUp上海站——HBase应用实践专场

    中国HBase技术社区第四届MeetUp——HBase应用实践专场 HBase—Hadoop Database是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系统”。HBase的特点是高可靠性、高性能、面向...

    文章 云hbase+spark 2018-09-03 1998浏览量

  • 中国HBase技术社区第四届MeetUp上海站——HBase应用实践专场

    HBase—Hadoop Database是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系统”。HBase的特点是高可靠性、高性能、面向列、可伸缩的分布式存储系统,如今HBase已经广泛应用于各互联网行业...

    文章 hbase小能手 2018-11-06 1260浏览量

  • 大数据心法来了!一站式玩转MaxCompute,还有开发者资源等你领!

    阿里云大数据计算平台开发者版2019年3月推出,MaxCompute正在成为开发者的免费大数据平台。今天,MaxCompute在企业构建自己的数据处理平台实践中起到了至关重要的作用,我们特别精选了企业的真实实践案例:从最大的兴趣社群平台小打卡;到90后、00后喜欢的克拉克拉;从互联网金融的典型天弘...

    文章 晋恒 2019-07-24 1878浏览量

  • 漫谈阿里大数据

    免费开通大数据服务:https://www.aliyun.com/product/odps 目前人人都在谈大数据,谈DT时代,但是,大数据是什么,每个人都有自己的一个看法,好比盲人摸象,每个都认为自己摸到是真正的大象。我也担心我所看到的,只是大数据的冰山一角,毕竟,将引领整个人类下一次变革的大数据...

    文章 隐林 2017-02-23 6902浏览量

  • 数禾云上数据湖最佳实践

    本文所涉及最佳实践 EMR弹性低成本离线大数据分析最佳实践:https://bp.aliyun.com/detail/36 单账户下企业分账最佳实践 https://bp.aliyun.com/detail/168 RI和SCU全链路使用实践:https://bp.aliyun.com/deta...

    文章 最佳实践小文 2021-01-19 191浏览量

  • 数禾云上数据湖最佳实践

    作者:程俊杰,当前在数禾科技大数据部担任大数据架构师的职位,负责阿里云平台产品的架构开发和维护,曾在1号店、拍拍贷、2345从事大数据平台架构方面的工作。目录1. 数禾科技 2. 云上自建CDH 3. 云上混合架构 4. 阿里云第一代数据湖 4.1. 什么是数据湖 4.2. 阿里云数据湖设计 4....

    文章 阿里云E-MapReduce团队 2021-02-07 201浏览量

  • 数禾云上数据湖最佳实践

    作者:程俊杰,当前在数禾科技大数据部担任大数据架构师的职位,负责阿里云平台产品的架构开发和维护,曾在1号店、拍拍贷、2345从事大数据平台架构方面的工作。 目录 1. 数禾科技2. 云上自建CDH 3. 云上混合架构4. 阿里云第一代数据湖4.1. 什么是数据湖4.2. 阿里云数据湖设计 4.2....

    文章 阿里云E-MapReduce团队 2021-01-18 2510浏览量

1 2 3 4 5 >

云产品推荐

上海奇点人才服务相关的云产品 小程序定制 上海微企信息技术相关的云产品 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 自然场景识别相关的云产品 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT