• 关于

    免费hadoop 创建库

    的搜索结果
  • 一个 Hadoop 老兵的自白

    Apache Hadoop 是一个免费软件,但实际上,除非是拥有庞大工程师团队的大公司,否则最好不要去创建仅供内部使用的Hadoop版本,因为如果要购买技术支持,那 Hadoop 就不是免费的了。Jim Scott 是 MapR 企业战略&架构部门的负责人。2009年,他接触了自己的第一个...

    文章 行者武松 2017-06-03 987浏览量

  • 在Facebook身上找到的大数据灵感

    要想预测大数据的走势,明确自己的关注点,Facebook是不二之选,因为它收集的数据可谓海量(100PB,也即102400TB)。而要想处理这些数据,Cassandra NoSQL数据存储+Hive查询语言+Hadoop分布式数据库是最佳拍档。此文谈到了大数据初创企业应该如何从Facebook身上...

    文章 cometwo123 2012-10-19 826浏览量

  • 高可用Hadoop平台-Hue In Hadoop

    1.概述   前面一篇博客《高可用Hadoop平台-Ganglia安装部署》,为大家介绍了Ganglia在Hadoop中的集成,今天为大家介绍另一款工具——Hue,该工具功能比较丰富,下面是今天为大家分享的内容目录: Hue简述 Hue In Hadoop 截图预览   本文所使用的环境是Ap...

    文章 smartloli 2016-04-25 3266浏览量

  • 万券齐发助力企业上云,爆款产品低至2.2折起!

    限量神券最高减1000,抢完即止!云服务器ECS新用户首购低至0.95折!

    广告

  • 高可用Hadoop平台-Hue In Hadoop

    1.概述 今天为大家介绍另一款工具——Hue,该工具功能比较丰富,下面是今天为大家分享的内容目录: Hue简述 Hue In Hadoop 截图预览   本文所使用的环境是Apache Hadoop-2.6版本,下面开始今天的内容分享。 2.Hue简述   Hue是一个开源的Apache Ha...

    文章 smartloli 2016-04-20 2728浏览量

  • 高可用Hadoop平台-Hue In Hadoop

    1.概述   前面一篇博客《高可用Hadoop平台-Ganglia安装部署》,为大家介绍了Ganglia在Hadoop中的集成,今天为大家介绍另一款工具——Hue,该工具功能比较丰富,下面是今天为大家分享的内容目录: Hue简述 Hue In Hadoop 截图预览   本文所使用的环境是Ap...

    文章 技术mix呢 2017-11-20 974浏览量

  • 《R的极客理想—工具篇》—— 1.5 多人在线协作R开发RStudio Server

    本节书摘来自华章出版社《R的极客理想—工具篇》一 书中的第1章,第1.5节,作者:张丹,更多章节内容可以访问云栖社区“华章计算机”公众号查看。 1.5 多人在线协作R开发RStudio Server 问题R语言开发,哪个工具最好用? 引言RStudio是R语言开发中的利器,是最好用的R语言IDE集...

    文章 华章计算机 2017-07-03 1983浏览量

  • 大数据简介,技术体系分类整理

    一、大数据简介 1、基础概念 大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。大数据技术则主要用来解决海量数据的存储和分析。 2、特点分析 大数据的5V特点(IBM提出):...

    文章 知了一笑 2020-09-15 152浏览量

  • Hadoop大数据平台实战(03):Linux实战安装HBase,并保存数据

    Apache HBase开源免费的Hadoop数据库,使用Java开发的,是一个分布式,可扩展的NoSQL数据库。本文会详细介绍HBase原理、架构、新特性、Linux环境下的安装,安装模式,表创建,简单的CRUD操作。 1、HBase数据库介绍HBase是开源NoSQL数据库,主要用于大数据平...

    文章 徐雷frank 2019-04-07 1110浏览量

  • ES-hadoop写数据到阿里云Elasticsearch

    Elasticsearch是一个基于Lucene的分布式搜索引擎,具有分布式、全文检索、近实时搜索和分析、高可用、模式自由、RESTFul API等诸多优点,在实时搜索、日志处理(ELK)、大数据分析等领域有着广泛的应用。Hadoop是一个由Apache基金会所开发的分布式系统基础架构,核心组件有...

    文章 姚攀 2018-04-03 3248浏览量

  • 手把手教你入门Hadoop(附代码&资源)

    GETINDATA公司创始人兼大数据顾问彼得亚·雷克鲁斯基(Piotr Krewski)和GETINDATA公司首席执行官兼创始人亚当·卡瓦(Adam Kawa) 目录 内容简介设计理念HADOOP组件HDFSYARNYARN 应用程序监控 YARN 应用程序用HADOOP处理数据HADOOP 的...

    文章 技术小能手 2018-05-02 2901浏览量

  • 《R与Hadoop大数据分析实战》一2.4 编写Hadoop MapReduce示例程序

    本节书摘来自华章出版社《R与Hadoop大数据分析实战》一书中的第2章,第2.4节,作者 (印)Vignesh Prajapati,更多章节内容可以访问云栖社区“华章计算机”公众号查看 2.4 编写Hadoop MapReduce示例程序 现在要通过一个很简单且普通的单词统计(word count...

    文章 华章计算机 2017-07-03 1379浏览量

  • Hadoop 生态系统

    1.概述   最近收到一些同学和朋友的邮件,说能不能整理一下 Hadoop 生态圈的相关内容,然后分享一些,我觉得这是一个不错的提议,于是,花了一些业余时间整理了 Hadoop 的生态系统,并将其进行了归纳总结,进而将其以表格的形式进行了罗列。涉及的内容有以下几点: 分布式文件系统 分布式编程模...

    文章 smartloli 2016-08-31 5083浏览量

  • Hadoop集群伸缩难?DLA Spark助力集群快速加弹性

    1. 背景介绍 大数据时代早期,Apache Hadoop 是构建具有海量存储能力数据仓库的首选方案,许多企业用户采用在云上购买ECS,自建Hadoop集群来存储和处理数据。Apache Spark作为一个内存计算框架,具有流处理、批处理,图计算,机器学习,SQL查询等多种能力,社区活跃度高,并且...

    文章 云原生数据湖分析DLA 2020-11-18 733浏览量

  • 地理空间可视化为大数据注入活力

     泡泡网资讯频道9月12日 大数据,是当下IT界热议的话题之一。高容量、高速度、多类型等它的特点,数据的管理、数据的扩充以及数据的展现则是它价值的三个方面。这其中如何把数据很好的呈现出来,从而对其进行挖掘,是所有开发者共同关注的话题。数据呈现的方式多种多样,将大数据进行地理空间可视化,就是其中重要...

    文章 小旋风柴进 2017-04-03 1039浏览量

  • Hadoop大数据平台实战(04):Ubuntu 18.04实战安装Spark大数据引擎并统计字符

    Spark是一个开源的高性能大数据分析引擎,在Hadoop生态系统中非常的重要组成部分,主要的作用就是分析处理大数据,Spark在大数据生态中的作用是替代之前的mapreduce引擎。Spark的性能测试表名将大数据分析处理的性能提高了100倍。Apache Spark使用最先进的DAG调度程序,...

    文章 徐雷frank 2019-04-09 1312浏览量

  • 大数据,数据分析,机器学习,架构等相关系统名称名词解释

    常用的一些软件或其他 1.日志(日志收集,日志处理) 风来了.fox 1.1 Logstash Logstash是一款轻量级的日志搜集处理框架,可以方便的把分散的、多样化的日志搜集起来,并进行自定义的处理,然后传输到指定的位置,比如某个服务器或者文件。 1.2 Filebea...

    文章 风来了 2016-09-09 2788浏览量

  • CDH5.4.7安装分布式Hadoop集群

    应用场景 部署Hadoop集群过程中,可以使用开源的Apache Hadoop或者可以用CDH【国外的一家公司基于开源的封装的】,搭建更加方便,方便扩充节点规模,组件管控,性能监控等等,但是也有一个弊端,针对组件安装的目录,以及生成的配置文件位置比较难找到,目录结构混乱,所以还是请慎用。 ...

    文章 wsc449 2017-11-20 923浏览量

  • 史上最全“大数据”学习资源整理

    史上最全“大数据”学习资源整理 2016-05-17 Hadoop技术博文   当前,整个互联网正在从IT时代向DT时代演进,大数据技术也正在助力企业和公众敲开DT世界大门。当今“大数据”一词的重点其实已经不仅在于数据规模的定义,它更代表着信息技术...

    文章 云雷 2017-06-17 3746浏览量

  • 高可用Hadoop平台-集成Hive HAProxy

    1.概述   这篇博客是接着《高可用Hadoop平台》系列讲,本篇博客是为后面用 Hive 来做数据统计做准备的,介绍如何在 Hadoop HA 平台下集成高可用的 Hive 工具,下面我打算分以下流程来赘述: 环境准备 集成并配置 Hive 工具 使用 Java API 开发 Hive 代码 ...

    文章 smartloli 2016-04-25 2048浏览量

  • 高可用Hadoop平台-集成Hive HAProxy

    1.概述   这篇博客是接着《高可用Hadoop平台》系列讲,本篇博客是为后面用 Hive 来做数据统计做准备的,介绍如何在 Hadoop HA 平台下集成高可用的 Hive 工具,下面我打算分以下流程来赘述: 环境准备 集成并配置 Hive 工具 使用 Java API 开发 Hive 代码 ...

    文章 smartloli 2016-04-19 1667浏览量

  • 《大数据系统构建:可扩展实时数据系统构建原理与最佳实践》一1.8 技术上的最新趋势

    本节书摘来自华章出版社《大数据系统构建:可扩展实时数据系统构建原理与最佳实践》一书中的第1章,第1.8节,南森·马茨(Nathan Marz) [美] 詹姆斯·沃伦(JamesWarren) 著 马延辉 向 磊 魏东琦 译,更多章节内容可以访问云栖社区“华章计算机”公众号查看。 1.8 技术上...

    文章 华章计算机 2017-05-02 1333浏览量

  • 13个最流行机器学习框架 帮你解决网络安全机器学习的困难问题

    在过去的一年中, 机器学习 发展得热火朝天,已成为主流。机器学习的“空降”并非仅仅由廉价的云环境以及 日益强大的GPU硬件驱动 ,同时也受到了开源框架的蓬勃发展的影响。这些开源框架用于提取机器学习中最困难部分,使机器学习可供广泛开发者使用。 用机器学习解决网络安全问题 开源机器学习框架能助力 《 ...

    文章 晚来风急 2017-09-01 7312浏览量

  • 《Hadoop与大数据挖掘》一导读

    前  言 为什么要写这本书最早提出“大数据”时代到来的是全球知名咨询公司麦肯锡,麦肯锡称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”早在2012年,大数据(big data)一词已经被广泛提起,...

    文章 华章计算机 2017-06-26 3142浏览量

  • 铁庵:NoSQL、RDS和大数据异构融合实战,详解PostgreSQL FDW功能原理

    6月23日云栖社区《NoSQL、RDS和大数据异构融合实战》的直播顺利结束,来自阿里云的ApsaraDB数据库产品专家萧少聪(铁庵)与大家分享了通过PostgreSQL实现NoSQL、RDS和大数据异构融合实战。直播中,他重点介绍FDW原理,并结合金融报文处理、物联网数据整合、企业并购重组场景下的...

    文章 场景研读 2016-06-30 11650浏览量

  • 【大数据技术】什么是HBase ?所有的基础都在这儿了

    2006 年10 月Google 发布三架马车之一的《Bigtable:A Distributed Storage System for Strctured Data》论文之后,Powerset 公司就宣布 HBase 在 Hadoop 项目中成立,作为子项目存在。后来,在2010 年左右逐渐成为...

    文章 小猪佩佩 2019-04-19 1063浏览量

  • 数据科学工具包(万余字介绍几百种工具,经典收藏版!)

    本文简介:数据科学家的常用工具与基本思路,数据分析师和数据科学家使用的工具综合概述,包括开源的技术平台相关工具、挖掘分析处理工具、其它常见工具等几百种,几十个大类,部分网址。为数据科学教育和知识分享,提高数据科学人员素质。 数据科学融合了多门学科并且建立在这些学科的理论和技术之上,包括数学、概率...

    文章 小旋风柴进 2017-05-02 2473浏览量

  • 一共81个,开源大数据处理工具汇总(上)

    本文一共分为上下两部分。我们将针对大数据开源工具不同的用处来进行分类,并且附上了官网和部分下载链接,希望能给做大数据的朋友做个参考。下面是第一部分。 查询引擎 一、Phoenix 贡献者::Salesforce 简介:这是一个Java中间层,可以让开发者在Apache HBase上执行SQL查询。...

    文章 孤剑 2015-10-13 2093浏览量

  • Cloudera Manager 5 和 CDH5 本地(离线)安装指南(Hadoop集群搭建)

    转载请注明出处:http://www.wangyongkui.com/hadoop-cdh5。 系统环境 4台联想R510服务器,其中master节点4核心、8GB,其它节点双核心、4GB。 网卡:100M。 共有硬盘6TB。 网络环境内网。 Centos6.5 x64(安装系统时尽量把开发...

    文章 skyme 2016-05-04 4475浏览量

  • 地铁译:Spark for python developers --- 搭建Spark虚拟环境3

    在VirtualBox 上建Ubantu虚机,安装Anaconda,Java 8,Spark,IPython Notebook,以及和Hello world 齐名的wordcount 例子程序。 搭建Spark 环境 本节我们学习搭建 Spark环境: 在Ubuntu 14.04的...

    文章 abel_cao 2016-05-10 752浏览量

  • 百花开放笑声甜,“开源萌宠”庆六一

    “少年易学老难成,一寸光阴不可轻”。树叶因风而动,雏苗因土而长,兴趣要从小培养,给孩子们“施肥”也要让他们印象深刻······儿童节到来之际,云栖社区精选了18款开源软件供孩子们了解,让孩子们在萌宠的陪伴下有个不一样的“六一”。   FreeBSD FreeBSD是一种类UNIX操作系统,U...

    文章 hayden822 2016-05-17 6615浏览量

1 2 3 4 5 >

云产品推荐

上海奇点人才服务相关的云产品 小程序定制 上海微企信息技术相关的云产品 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 自然场景识别相关的云产品 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT