• 关于

    hadoop 存储过程

    的搜索结果
  • Hadoop,有所为而有所不为

    【51CTO专稿】使用大数据技术有着强烈的吸引力,而如今没有比Apache Hadoop更诱人的大数据技术了,这种可扩展的数据存储平台是许多大数据解决方案的核心。 但是尽管Hadoop颇具吸引力,想了解Hadoop能够为企业扮演什么角色、如何最有效地部署它,仍要面临一条很陡的学习曲线。换句话...

    文章 cometwo123 2012-10-12 1019浏览量

  • 【Hadoop Summit Tokyo 2016】中型组织的数据基础设施架构:收集、存储和分析的技巧

    本讲义出自 Egor Pakhomov在Hadoop Summit Tokyo 2016上的演讲,主要分享了数据收集、存储和分析的技巧,介绍了为什么SQL如此的重要以及如何在Hadoop中使用SQL,以及在数据存储过程中如何此案呢过做到使得存储的数据能够既能易于查询又能容易地进行改变,以及如何使用...

    文章 小猫吃鱼569 2017-02-26 1357浏览量

  • 【Hadoop Summit Tokyo 2016】Hadoop Common与HDFS中有什么新特性?

    本讲义出自Tsuyoshi Ozawa在Hadoop Summit Tokyo 2016上的演讲,主要分享了Hadoop 3 Common与HDFS出现的新特性,因为新版本的Hadoop运行在JDK8上,在应用构建的过程中,所以需要使用JDK8编译源代码,并且新版本的Hadoop具有更好的库管理,...

    文章 小猫吃鱼569 2017-02-28 1384浏览量

  • 万券齐发助力企业上云,爆款产品低至2.2折起!

    限量神券最高减1000,抢完即止!云服务器ECS新用户首购低至0.95折!

    广告

  • Hadoop工具如何形成SAP Hana的大数据平台

    自2008年以来,SAP Hana一直是领先的数据库管理系统之一。它比许多其他数据库管理解决方案能够更有效地处理数据,主要是因为它可以使用一些最先进的Hadoop工具。没有Hadoop,大多数SAP Hana数据库将是相对无用的。访问大多数数据集将是困难的,特别是在它们存储原始数据的时候。 为什...

    文章 知与谁同 2017-08-01 1082浏览量

  • Hadoop专业解决方案之构建Hadoop企业级应用

    一、大数据的挑战   大数据面对挑战是你必须重新思考构建数据分析应用的方式。传统方式的应用构建是基于数据存储在不支持大数据处理的基础之上。这主要是因为一下原因:   1.传统应用的基础设施是基于传统数据库访问模式设计的,它不支持Hadoop;   2.数据存储在Hadoop之上,实时访问集群中部分...

    文章 阿尔法胖哥 2013-11-23 470浏览量

  • 企业如何选择Hadoop

    本文讨论Apache Hadoop大数据工具及技术,帮助有效管理实时的大数据,并讨论Apache Hadoop大数据分析的优缺点。帮助企业认识Hadoop,在选择Hadoop技术方案上做出抉择。 一、什么是大数据分析工具及技术 Hadoop是目前的处理和存储海量数据的最佳工具。Hadoop可以...

    文章 jieforest 2013-10-12 603浏览量

  • Hadoop专业解决方案之构建Hadoop企业级应用

    一、大数据的挑战   大数据面对挑战是你必须重新思考构建数据分析应用的方式。传统方式的应用构建是基于数据存储在不支持大数据处理的基础之上。这主要是因为一下原因:   1.传统应用的基础设施是基于传统数据库访问模式设计的,它不支持Hadoop;   2.数据存储在Hadoop之上,实时访问集群中部分...

    文章 胖子哥 2016-04-19 1054浏览量

  • 企业如何选择Hadoop

    版权声明:本文为博主chszs的原创文章,未经博主允许不得转载。 https://blog.csdn.net/chszs/article/details/8301726 企业如何选择Hadoop 作者:chs...

    文章 chszs 2012-12-16 459浏览量

  • 关于hadoop

    hadoop 是什么? 1. 适合海量数据的分布式存储与计算平台。 海量: 是指 1T 以上数据。 分布式: 任务分配到多态虚拟机上进行计算。   2. 多个任务是怎么被分配到多个虚拟机当中的? 分配是需要网络通讯的。而且是需要启动资源 或者 消耗一些硬件上的配置。 单 JVM 关注的如何『处理』...

    文章 effort880829 2016-11-28 746浏览量

  • 数据库必知词汇:Hadoop

    Apache Hadoop是一个由Apache基金会所开发的分布式系统基础架构,它允许使用简单的编程模型跨计算机集群对大型数据集进行分布式处理。它被设计成从单个服务器扩展到数千台机器,每台机器都提供本地计算和存储。库本身的设计目的是在应用层检测和处理故障,而不是依赖硬件来提供高可用性,因此在计算机...

    文章 萌萌怪兽 2020-02-23 111浏览量

  • 《深入理解大数据:大数据处理与编程实践》一一1.4 Hadoop系统简介

    本节书摘来自华章计算机《深入理解大数据:大数据处理与编程实践》一书中的第1章,第1.4节,作者 主 编:黄宜华(南京大学)副主编:苗凯翔(英特尔公司),更多章节内容可以访问云栖社区“华章计算机”公众号查看。 1.4 Hadoop系统简介 1.4.1 Hadoop的概述与发展历史Hadoop系统最初...

    文章 华章计算机 2017-07-04 764浏览量

  • 【Hadoop Summit Tokyo 2016】将HDFS演进成广义分布式存储子系统

    本讲义出自Sanjay Radia与Jitendra Pandey在Hadoop Summit Tokyo 2016上的演讲,主要分享了HDFS的相关概念,分享了HDFS从过去的演进过程以及在未来的发展方向,在讲义中介绍了目前值得关注的问题:文件和存储块的扩展性问题,并且分享了存储容器对于存储层的...

    文章 小猫吃鱼569 2017-02-26 2074浏览量

  • Hadoop高级培训课程大纲-管理员版

    一、课程概述 本次培训课程主要面向大数据系统管理人员和开发设计人员,基于开源社区大数据应用最活跃的Hadoop和HBase技术框架。围绕分布式文件存储(HDFS)、分布式并行计算(Map/Recue)和非关系型数据库(NoSql)三个大数据核心应用展开,旨在帮助培训对象建立起完整的大数据理论基础框...

    文章 胖子哥 2016-04-19 1556浏览量

  • 结合使用Hadoop与Couchbase Server

    文章讲的是结合使用Hadoop与Couchbase Server,Hadoop 将许多重要特性结合在一起,这使 Hadoop 对于将大量数据分解为更小、实用的数据块非常有用。   Hadoop 的主要组件是 HDFS 文件系统,它支持将信息分布到整个集群中。对于使用这种分布格式存储的信息,可以通过...

    文章 青衫无名 2017-09-01 1040浏览量

  • Hadoop 3.x 新特性剖析系列1

    1.概述   目前从Hadoop官网的Wiki来看,稳定版本已经发行到Hadoop2.9.0,最新版本为Hadoop3.1.0,查阅JIRA,社区已经着手迭代Hadoop3.2.0。那么,今天笔者就带着大家来剖析一下Hadoop3,看看它给我们带来了哪些新特性。 2. 内容   从功能上来说,Ha...

    文章 smartloli 2018-04-14 1961浏览量

  • 《R与Hadoop大数据分析实战》一第1章 R和Hadoop入门

    本节书摘来自华章出版社《R与Hadoop大数据分析实战》一书中的第1章,作者 (印)Vignesh Prajapati,更多章节内容可以访问云栖社区“华章计算机”公众号查看 第1章 R和Hadoop入门 第1章讲述了几个与R和Hadoop基本知识相关的主题,包括:R的安装、功能和数据建模Hadoo...

    文章 华章计算机 2017-07-03 1129浏览量

  • Hadoop2.x运维实战之入门手册v1.0

    Hadoop2.x运维实战之入门手册V1.0 0.Hadoop2.x生态圈介绍1.常用组件介绍(体系结构+进程)   1.1HDFS   1.2MapReduce   1.3Yarn   1.4Hive   1.5Hbase   1.6Zookeeper    1.7Flume    1....

    文章 sh_jepson 2016-03-06 1311浏览量

  • Hadoop HBase 单机环境简单配置教程

    写在前面: Hadoop是Apache的一个项目,它是一个实现了MapReduce计算模型的可以运用于大型集群并行计算的分布式并行计算编程框架,当然分布式计算离不开分布式存储,Hadoop框架包含了分布式存储系统HDFS(Hadoop Distributed File System),其存储和数据...

    文章 知与谁同 2017-08-01 6922浏览量

  • 《Hadoop与大数据挖掘》一2.1 Hadoop概述

    本节书摘来华章计算机《Hadoop与大数据挖掘》一书中的第1章 ,第1.1节,张良均 樊 哲 位文超 刘名军 许国杰 周 龙 焦正升 著 更多章节内容可以访问云栖社区“华章计算机”公众号查看。 2.1 Hadoop概述 2.1.1 Hadoop简介随着现代社会的发展,各种信息数据存量与增量都非常大...

    文章 华章计算机 2017-06-26 1274浏览量

  • 达观数据分析平台架构和Hive实践——TODO

    转自: http://www.infoq.com/cn/articles/hadoop-ten-years-part03 编者按:Hadoop于2006年1月28日诞生,至今已有10年,它改变了企业对数据的存储、处理和分析的过程,加速了大数据的发展,形成了自己的极其火爆的技术生态圈,并受到...

    文章 桃子红了呐 2017-11-12 978浏览量

  • 如何在E-MapReduce中玩转OSS

    背景介绍 阿里云E-MapReduce公测以来,陆陆续续有一批用户开始在E-MapReduce上创建和使用集群。在和客户的交流和沟通过程中,我们发现这样一个现象:大部分用户更倾向于将数据存储在自建的集群HDFS中。这里面有几种考虑: 使用习惯:很多用户曾经线下或者线上运维过自己的集群,业务数据都...

    文章 鱼跟猫 2016-03-24 6877浏览量

  • Hadoop高级培训课程大纲-开发者版

    一、课程概述 本次培训课程主要面向大数据系统管理人员和开发设计人员,基于开源社区大数据应用最活跃的Hadoop和HBase技术框架,围绕分布式文件存储(HDFS)、分布式并行计算(Map/Recue)和非关系型数据库(NoSql)三个大数据核心应用展开,旨在帮助培训对象建立起完整的大数据理论基础框...

    文章 胖子哥 2016-04-19 1649浏览量

  • 《深入理解Hadoop(原书第2版)》——第3章 初识Hadoop框架 3.1 安装类型

    本节书摘来自华章计算机《深入理解Hadoop(原书第2版)》一书中的第3章,第3.1节,作者 [美]萨米尔·瓦德卡(Sameer Wadkar),马杜·西德林埃(Madhu Siddalingaiah),杰森·文纳(Jason Venner),译 于博,冯傲风,更多章节内容可以访问云栖社区“华章计...

    文章 华章计算机 2017-05-02 1449浏览量

  • Hadoop,开发者纠结的十件事

    开源数据处理平台Hadoop在大数据时代的今天有着非常广泛的应用。著名的大象图标遍布各行各业,从医疗记录到银行交易,从车票预定到房屋租赁,乃至很多科学数据处理,都可以见到Hadoop的身影。 在Hadoop生态繁荣的背后,是开发者们夜以继日的开发与支持。而在用户得益甚至赞赏这些应用的时候,开发者们...

    文章 skyme 2016-05-05 1369浏览量

  • hadoop笔记一

    Hadoop是Apache软件基金会旗下的一个开源分布式计算平台。 是Apache 下的一个项目,由HDFS、MapReduce、HBase、Hive 和ZooKeeper等成员组成。其中,HDFS 和MapReduce 是两个最基础最重要的成员 Hadoop 由许多元素构成。其最底部是 H...

    文章 e生态 2014-03-21 1018浏览量

  • Cloudera Manager简介

    Hadoop家族 整个Hadoop家族由以下几个子项目组成: Hadoop Common: Hadoop体系最底层的一个模块,为Hadoop各子项目提供各 种工具,如:配置文件和日志操作等。 HDFS: 是Hadoop应用程序中主要的分布式储存系统, HDFS集群包含了一个NameNode(主节...

    文章 skyme 2016-09-20 25892浏览量

  • 数据库必知词汇:Hive

    Hive是基于Hadoop的一个数据仓库工具,用来进行数据提取、转化、加载,这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。Apache Hive数据仓库软件有助于使用SQL读取,写入和管理驻留在分布式存储中的大型数据集。 可以将结构投影到已经存储的数据上。提供了命令行工具和J...

    文章 萌萌怪兽 2020-02-23 144浏览量

  • 《Hadoop与大数据挖掘》一2.1.5 Hadoop生态系统

    本节书摘来华章计算机《Hadoop与大数据挖掘》一书中的第2章 ,第2.1.5节,张良均 樊 哲 位文超 刘名军 许国杰 周 龙 焦正升 著 更多章节内容可以访问云栖社区“华章计算机”公众号查看。 2.1.5 Hadoop生态系统 如图2-12所示,Hadoop的生态圈其实就是一群动物在狂欢。我们...

    文章 华章计算机 2017-06-26 1238浏览量

  • hadoop mapreduce开发实践之输出数据压缩

    1、hadoop 输出数据压缩 1.1、为什么要压缩? 输出数据较大时,使用hadoop提供的压缩机制对数据进行压缩,可以指定压缩的方式。减少网络传输带宽和存储的消耗; 可以对map的输出进行压缩(map输出到reduce输入的过程,可以shuffle过程中网络传输的数据量) 可以对reduce...

    文章 科技小能手 2017-11-12 797浏览量

  • 【Hadoop】HDFS的运行原理

     简介 HDFS(Hadoop Distributed File System )Hadoop分布式文件系统。是根据google发表的论文翻版的。论文为GFS(Google File System)Google 文件系统(中文,英文)。 HDFS有很多特点:     ① 保存多个副本,且提供容错机...

    文章 skyme 2016-05-05 2030浏览量

1 2 3 4 ... 61 >

云产品推荐

阿里云企业服务平台 陈四清的老板信息查询 上海奇点人才服务相关的云产品 爱迪商标注册信息 安徽华轩堂药业的公司信息查询 小程序定制 上海微企信息技术相关的云产品 国内短信套餐包 ECS云服务器安全配置相关的云产品 天籁阁商标注册信息 开发者问答 阿里云建站 自然场景识别相关的云产品 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 北京芙蓉天下的公司信息查询