• 关于

    最好用hadoop 中文

    的搜索结果
  • 数据工程师必须掌握的7个大数据实战项目

    原创: Lenis 有关SQL 1作为一名电影爱好者,我阅片无数,有些片子还经常翻来覆去看个好几遍。小时候因为这事儿,没少被我妈抓耳朵,“看过的片子为啥还要倒二遍?”我也说不上来,就是单纯的爱看。 男人爱看的电影,以武侠,动作,科技为多,也认识了一帮明星,比如尼古拉斯凯奇,史泰龙,李小龙,成龙,李...

    文章 茶什i 2020-01-03 2386浏览量

  • Spark集群安装和使用

    本文主要记录 CDH5 集群中 Spark 集群模式的安装过程配置过程并测试 Spark 的一些基本使用方法。 安装环境如下: 操作系统:CentOs 6.5 Hadoop 版本:cdh-5.4.0 Spark 版本:cdh5-1.3.0_5.4.0 关于 yum 源的配置以及 Hadoo...

    文章 雨客 2016-04-08 4440浏览量

  • 独家 | 一文读懂大数据处理框架

    前言 说起大数据处理,一切都起源于Google公司的经典论文:《MapReduce:Simplied Data Processing on Large Clusters》。在当时(2000年左右),由于网页数量急剧增加,Google公司内部平时要编写很多的程序来处理大量的原始数据:爬虫爬到的网页...

    文章 行者武松 2017-07-03 2462浏览量

  • 万券齐发助力企业上云,爆款产品低至2.2折起!

    限量神券最高减1000,抢完即止!云服务器ECS新用户首购低至0.95折!

    广告

  • 《从Lucene到Elasticsearch:全文检索实战》已出版!

    一、前言 决定在CSDN写博客的原因是想把自己解决过的问题、踩过的坑、总结出来的经验记录下来,作为编程之路的“笔记本”,同时也能给遇到同样问题的人提供参考、节省时间,写书的初衷也一样。 二、缘起 说一下写书的前因后果。中国科学院大学雁栖湖校区是很重要的一年,师资团队无可挑剔,每次上课去的...

    文章 姚攀 2017-12-05 1266浏览量

  • 一文读懂大数据计算框架与平台

    1. 前言 计算机的基本工作就是处理数据,包括磁盘文件中的数据,通过网络传输的数据流或数据包,数据库中的结构化数据等。随着互联网、物联网等技术得到越来越广泛的应用,数据规模不断增加,TB、PB量级成为常态,对数据的处理已无法由单台计算机完成,而只能由多台机器共同承担计算任务。而在分布式环境中进行...

    文章 小旋风柴进 2017-05-02 2723浏览量

  • 【独家】一文读懂大数据计算框架与平台

    1. 前言 计算机的基本工作就是处理数据,包括磁盘文件中的数据,通过网络传输的数据流或数据包,数据库中的结构化数据等。随着互联网、物联网等技术得到越来越广泛的应用,数据规模不断增加,TB、PB量级成为常态,对数据的处理已无法由单台计算机完成,而只能由多台机器共同承担计算任务。而在分布式环境中进行...

    文章 行者武松 2017-05-01 1545浏览量

  • HBase全网最佳学习资料汇总

    前言 HBase这几年在国内使用的越来越广泛,在一定规模的企业中几乎是必备存储引擎,互联网企业阿里巴巴、京东、小米都有数千台的HBase集群,中国电信的话单、中国人寿的保单都是存储在HBase中。注意大公司有数十个数百个HBase集群,此点跟Hadoop集群很不相同。另外,数据需求,很多公司是my...

    文章 hbase小能手 2018-11-05 4761浏览量

  • 一名小小的SQL Server DBA想谈一下SQL Server的能力

    原文:一名小小的SQL Server DBA想谈一下SQL Server的能力 一名小小的SQL Server DBA想谈一下SQL Server的能力 百度上暂时还没有搜索到相关的个人写的比较有价值的文章至少在中文网络的世界里面没有 但是在微软的网站有这样一篇文章《比较 SQL Server 与...

    文章 杰克.陈 2015-02-02 988浏览量

  • HBase全网最佳学习资料汇总

    前言 HBase这几年在国内使用的越来越广泛,在一定规模的企业中几乎是必备存储引擎,互联网企业阿里巴巴、京东、小米都有数千台的HBase集群,中国电信的话单、中国人寿的保单都是存储在HBase中。注意大公司有数十个数百个HBase集群,此点跟Hadoop集群很不相同。另外,数据需求,很多公司是my...

    文章 封神 2017-08-13 24882浏览量

  • HBase API 详细例子(封装的DAO类)

    HBase中没有库的概念 HBase lib目录下所有JAR包复制到项目中,Hbase 版本0.98.5 package com.zxing.imgQRCode; import java.io.IOException; import java.util.LinkedList; import ja...

    文章 神巧合 2016-08-28 5364浏览量

  • 2016年杭州第四次spark meetup见闻

    引言 spark发展非常快,2.0都快要发布了。在不同的城市都会有一些交流聚会,杭州有很多互联网企业,创业的氛围也非常好。大家每隔一段时间的交流还是必须的。不过最好还是时间上密集点,最好重点在于大家讨论,互相交流。这次是挖财网的时金魁同学主办的,感谢时金魁同学,演讲稿下载链接 期待2.0发布,最近...

    文章 封神 2016-06-05 5409浏览量

  • 【工具】ganglia 监控技术分析

        Ganglia是一个分布式的监控工具,用来对Grid和Cluster上面的节点进行监控,利用它提供的web界面可以看到每个节点状态,并且可以输出图形化的表示。 Ganglia 是 UC Berkeley 发起的一个开源监视项目,设计用于测量数以千计的节点。每台计算机都运行一个收集和发送度量...

    文章 北在南方 2016-04-13 1591浏览量

  • 【Java开发者专场】阿里特邀专家徐雷:Java为王,互联网高并发架构设计选型之路

    本篇文章来自于2018年12月22日举办的《阿里云栖开发者沙龙—Java技术专场》,徐雷专家是该专场第三位演讲的嘉宾,本篇文章是根据徐雷专家在《阿里云栖开发者沙龙—Java技术专场》的演讲视频以及PPT整理而成。 摘要:Java从诞生以来几乎一直是排名第一的语言,长期霸榜。在架构师成长道路中,学...

    文章 李博 bluemind 2018-12-27 2966浏览量

  • 阿里巴巴为什么选择Apache Flink?

    作者:王峰 整理:韩非 本文主要整理自云栖大会阿里巴巴计算平台事业部资深技术专家王峰(花名:莫问)在云栖大会‘开发者生态峰会’上发表的演讲。 伴随着海量增长的数据,数字化时代的未来感扑面而至。不论是结绳记事的小数据时代,还是我们正在经历的大数据时代,计算的边界正在被无限拓宽,而数据的价值,再也难...

    文章 Ververica 2019-05-05 1323浏览量

  • 独家 | 关于数据湖架构、战略和分析的8大错误认知(附链接)

    翻译:张玲 校对:丁楠雅 文章来源:微信公众号 数据派THU 本文打破有关数据湖的8个错误认知,错误认知包括3方面,还提出了5个小技巧,以构建一个灵活的、可交付业务价值的数据湖。 本文的目的是构建数据湖,并提供适应企业数据策略的背景信息。咨询公司和提供商提出的意见相互矛盾,因此,这些信息历来一直...

    文章 初商 2019-08-28 2112浏览量

  • HBase从入门到精通-经典资料汇总(持续更新v2019.10)

    用户福利 限时获取云数据库HBase一年仅需1元的使用权,广大HBase用户学习研究必备,更多内容请参考链接。 文末有技术交流群,欢迎添加。 前言 HBase是大数据架构中最常用的面向半结构、非结构化的存储系统,是Google三驾马车之一Bigtable的开源实现(Apache顶级项目),具备高可...

    文章 天梧 2019-12-17 2482浏览量

  • 全球最热门的NoSQL系统——MongoDB技术实践与探索

    中国云计算产业最具影响力的盛会之一——2016杭州云栖大会(https://yunqi.aliyun.com/)将在云栖小镇召开。连续举办七届的云栖大会一直是业界了解阿里云计算生态发展和应用趋势、体验前沿技术和产品的最佳平台,来自海内外的上万名开发者、创业者聚集于此,分享着他们对云计算的思考与实践...

    文章 云学习小组 2016-09-26 9286浏览量

  • 《财富》选出20位大数据行业顶尖人才

    大数据不只是要处理很多的数字,还得要通过这些数字建立模型、深入挖掘,并且寻找那些有可能改变企业运营方式的信息。以下谨为大家介绍20位大数据领域的顶尖人才。 Pinterest数据科学家安德莉亚•伯班克 Pinterest是一家以图片为主的社交网络,数据科学家安德莉亚•伯班克主要负责该公司的A/...

    文章 小旋风柴进 2017-05-02 1116浏览量

  • 开发运维DBA看过来:容器、Docker、DevOps、数据库学习资料(1000+ PPT讲义)大汇总

    很多企业都了解DevOps理论,但仍然很难落地,在企业内部,该如何实施DevOps呢?阿里云容器技术专家为你解读DevOps企业最佳实践。 阿里云大学系列精品课:阿里专家带你玩转DevOps企业最佳实践 (限时优惠中,名额有限) 完善的DevOps课程体系,阿里专家团讲解+答疑,理论实践结合助力...

    文章 云木西 2018-07-19 12917浏览量

  • SolrLucene优劣势分析

    最早lucene2.4以及以前,追溯到2008年前后,lucene刚刚引起大家的关注,到后来Nutch、solr的出现,lucene变得更加热。Nutch、Solr的发展,极大推动了lucene的升级。对于一些接触过搜索,使用过lucene、solr的人来说,一般都会感觉lucene、solr很牛...

    文章 中间件小哥 2016-04-08 4507浏览量

  • 阿里巴巴,果然开始拥有“预测未来“的能力了

    文 | 史中 顶灯闪烁,笛声响彻。 救护车载着病人,冲向茫茫车海,在时间的赛道上狂奔。 高德地图、GPS 卫星导航、路面磁感线圈、1300 个路口摄像头同时开动,为这辆救护车勘探最快路线; GPS 传回实时数据,后台根据辅助数据纠偏,锚定救护车每一刻的精确位置; 救护车将要经过的沿途,车辆情况被实...

    文章 Ververica 2019-04-28 1019浏览量

  • 阿里巴巴飞天大数据平台MaxCompute(原名ODPS)全套攻略(持续更新20200109)

    阿里巴巴飞天大数据平台MaxCompute持续进化;   概况介绍 大数据计算服务(MaxCompute,原名ODPS,产品地址:https://www.aliyun....

    文章 隐林 2017-05-05 115564浏览量

  • 搜索引擎系统的原理和实践

    >>搜索引擎的原理和分析指标 (1)搜索引擎的工作原理 搜索引擎的工作原理大致可以分为: 搜集信息:搜索引擎的一个部分可以实现信息自动搜集。 整理信息:搜索引擎通过创建索引为抓取到的信息添加规则。 接受查询:用户向搜索引擎输入关键词提交查询,系统接受用户查询,并且排序后并返回查询结果。...

    文章 邴越 2016-05-05 2165浏览量

  • HBase查询优化

    1.概述 HBase是一个实时的非关系型数据库,用来存储海量数据。但是,在实际使用场景中,在使用HBase API查询HBase中的数据时,有时会发现数据查询会很慢。本篇博客将从客户端优化和服务端优化两个方面来介绍,如何提高查询HBase的效率。 2.内容 这里,我们先给大家介绍如何从客户端优化查...

    文章 smartloli 2018-08-05 1106浏览量

  • 死磕 Elasticsearch 方法论:普通程序员高效精进的 10 大狠招!(Elasticsearch教程序章)|MVP讲堂

    作者:阿里云MVP 铭毅下节链接: Elasticsearch学习,请先看这一篇! 开篇人工智能、大数据快速发展的今天,对于 TB 甚至 PB 级大数据的快速检索已然成为刚需。Elasticsearch 作为开源领域的后起之秀,从2010年至今得到飞跃式的发展。 Elasticsearch 以其...

    文章 MVP时间辰悠 2018-12-14 3266浏览量

  • 阿里RocketMQ是怎样孵化成Apache顶级项目的?

    写在前面 2016 年 11 月 11 号, 对阿里巴巴中间件消息团队来说,有着极其特殊的意义。这一天,在光明顶上奋战的小伙伴们见证了 RocketMQ 低延迟存储架构的成功试水,完成了保障双十一如丝般顺滑的既定目标。在另一个战场,历时 3 个月的开源重塑之后,Apache RocketMQ Ch...

    文章 中间件小哥 2018-01-15 5145浏览量

  • 银行爱“IOE”爱得有多深

    摘自:微头条,阿尔法工场欧阳长征推荐 导读:如果银行是一家海鲜酒楼,把IBM换掉相当于大搞一次装修,把Oracle换掉相当于把厨子和菜谱全部换掉,把EMC换掉相当于把放食材工具的储物间换个地方。难度在于,这海鲜酒楼白天黑夜都还要照常营业 问题一:搞IBM的原因: 1.最近中国和俄罗斯在互做小甜...

    文章 小旋风柴进 2017-05-02 1404浏览量

  • Flink大数据计算的机遇与挑战

    作者: 王绍翾(大沙) 本文来自于王绍翾在2018年08月11日Flink China Meetup。王绍翾,花名“大沙”,加州大学圣迭戈分校计算机工程的博士,Apache Flink Commiter。目前在阿里负责Flink平台以及生态的一些工作。 本文内容如下: 流计算核心技术 Flink是...

    文章 Ververica 2019-04-25 653浏览量

  • Postgres中国区主席分享PG大象会见闻:有技术、有情怀、有帅哥、有妹纸

    导语:本文由Postgres中国区主席、阿里云数据库专家萧少聪所写。他多角度分享了在10月27日、28日在上海举行的PG大象会见闻:技术角度,分享了使用PG的业内代表;情怀角度,记录了大会期间的点点滴滴;当然也有一些福利,帅哥美女,且全是高清大图。 这是一届不一样的技术大会,在PostgreSQ...

    文章 身行 2016-11-03 3315浏览量

  • 大数据环境下该如何优雅地设计数据分层

    发个牢骚,搞大数据的也得建设数据仓库吧。而且不管是传统行业还是现在的互联网公司,都需要对数据仓库有一定的重视,而不是谈一句自己是搞大数据的就很厉害了。数据仓库更多代表的是一种对数据的管理和使用的方式,它是一整套包括了etl、调度、建模在内的完整的理论体系。现在所谓的大数据更多的是一种数据量级的增大...

    文章 隐林 2017-07-20 38200浏览量

1 2 >

云产品推荐

上海奇点人才服务相关的云产品 小程序定制 上海微企信息技术相关的云产品 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 自然场景识别相关的云产品 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT