• 关于

    hadoop基本类库api

    的搜索结果
  • 《Hadoop与大数据挖掘》一2.4.1 HDFS Java API操作

    本节书摘来华章计算机《Hadoop与大数据挖掘》一书中的第2章 ,第2.4.1节,张良均 樊 哲 位文超 刘名军 许国杰 周 龙 焦正升 著 更多章节内容可以访问云栖社区“华章计算机”公众号查看。 2.4.1 HDFS Java API操作 Hadoop中关于文件操作类基本上是在org.apach...

    文章 华章计算机 2017-06-26 2549浏览量

  • 《深入理解大数据:大数据处理与编程实践》一一1.4 Hadoop系统简介

    本节书摘来自华章计算机《深入理解大数据:大数据处理与编程实践》一书中的第1章,第1.4节,作者 主 编:黄宜华(南京大学)副主编:苗凯翔(英特尔公司),更多章节内容可以访问云栖社区“华章计算机”公众号查看。 1.4 Hadoop系统简介 1.4.1 Hadoop的概述与发展历史Hadoop系统最初...

    文章 华章计算机 2017-07-04 786浏览量

  • Hadoop I/O

    版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/qq1010885678/article/details/51318453 HDFS中的数据完整性 HDFSZ...

    文章 xiaohei.info 2016-05-04 586浏览量

  • 万券齐发助力企业上云,爆款产品低至2.2折起!

    限量神券最高减1000,抢完即止!云服务器ECS新用户首购低至0.95折!

    广告

  • 《Hadoop与大数据挖掘》——2.4 Hadoop编程开发

    本节书摘来自华章计算机《Hadoop与大数据挖掘》一书中的第2章,第2.4节,作者 张良均 樊哲 位文超 刘名军 许国杰 周龙 焦正升,更多章节内容可以访问云栖社区“华章计算机”公众号查看。 2.4 Hadoop编程开发 Hadoop框架最核心的设计就是HDFS和MapReduce。HDFS为海量...

    文章 华章计算机 2017-07-03 1992浏览量

  • 我为什么说 Python 是大数据全栈式开发语言

    前段时间,ThoughtWorks在深圳举办一次社区活动上,有一个演讲主题叫做“Fullstack JavaScript”,是关于用JavaScript进行前端、服务器端,甚至数据库(MongoDB)开发,一个Web应用开发人员,只需要学会一门语言,就可以实现整个应用。 受此启发,我发现Pyth...

    文章 小旋风柴进 2017-05-02 2131浏览量

  • 推荐5个机器学习API

    机器学习作为大数据的前沿无疑是让人生畏的,因为只有技术极客和数据科学领域的专家才能驾驭机器学习算法和技术,对于大部分企业和组织而言,过去这一直都是一个遥不可及的事情。但是现在这种情况正在发生改变,正如标准的API简化了应用程序的开发一样,机器学习API也降低了这一领域的门槛,让越来越多的人和企业能...

    文章 小旋风柴进 2017-05-02 1481浏览量

  • 推荐5个机器学习API

    机器学习作为大数据的前沿无疑是让人生畏的,因为只有技术极客和数据科学领域的专家才能驾驭机器学习算法和技术,对于大部分企业和组织而言,过去这一直都是一个遥不可及的事情。但是现在这种情况正在发生改变,正如标准的API简化了应用程序的开发一样,机器学习API也降低了这一领域的门槛,让越来越多的人和企业能...

    文章 小旋风柴进 2017-05-02 986浏览量

  • Apache Flink 1.9.0 为什么将支持 Python API ?

    作者:孙金城(金竹) 本文目录:1.最流行的编程语言2.互联网最火热的领域2.1大数据时代,数据量与日俱增2.2数据的价值来源于数据分析2.3数据价值最大化,时效性3.阿尔法与人工智能4.总结 众所周知,Apache Flink(以下简称 Flink)的 Runtime 是用 Java 编写的,而...

    文章 阿里云实时计算Flink 2019-08-03 2819浏览量

  • Apache Flink 1.9.0 为什么将支持 Python API ?

    作者:孙金城(金竹) 本文目录:1.最流行的编程语言2.互联网最火热的领域2.1大数据时代,数据量与日俱增2.2数据的价值来源于数据分析2.3数据价值最大化,时效性3.阿尔法与人工智能4.总结 众所周知,Apache Flink(以下简称 Flink)的 Runtime 是用 Java 编写的,而...

    文章 Ververica 2019-08-01 1832浏览量

  • Apache Flink 1.9重磅发布!首次合并阿里内部版本Blink重要功能

    8月22日,Apache Flink 1.9.0 版本正式发布,这也是阿里内部版本 Blink 合并入 Flink 后的首次版本发布。此次版本更新带来的重大功能包括批处理作业的批式恢复,以及 Table API 和 SQL 的基于 Blink 的新查询引擎(预览版)。同时,这一版本还推出了 Sta...

    文章 阿里云实时计算Flink 2019-08-26 1590浏览量

  • 《循序渐进学Spark》一第1章

    本节书摘来自华章出版社《循序渐进学Spark》一书中的第1章,第1.1节,作者   小象学院 杨 磊 更多章节内容可以访问云栖社区“华章计算机”公众号查看。  第1章 Spark架构与集群环境 本章首先介绍Spark大数据处理框架的基本概念,然后介绍Spark生态系统的主要组成部分,包括Spar...

    文章 华章计算机 2017-05-02 2210浏览量

  • Kafka Streams 剖析

    1.概述   Kafka Streams 是一个用来处理流式数据的库,属于Java类库,它并不是一个流处理框架,和Storm,Spark Streaming这类流处理框架是明显不一样的。那这样一个库是做什么的,能应用到哪些场合,如何使用。笔者今天就给大家来一一剖析这些内容。 2.内容   首先,我...

    文章 smartloli 2017-09-14 1425浏览量

  • Spark-快速上手

    快速上手 Spark 的交互式 shell( 用 Python 或Scala) 介 绍 它的 API 。当演示如何在 Java, Scala 和 Python 写独立的程序 时 ,看 编 程指南里完整的参考。依照 这 个指南,首先从 Spark 网站下 载 一个 Spar...

    文章 小金子 2016-04-21 981浏览量

  • Apache Flink实战(一) - 初识Flink

    了解Flink是什么,Flink应用程序运行的多样化,对比业界常用的流处理框架,Flink的发展趋势,Flink生态圈,Flink应用场景及Flink如何进行高效的Flink学习。 0 相关源码 1 前言 1.1 功能 1.2 用户 国际 国内 1.3 特点 ◆ 结合Java、Scal...

    文章 javaedge 2019-06-15 2127浏览量

  • 谈谈互联网后端基础设施

    本文更新于2016.12.12, 加入了扩展章节 对于一个互联网企业,后端服务是必不可少的一个组成部分。抛开业务应用来说,往下的基础服务设施做到哪些才能够保证业务的稳定可靠、易维护、高可用呢?纵观整个互联网技术体系再结合公司的目前状况,个人认为必不可少或者非常关键的后端基础技术/设施如下图所示: ...

    文章 微wx笑 2018-01-15 1194浏览量

  • 云计算时代 Java 运行时不止 JRE

    云计算时代 Java 运行时不止 JRE 前言 Java 语言于 1995 年由 Sun 公司首次发布,次年发布了 Java 开发工具包也就是常说 Java Development Kit 简称 JDK1.0,截止到目前为止最新的版本为 JDK13.0。JRE(Java Running Envir...

    文章 黄军雷@云顶云技术团队 2019-11-26 396浏览量

  • 《Spark大数据分析:核心概念、技术及实践》一导读

    前  言  Preface 本书是大数据和Spark方面的一本简明易懂的手册。它将助你学习如何用Spark来完成很多大数据分析任务。它覆盖了高效利用Spark所需要知道的一切内容。 购买本书的好处之一就是:帮你高效学习Spark,节省你大量时间。本书所覆盖的主题在互联网上都可以找到,网上有很多关于...

    文章 华章计算机 2017-05-02 1028浏览量

  • 谈谈互联网后端基础设施

    纵观整个互联网技术体系再结合公司的目前状况,个人认为必不可少或者非常关键的后端基础技术/设施如下图所示: Api网关 业务应用和后端基础框架 缓存、数据库、搜索引擎、消息队列 文件存储 统一认证中心 单点登录系统 统一配置中心 服务治理框架 统一日志服务 数据基础设施 故障监控 这里的...

    文章 jurassic_1 2016-12-09 4969浏览量

  • gRPC vs Thrift

    远程过程调用(Remote Procedure Call,RPC)服务于分布式架构,本文从分布式构架面临的问题,期望的结果,引出两种比较受关注的RPC框架,并从框架的出身、实现原理、特性、性能等方面做了对比分析,从而给出两者之间的选择建议。 原文:http://blog.csdn.net/dazh...

    文章 微wx笑 2017-09-20 5495浏览量

  • 第一届PolarDB数据库性能大赛Java选手分享

    天池大赛-第一届PolarDB数据库性能大赛,比赛以NVME Optane SSD为背景,在此之上开发单机存储引擎比拼性能,支持C++和Java语言。内部赛小试牛刀后,汲取了一些经验,作为这么多年的资深JAVAer,还是想继续挑战一把,这次参加外部赛,成绩是Java语言排名第一,总排名20(队伍名...

    文章 未完成的鱼 2018-12-18 1406浏览量

  • Flink as a Unified Engine: Now and Next

    本文由 Apache Flink 中文社区发起人,阿里云计算平台事业部实时计算与开放平台部门负责人王峰分享,主要介绍 Flink 作为一款统一的流批一体引擎其发展现状及未来规划。大纲如下:2020:Apache Flink 社区生态加速繁荣的一年技术创新:Apache Flink 社区发展的核心驱...

    文章 阿里云实时计算Flink 2021-01-20 1962浏览量

  • 阿里巴巴集团开源软件梳理

    小蚂蚁说: 开源先锋Tim O'Reilly 先生曾言:“开源软件是计算机工业最宝贵的财富”。阿里巴巴是开源社区积极的共建者,为开源软件发展做了重要的贡献,相关的 GitHub 2017年数据统计显示,阿里巴巴是唯一一家入围 GitHub 顶尖贡献名单的中国公司,值此1024程序员节,我们梳理阿里...

    文章 技术小能手 2018-10-25 3733浏览量

  • 深度学习——你需要了解的八大开源框架

    深度学习八大开源框架 导读:深度学习(Deep Learning)是机器学习中一种基于对数据进行表征学习的方法,深度学习的好处是用非监督式或半监督式的特征学习、分层特征提取高效算法来替代手工获取特征(feature)。作为当下最热门的话题,Google、Facebook、Microsoft等巨头都...

    文章 青衫无名 2017-08-01 2286浏览量

  • 1024程序员节 | 阿里巴巴集团开源软件巡礼(史上最全)

    小蚂蚁说: 开源先锋Tim O'Reilly 先生曾言:“开源软件是计算机工业最宝贵的财富”。阿里巴巴是开源社区积极的共建者,为开源软件发展做了重要的贡献,相关的 GitHub 2017年数据统计显示,阿里巴巴是唯一一家入围 GitHub 顶尖贡献名单的中国公司,值此1024程序员节,我们梳理阿里...

    文章 路飞到处飞 2018-10-24 1641浏览量

  • 日志分析:SLS vs ELK

    背景 提到日志实时分析,大部分人第一想到是社区很火ELK Stack(Elastic/Logstash/Kibana)。ELK方案上手难度小、开源材料众多、在社区中有大量的使用案例。阿里云日志服务(SLS/Log) 是阿里巴巴集团对日志场景的解决方案产品,前身是2012年初阿里云在研发飞天操作系统...

    文章 简志 2019-01-02 12133浏览量

  • 2018年阿里巴巴重要开源项目汇总(资料参考)

    2019年5月8日,写在最前面: 我们历年都会做阿里开源项目的盘点。2019年,阿里对于开源项目会有更多支持和扶植的策略。我们也会逐步开展新的选题。 本文作为2018年盘点的项目,仅供大家参考。 开源展示了人类共同协作,成果分享的魅力,每一次技术发展都是站在巨人的肩膀上,技术诸多创新和发展往往就是...

    文章 山哥在这里 2018-12-12 56298浏览量

  • 深入理解Spark:核心思想与源码分析

    大数据技术丛书 深入理解Spark:核心思想与源码分析 耿嘉安 著 图书在版编目(CIP)数据 深入理解Spark:核心思想与源码分析/耿嘉安著. —北京:机械工业出版社,2015.12 (大数据技术丛书) ISBN 978-7-111-52234-8 I. 深… II.耿… III.数...

    文章 华章计算机 2017-05-02 4061浏览量

  • 蚂蚁金服 Service Mesh 渐进式迁移方案|Service Mesh Meetup 实录

    敖小剑,蚂蚁金服高级技术专家,十六年软件开发经验,微服务专家,Service Mesh 布道师,Servicemesher 社区联合创始人 龙轼,阿里巴巴技术专家、前京东 Hadoop 负责人、Hadoop 代码贡献者、现负责UC 基于 Kubernetes 自研的 PaaS 平台整体的稳定性 本...

    文章 花肉酱 2018-11-29 2111浏览量

  • 我的前端成长之路:中医药大学毕业的业务女前端修炼之路

    作者 | 风月 大家好,我是风月,2014年二进宫进入阿里,目前是业务平台体验技术数据服务前端团队负责人,负责 BizCharts 横向建设以及财鲸数据业务支撑。本次分享我将回顾作为业务前端从前端工程转型到数据可视化过程中的心路历程。 前端工程师的修炼没有捷径,踏踏实实的通过一个个项目的实践来升级...

    文章 温柔的养猫人 2020-09-04 766浏览量

  • 专访RocketMQ联合创始人:项目思路、技术细节和未来规划

    编者按2012年,阿里巴巴中间件开源其自研的第三代分布式消息中间件——RocketMQ。经过几年的技术打磨,使用RocketMQ技术的阿里目前可以在双十一当天承受万亿级消息容量。2016年11月,阿里将RocketMQ捐献给Apache软件基金会,正式成为孵化项目。阿里称会将其打造成顶级项目。 这...

    文章 中间件小哥 2017-02-24 3369浏览量

1 2 >

云产品推荐

上海奇点人才服务相关的云产品 小程序定制 上海微企信息技术相关的云产品 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 自然场景识别相关的云产品 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT