免费hadoop 字符串

  • ES-hadoop写数据到阿里云Elasticsearch

    Elasticsearch是一个基于Lucene的分布式搜索引擎,具有分布式、全文检索、近实时搜索和分析、高可用、模式自由、RESTFul API等诸多优点,在实时搜索、日志处理(ELK)、大数据分析等领域有着广泛的应用。Hadoop是一个由Apache基金会所开发的分布式系统基础架构,核心组件有...

    文章 姚攀 2018-04-03 3159浏览量

  • 大数据,数据分析,机器学习,架构等相关系统名称名词解释

    常用的一些软件或其他 1.日志(日志收集,日志处理) 风来了.fox 1.1 Logstash Logstash是一款轻量级的日志搜集处理框架,可以方便的把分散的、多样化的日志搜集起来,并进行自定义的处理,然后传输到指定的位置,比如某个服务器或者文件。 1.2 Filebea...

    文章 风来了 2016-09-09 2756浏览量

  • 史上最全“大数据”学习资源整理

    史上最全“大数据”学习资源整理 2016-05-17 Hadoop技术博文   当前,整个互联网正在从IT时代向DT时代演进,大数据技术也正在助力企业和公众敲开DT世界大门。当今“大数据”一词的重点其实已经不仅在于数据规模的定义,它更代表着信息技术...

    文章 云雷 2017-06-17 3540浏览量

  • 阿里云高校特惠,助力学生创业梦!0元体验,快速入门云计算!

    学生动手场景应用,快速了解并掌握云服务器的各种新奇玩法!

    广告

  • 【大数据技术】什么是HBase ?所有的基础都在这儿了

    2006 年10 月Google 发布三架马车之一的《Bigtable:A Distributed Storage System for Strctured Data》论文之后,Powerset 公司就宣布 HBase 在 Hadoop 项目中成立,作为子项目存在。后来,在2010 年左右逐渐成为...

    文章 小猪佩佩 2019-04-19 1015浏览量

  • 一共81个,开源大数据处理工具汇总(上)

    本文一共分为上下两部分。我们将针对大数据开源工具不同的用处来进行分类,并且附上了官网和部分下载链接,希望能给做大数据的朋友做个参考。下面是第一部分。 查询引擎 一、Phoenix 贡献者::Salesforce 简介:这是一个Java中间层,可以让开发者在Apache HBase上执行SQL查询。...

    文章 孤剑 2015-10-13 1954浏览量

  • 【Elasticsearch 入门公开课】如何配置 ES-Mapping/Analyzer 及多种聚合分析介绍-回顾篇(5)

    简介:本周课程(19~22讲)阮一鸣老师详细的讲解如何设置Elasticsearch Mapping,并通过配置 Mapping 实现自定义Analyzer,同时运用 Index Template 和 Dynamic Template 更方便的设计Mapping 索引,还简单介绍了 Elastic...

    文章 工程师甲 2020-04-03 1038浏览量

  • [译] 把 UUID 或者 GUID 作为主键?你得小心啦!

    本文讲的是[译] 把 UUID 或者 GUID 作为主键?你得小心啦!, 原文地址:UUID or GUID as Primary Keys? Be Careful! 原文作者:Tom Harrison Jr 译文出自:掘金翻译计划 译者:zaraguo 校对者:canonxu y...

    文章 玄学酱 2017-10-16 2910浏览量

  • Java编程架构深入解析-RPC 消息协议设计

    本节我们开始讲解 RPC 的消息协议设计背后的基本原理,了解 RPC 的协议开发背后有哪些需要考虑的基本点。在通晓原理之后,我们就可以自己设计一套协议来开发属于自己的 RPC 系统。 本节主要涉及的知识点和它们之见的关系如下图:   对于一串消息流,我们必须能确定消息边界,提取出单条消息...

    文章 欧阳愠斐 2018-08-17 1168浏览量

  • 按照这个java技术路线学习,分分钟搞定面试官,进大厂不是梦

    怎么说呢,最近几年的时间里,对于java开发人员来说,都知道java生态诞生了很多东西.每半年更新一次版本,发布了很多的流行的框架,像Spring5,Spring Security 5,Spring Boot 2等,这些都给我们带来了很多的挑战,但是也带来了很大的机遇. java版本更迭的速度确实...

    文章 游客nrc2le266zfzs 2020-04-18 543浏览量

  • 一共81个,开源大数据处理工具汇总(下),包括日志收集系统/集群管理/RPC等

    作者:大数据女神-诺蓝(微信公号:dashujunvshen)。本文是36大数据专稿,转载必须标明来源36大数据。   接上一部分:一共81个,开源大数据处理工具汇总(上),第二部分主要收集整理的内容主要有日志收集系统、消息系统、分布式服务、集群管理、RPC、基础设施、搜索引擎、Iaas和监控管理...

    文章 孤剑 2015-10-13 1047浏览量

  • 【转载文章】记录一次MySQL两千万数据的大表优化解决过程,提供三种解决方案

    问题概述 使用阿里云rds for MySQL数据库(就是MySQL5.6版本),有个用户上网记录表6个月的数据量近2000万,保留最近一年的数据量达到4000万,查询速度极慢,日常卡死。严重影响业务。 问题前提:老系统,当时设计系统的人大概是大学没毕业,表设计和sql语句写的不仅仅是垃圾,简直无...

    文章 隐林 2019-02-21 9196浏览量

  • 盘点Linux下的开源云平台&&云存储服务

    15个您可能不知道的开源云平台 桉树云服务环境 Eucalyptus 开源协议及语言 GPL Java C/C++ 1 2 1 2 官方网站 http://www.eucalyptus.com/participate 介绍 Elastic Utility Computing A...

    文章 shy丶gril 2016-05-18 4512浏览量

  • 推荐一个写的不错的Java学习路线zhifou.net

    一.如何选择职业方向 ​ 我见过很多之前都不是计算机专业出身的,现在从事Java开发或者大数据等职业,而且现在做的都还不错。我想这些人应该都是经过深思熟虑的做出选择的,或者是人云亦云,不过都已经走出来了。我是从事JAVA这块十多年,从初级开发到现在架构师,确实一路经历很多。 ​ 就目前...

    文章 游客hxsqda5l7xtqc 2020-03-26 737浏览量

  • 阿里云PB级实时数仓建设

    摘要 如今,数据和分析对于企业来说是不可或缺的。很多企业的数据工程师、数据分析师和开发人员都希望将数据仓库迁移到云上,以提高性能和降低成本。本文讨论了实现实时数据仓库的必要性和实时数据模型,介绍了基于AnalyticDB构建阿里云实时数据仓库解决方案的方法和优势。 为什么构建数据仓库 为什么要构...

    文章 悦畅 2019-04-20 12120浏览量

  • 阿里巴巴飞天大数据平台MaxCompute(原名ODPS)全套攻略(持续更新20200109)

    阿里巴巴飞天大数据平台MaxCompute持续进化;   概况介绍 大数据计算服务(MaxCompute,原名ODPS,产品地址:https://www.aliyun....

    文章 隐林 2017-05-05 112271浏览量

  • 3台阿里云ECS安装CDH大数据集群过程(CentOS7.4+独立数据盘)

    0x、环境说明 直接购买3台阿里云的ECS(配置4C/32G/30G系统盘+1T数据盘) 购买时先在阿里云生成一个密钥对,把.pem私钥保存到本地,然后购买时选择使用密钥进行无密码SSH登陆,注意统一使用该密钥对进行镜像部署。 服务开通后,进行如下操作。 一、配置hostname和hosts 1...

    文章 ykbjfree 2018-08-03 3721浏览量

  • Linux集群和自动化运维

    Linux/Unix技术丛书 Linux集群和自动化运维 余洪春 著 图书在版编目(CIP)数据 Linux集群和自动化运维/余洪春著. —北京:机械工业出版社,2016.8 (Linux/Unix技术丛书) ISBN 978-7-111-54438-8 I. L… II.余… II...

    文章 华章计算机 2017-05-02 4813浏览量

  • 独家 | 手把手教你学习R语言(附资源链接)

    人们学习R语言时普遍存在缺乏系统学习方法的问题。学习者不知道从哪开始,如何进行,选择什么学习资源。虽然网络上有许多不错的免费学习资源,然而它们多过了头,反而会让人挑花了眼。 为了构建R语言学习方法,我们在Vidhya和DataCamp中选一组综合资源,帮您从头学习R语言。这套学习方法对于数据科学或...

    文章 技术小能手 2018-01-25 4411浏览量

  • 2016全球最强数据库大盘点

    【数据库排名年度盘点】 说到盘点,首先肯定得看看DB-Engines的全球数据库排名。下表是2017年1月份前20名数据库引擎最新排名。 DB-Engines 2017-01数据库前20名列表 DB-Engines这个排名在业界引用得非常多,权威性也很高,总体来说比较客观,它不像很多咨询机构采用市...

    文章 mq4096 2017-01-10 8078浏览量

  • 死磕 Elasticsearch 方法论:普通程序员高效精进的 10 大狠招!(Elasticsearch教程序章)|MVP讲堂

    作者:阿里云MVP 铭毅 下节链接: Elasticsearch学习,请先看这一篇! 开篇 人工智能、大数据快速发展的今天,对于 TB 甚至 PB 级大数据的快速检索已然成为刚需。Elasticsearch 作为开源领域的后起之秀,从2010年至今得到飞跃式的发展。 Elasticsearch...

    文章 MVP时间辰悠 2018-12-14 2967浏览量

  • 未授权访问的tips

    前言 知识那么多,大佬们学慢点,我营养跟不上啦! 前人栽树后人乘凉,本文主要是把一些资料依葫芦画瓢学习了下,做了个汇总. 0x00 小二上酒 https://github.com/se55i0n/DBScanner a)Redis未授权访问 b)Jenkins未授权访问 c)MongoDB未授权...

    文章 云安全专家 2018-05-04 2551浏览量

  • 国外程序员整理的Java资源大全

    构建 这里搜集了用来构建应用程序的工具。 Apache Maven:Maven使用声明进行构建并进行依赖管理,偏向于使用约定而不是配置进行构建。Maven优于Apache Ant。后者采用了一种过程化的方式进行配置,所以维护起来相当困难。 Gradle:Gradle采用增量构建。Grad...

    文章 benben_3er 2015-04-02 2347浏览量

  • 像数据科学家一样思考:12步指南(中)

    像数据科学家一样思考:12步指南(上)《像数据科学家一样思考》 7-工程产品 下一步是建立统计软件。如果统计是分析和从数据中得出结论的框架,那么软件就是将这个框架付诸行动的工具。数据科学家必须为任何项目做出许多软件选择。如果你有一个喜欢的软件,这通常是一个不错的选择,但是有充分的理由去挑选...

    文章 【方向】 2019-04-11 1335浏览量

  • 大数据搜索与挖掘:知著-见微-晓意【大数据100分】

    感谢各位朋友的莅临,随着以微博、Twitter与Facebook等为代表的新型社交网络的迅猛发展,大数据已经成为了新一轮的科技革命,是信息技术发展的新趋势,对国家的经济与社会已经逐步产生重大影响。今天我的演讲包括四个部分:我对大数据的定义与理解;大数据应对之道:知著-见微-晓意;大数据搜索与挖掘的...

    文章 小旋风柴进 2017-05-02 1454浏览量

  • 日志分析:SLS vs ELK

    背景 提到日志实时分析,大部分人第一想到是社区很火ELK Stack(Elastic/Logstash/Kibana)。ELK方案上手难度小、开源材料众多、在社区中有大量的使用案例。阿里云日志服务(SLS/Log) 是阿里巴巴集团对日志场景的解决方案产品,前身是2012年初阿里云在研发飞天操作系统...

    文章 简志 2019-01-02 11344浏览量

  • [译] 在 Apache 和 Nginx 日志里检测爬虫机器人

    本文讲的是[译] 在 Apache 和 Nginx 日志里检测爬虫机器人, 原文地址:Detecting Bots in Apache & Nginx Logs 原文作者:Mark Litwintschik 译文出自:掘金翻译计划 译者:luoyaqifei 校对者:for...

    文章 玄学酱 2017-10-17 1227浏览量

  • 数据库工程师快速上手MaxCompute进行ETL

    案例说明 本案例主要是介绍如何通过数加MaxCompute+大数据开发套件两个产品实现简单的网站数据统计分析。 适用人群 MaxCompute初学者,特别是无大数据开发基础但有数据库使用基础。 案例侧重 数据库工程师快速上手MaxCompute进行大数据开发,简单了解在MaxCompute做大数据...

    文章 海清 2017-06-09 9027浏览量

  • 独家 | 手把手教数据可视化工具Tableau

    前言 数据的世界正在发生急剧变化,任何人都应该访问自己需要的数据,并具备获取任何数据的洞察力,而tableau正是帮我们洞察数据的好帮手。 Tableau作为BI tool leader ( 2016 Gartner BI chart), 它不仅是一款可视化软件,还具备不可忽略的强大的Data...

    文章 行者武松 2017-10-10 3230浏览量

  • 资源 | 100+个自然语言处理数据集大放送,再不愁找不到数据!

    奉上100多个按字母顺序排列的开源自然语言处理文本数据集列表(原始未结构化的文本数据),快去按图索骥下载数据自己研究吧! 数据集 Apache软件基金会公开邮件档案:截止到2011年7月11日全部公开可用的Apache软件基金会邮件档案。(200 GB) http://aws.amazon.co...

    文章 技术小能手 2018-05-02 2668浏览量

  • MaxCompute/Dataworks云数仓高可用最佳实践

    学习工具通过MaxCompute官方文档和DataWorks官方文档了解相关产品的最新功能和使用方式MaxCompute官方文档:MaxCompute官方文档DataWorks官方文档:DataWorks官方文档一、logview排查作业在日常的开发过程中我们偶尔会发现某些任务突然耗时比较长,或者...

    文章 刘-建伟 2020-07-23 642浏览量

1 2 >

云产品推荐

阿里云大学 云服务器ECS com域名 网站域名whois查询 开发者平台 小程序定制 小程序开发 国内短信套餐包 开发者技术与产品 云数据库 图像识别 开发者问答 阿里云建站 阿里云备案 云市场 万网 阿里云帮助文档 免费套餐 开发者工具 企业信息查询 小程序开发制作 视频内容分析 企业网站制作 视频集锦 代理记账服务 企业建站模板