• 关于

    SparkSQL在ETL中应用

    的搜索结果
  • 如何选择满足需求的SQL on Hadoop/Spark系统

    在批处理时代,Hive一枝独秀;在实时交互式查询时代,呈现出的是百花齐放的局面。Hive onTez, Hive on Spark, Spark SQL, Impala等等,目前看也没有谁干掉谁的趋势。引用今年图灵奖得主Michael Stonebraker的话说,现在的数据库领域已经不是”one...

    文章 小旋风柴进 2017-05-02 2391浏览量

  • 基于 Spark 和 TensorFlow 的机器学习实践

    本场视频链接:https://developer.aliyun.com/live/1547?spm=a2c6h.12873581.0.0.71671566iIzpz5&groupCode=apachespark 本场PPT资料:https://www.slidestalk.com/AliS...

    文章 开源大数据EMR 2019-10-31 2527浏览量

  • 大数据全体系年终总结

      到年底了,想着总结下所有知识点好了~今年应用的知识点还是很多的~    Hadoop生态圈:   1、文件存储当然是选择Hadoop的分布式文件系统HDFS,当然因为硬件的告诉发展,已经出现了内存分布式系统Tachyon,不论是Hadoop的MapReduce,Spark的内存计算、hive的...

    文章 松伯 2016-12-11 1363浏览量

  • 首次揭秘|为6.4亿人次出行提供无线网络的技术架构

    最近掌慧纵盈 大数据平台的架构师,分享了一篇文章很不错,转载到这里原文。 借助“互联网+大数据+机场”三轮驱动,掌慧纵盈每年为6.4亿人次出行提供无线网络连接服务。随着业务的拓展,随之后来的挑战是数据量的暴增。2016年,掌慧纵盈(股票代码:835736)通过阿里云产品,率先构建了业界领先的大数据...

    文章 开源大数据EMR 2016-12-29 9798浏览量

  • 吴甘沙清华讲:大数据的10个技术前沿(中)

    本次讲座是清华大数据产业联合会"技术•前沿"系列讲座的第一讲,主讲人为英特尔(中国)研究院院长吴甘沙。回复“清华大数据”可获得完整版PPT。 吴甘沙院长从大数据技术前沿的十个问题入手,对大数据产业进行了深度解析。讲座分为三部分: 大数据的10个技术前沿(上)——数据,12月25日已发 大数据...

    文章 小旋风柴进 2017-05-02 1103浏览量

  • 2015 Bossie评选:最佳开源大数据工具

    Bossie奖是知名英文IT网站InfoWorld针对开源软件颁发的年度奖项,根据这些软件对开源界的贡献,以及在业界的影响力评判获奖对象。本次InfoWorld评选出了22款最佳的开源大数据工具,像Spark、Storm都名列榜单之上。 InfoWorld在分布式数据处理、流式数据分析、机器学...

    文章 小旋风柴进 2017-05-02 1616浏览量

  • 秘密武器 | 看AnalyticDB如何强力支撑双十一

    前言 每年双十一购物狂欢节都是云原生数据仓库AnalyticDB MySQL版(原分析型数据库MySQL版)的一块试金石。今年AnalyticDB除了在阿里数字经济体内进入更多核心交易链路,全力支撑双十一以外,AnalyticDB全面拥抱云原生,构建极致弹性,大幅降低成本,释放技术红利,重磅发布了...

    文章 louth 2020-11-16 7079浏览量

  • 秘密武器 | 看AnalyticDB如何强力支撑双十一

    前 言 每年双十一购物狂欢节都是云原生数据仓库AnalyticDB MySQL版(原分析型数据库MySQL版)的一块试金石。今年AnalyticDB除了在阿里数字经济体内进入更多核心交易链路,全力支撑双十一以外,AnalyticDB全面拥抱云原生,构建极致弹性,大幅降低成本,释放技术红利,重磅发...

    文章 1075413323293034 2020-12-23 30浏览量

  • AnalyticDB MySQL拥抱云原生,强力支撑双十一

    AnalyticDB MySQL拥抱云原生,强力支撑双十一 前言 阿里云在2020年11月,成功入选Gartner全球数据库领导者象限,云原生数据仓库AnalyticDB是阿里云数据库产品矩阵中重要的一环。今年双十一阿里实现了4982亿元的成交额,每年双十一购物狂欢节都是云原生数据仓库Analyt...

    文章 云原生数据仓库 2020-11-30 227浏览量

  • 《企业大数据系统构建实战:技术、架构、实施与应用》一2.2 大数据职位构建体系

    本节书摘来自华章出版社《企业大数据系统构建实战:技术、架构、实施与应用》一书中的第2章,第2.2节,作者吕兆星 郑传峰 宋天龙 杨晓鹏,更多章节内容可以访问云栖社区“华章计算机”公众号查看本节书摘来自华章出版社《企业大数据系统构建实战:技术、架构、实施与应用》一书中的第2章,第2.1节,作者吕兆星...

    文章 华章计算机 2017-05-02 3465浏览量

  • 《企业大数据系统构建实战:技术、架构、实施与应用》——2.2 大数据职位构建体系

    本节书摘来自华章计算机《企业大数据系统构建实战:技术、架构、实施与应用》一书中的第2章,第2.2节,作者 吕兆星 郑传峰 宋天龙 杨晓鹏,更多章节内容可以访问云栖社区“华章计算机”公众号查看。 2.2 大数据职位构建体系 在团队组建过程中,科学地定义职位体系直接影响到大数据实施的效率和质量,由于大...

    文章 华章计算机 2017-07-04 2850浏览量

  • 《机器人操作系统ROS原理与应用》——2.1 大数据组织架构体系

    本节书摘来自华章出版社《企业大数据系统构建实战:技术、架构、实施与应用》一 书中的第2章,第2.2节,作者:吕兆星 郑传峰 宋天龙 杨晓鹏,更多章节内容可以访问云栖社区“华章计算机”公众号查看。 2.2 大数据职位构建体系 在团队组建过程中,科学地定义职位体系直接影响到大数据实施的效率和质量,由于...

    文章 华章计算机 2017-05-02 1505浏览量

  • 有哪些大数据处理工具?

    下图是由著名的数据观察家Matt Turck在他的BLOG(https://mattturck.com/) 里发出的2019年人工智能和大数据产业图,他从2012年开始每年都会绘制一张,大致描述这个产业里的公司及其数据相关的产品,以及所属问题的领域。这里面大部分是商业软件,而对于绝大多数互联网公司...

    文章 茶什i 2020-07-22 9165浏览量

  • 大数据常用技术栈

    提起大数据,不得不提由IBM提出的关于大数据的5V特点:Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性),而对于大数据领域的从业人员的日常工作也与这5V密切相关。大数据技术在过去的几十年中取得非常迅速的发展,尤以Hadoo...

    文章 bigdatalearnshare 2020-06-18 210浏览量

  • 数据科学工具包(万余字介绍几百种工具,经典收藏版!)

    本文简介:数据科学家的常用工具与基本思路,数据分析师和数据科学家使用的工具综合概述,包括开源的技术平台相关工具、挖掘分析处理工具、其它常见工具等几百种,几十个大类,部分网址。为数据科学教育和知识分享,提高数据科学人员素质。 数据科学融合了多门学科并且建立在这些学科的理论和技术之上,包括数学、概率...

    文章 小旋风柴进 2017-05-02 2440浏览量

  • 历程剖析:阿里云自研HTAP数据库的技术发展之路

    摘要:8月24日,阿里云数据库技术峰会到来,本次技术峰会邀请到了阿里集团和阿里云数据库老司机们,为大家分享了一线数据库实践经验和技术干货。阿里云高级数据库技术专家队皓庭分享了高度兼容MySQL,并且能免去传统数仓ETL过程实现数据分析,同时支持高并发、大吞吐量的在线事务处理的PB级数据存储数据库是...

    文章 场景研读 2017-09-04 7963浏览量

  • 开发运维DBA看过来:容器、Docker、DevOps、数据库学习资料(1000+ PPT讲义)大汇总

    很多企业都了解DevOps理论,但仍然很难落地,在企业内部,该如何实施DevOps呢?阿里云容器技术专家为你解读DevOps企业最佳实践。 阿里云大学系列精品课:阿里专家带你玩转DevOps企业最佳实践 (限时优惠中,名额有限) 完善的DevOps课程体系,阿里专家团讲解+答疑,理论实践结合助力...

    文章 云木西 2018-07-19 12791浏览量

  • 史上最全的“大数据”学习资源(上)

    当前,整个互联网正在从IT时代向DT时代演进,大数据技术也正在助力企业和公众敲开DT世界大门。当今“大数据”一词的重点其实已经不仅在于数据规模的定义,它更代表着信息技术发展进入了一个新的时代,代表着爆炸性的数据信息给传统的计算技术和信息技术带来的技术挑战和困难,代表着大数据处理所需的新的技术和方法...

    文章 readygo 2016-05-03 42005浏览量

  • 2017大数据版图最新发布:新趋势和新玩家

    高层趋势 大数据+AI=新栈 2016年无疑是机器学习之年,任何目睹过众多pitch的VC都应该能感受到这一点,那就是每一家初创企业都成为了“机器学习公司”,“.ai”变成了必备域名,而“等等,可是我们是用机器学习做到这个的”也成为了pitch deck的必备幻灯片。机器学习正在迅速成为许多应...

    文章 小旋风柴进 2017-05-19 1321浏览量

  • 史上最全“大数据”学习资源整理

    史上最全“大数据”学习资源整理 2016-05-17 Hadoop技术博文   当前,整个互联网正在从IT时代向DT时代演进,大数据技术也正在助力企业和公众敲开DT世界大门。当今“大数据”一词的重点其实已经不仅在于数据规模的定义,它更代表着信息技术...

    文章 云雷 2017-06-17 3618浏览量

  • 实战 | 利用Delta Lake使Spark SQL支持跨表CRUD操作

    本文转载自公众号: eBay技术荟作者 | 金澜涛原文链接:https://mp.weixin.qq.com/s/L64xhtKztwWhlBQrreiDfQ 摘要 大数据处理技术朝传统数据库领域靠拢已经成为行业趋势,目前开源的大数据处理引擎,如Apache Spark、Apache Hadoo...

    文章 阿里云E-MapReduce团队 2020-04-16 530浏览量

  • 数据湖架构,为什么需要“湖加速”?

    在开源大数据领域,存储/计算分离已经成为共识和标准做法,数据湖架构成为大数据平台的首要选择。基于这一范式,大数据架构师需要考虑三件事情: 第一,选择什么样的存储系统做数据湖(湖存储)? 第二,计算和存储分离后,出现了性能瓶颈,计算如何加速和优化(湖加速)? 第三,针对需要的计算场景,选择什么样的...

    文章 茶什i 2020-09-15 1109浏览量

  • 数据湖架构,为什么需要“湖加速”?

    作者:郑锴,花名铁杰,阿里巴巴高级技术专家,Apache Hadoop PMC,Apache Kerby 创立者。深耕分布式系统开发和开源大数据多年,目前专注于在阿里云上提供更好用更有弹性的 Hadoop/Spark 大数据平台。 在开源大数据领域,存储/计算分离已经成为共识和标准做法,数据湖架...

    文章 阿里云E-MapReduce团队 2020-09-28 6526浏览量

云产品推荐

阿里云企业服务平台 陈四清的老板信息查询 上海奇点人才服务相关的云产品 爱迪商标注册信息 安徽华轩堂药业的公司信息查询 小程序定制 上海微企信息技术相关的云产品 国内短信套餐包 ECS云服务器安全配置相关的云产品 天籁阁商标注册信息 开发者问答 阿里云建站 自然场景识别相关的云产品 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 北京芙蓉天下的公司信息查询