• 关于

    大规模并行处理错误如何解决

    的搜索结果
  • 《深入理解大数据:大数据处理与编程实践》一一1.3 MapReduce并行计算技术简介

    本节书摘来自华章计算机《深入理解大数据:大数据处理与编程实践》一书中的第1章,第1.3节,作者 主 编:黄宜华(南京大学)副主编:苗凯翔(英特尔公司),更多章节内容可以访问云栖社区“华章计算机”公众号查看。 1.3 MapReduce并行计算技术简介 1.3.1 MapReduce的基本概念和由来...

    文章 华章计算机 2017-07-04 1719浏览量

  • Google MapReduce到底解决什么问题?

    第二篇,Google MapReduce架构启示(上)。 很多时候,定义清楚问题比解决问题更难。 什么是MapReduce? 它不是一个产品,而是一种解决问题的思路,它有多个工程实现,Google在论文中也给出了它自己的工程架构实现。 MapReduce这个编程模型解决什么问题? 能够用分治法解决...

    文章 初商 2019-08-08 370浏览量

  • 《多核与GPU编程:工具、方法及实践》----1.5 并行程序性能的预测与测量

    本节书摘来自华章出版社《多核与GPU编程:工具、方法及实践》一书中的第1章,第1.5节, 作 者 Multicore and GPU Programming: An Integrated Approach[阿联酋]杰拉西莫斯·巴拉斯(Gerassimos Barlas) 著,张云泉 贾海鹏 李...

    文章 华章计算机 2017-05-02 1199浏览量

  • Google MapReduce到底解决什么问题?

    搞架构的人,Google的架构论文是必看的,但好像大家都不愿意去啃英文论文。故把自己的读书笔记,加入自己的思考,分享给大家。 第二篇,Google MapReduce架构启示(上)。 很多时候,定义清楚问题比解决问题更难。 什么是MapReduce? 它不是一个产品,而是一种解决问题的思路,它有...

    文章 技术小能手 2018-11-30 1550浏览量

  • MapReduce原理与设计思想

    简单解释 MapReduce 算法 一个有趣的例子 你想数出一摞牌中有多少张黑桃。直观方式是一张一张检查并且数出有多少张是黑桃 MapReduce方法则是 给在座的所有玩家中分配这摞牌 让每个玩家数自己手中的牌有几张是黑桃然后把这个数目汇报给你 你把所有玩家告诉你的数字加起来...

    文章 wuyudong 2016-04-21 2853浏览量

  • Erlang风格的并行(Erlang Style Concurrency)

    我们常常能在 Erlang 的文档和源码之中看到Ulf Wiger这个名字,他是 Erlang 最初的开发者之一。最近他写了一篇博客《What is Erlang-Style Concurrency?》对于“Erlang风格的并行”发表了自己的看法,粗浅译来,给大家共享。 原文:http://ul...

    文章 杨粼波 2017-10-09 832浏览量

  • 开源大数据周刊-第34期

    阿里云E-MapReduce实践 使用E-MapReduce服务处理阿里云文件存储(NAS)的数据 文件存储是阿里云今年新推出的存储服务,因为它提供标准的文件访问协议,用户无需对现有应用做任何修改,即可使用具备无限容量及性能扩展、单一命名空间、多共享、高可靠和高可用等特性的分布式文件系统。E-Ma...

    文章 开源大数据EMR 2016-12-15 1701浏览量

  • 《大数据算法》一1.2 大数据算法

    本节书摘来华章计算机《大数据算法》一书中的第1章 ,第1.2节,王宏志 编著, 更多章节内容可以访问云栖社区“华章计算机”公众号查看。 1.2 大数据算法 这一节我们概述大数据算法。 1.2.1 大数据上求解问题的过程 首先我们看一看在大数据上问题求解的过程。我们面对的是一个计算问题,也就是说我们...

    文章 华章计算机 2017-06-21 1762浏览量

  • 分布式存储系统

    分布式存储系统应该具备的能力 大数据同生活息息相关,大量数据的出现对分布式存储提出了更高的需求,具体表现为以下方面: (1) 高可靠,这是存储系统需要满足的最关键需求,既要保证数据在读写过程中不能发生错误,同时还要保证数据进入到系统后硬件失效不会导致数据丢失。随着集群规模的增大,遇到硬件错误概率会...

    文章 大数据史记 2017-05-21 10342浏览量

  • 为什么我不会舍弃Python投奔Go语言

    最近,由于一篇“为什么我不会舍弃Python投奔Go语言(英文)”的博客,我收到了大量的邮件,这篇文章中,作者说Go语言除了“用返回值来处理异常错误”这点外,其它的都非常好。我想写出一点东西,解释一下Go语言为什么这样做,这会对大家都有用。 本文作者:Russ Cox 在Go语言中,规定的方式...

    文章 cometwo123 2013-03-02 883浏览量

  • 《新编计算机科学概论》一2.4 处理器体系结构

    2.4 处理器体系结构 电子计算机自问世以来,其体系结构经历了长足的发展,到今天为止,计算机体系结构设计已发展成为计算机科学体系中的重要组成部分。从本质上讲,计算机体系结构是一门设计计算机的学科,包括计算机的指令系统设计、结构设计、实现技术,以及与系统软件操作系统和编译器相关的一系列技术。处理器技...

    文章 华章计算机 2017-08-01 1272浏览量

  • 《多核与GPU编程:工具、方法及实践》----第1章 概 述 1.1 多核计算机时代

    本节书摘来自华章出版社《多核与GPU编程:工具、方法及实践》一书中的第1章,第1.1节, 作 者 Multicore and GPU Programming: An Integrated Approach[阿联酋]杰拉西莫斯·巴拉斯(Gerassimos Barlas) 著,张云泉 贾海鹏 李...

    文章 华章计算机 2017-05-02 1016浏览量

  • 阿姆达尔定律和古斯塔夫森定律

    摘要 构建软件的并行版本可使应用在更短的时间内运行指定的数据集,在固定时间内运行多个数据集,或运行非线程软件禁止运行的大型数据集。 并行化的成功通常通过测量并行版本的加速(相对于串行版本)来进行量化。 除了上述比较之外,将并行版本加速与可能加速的上限进行比较也十分有用。 通过阿姆达尔定律和古斯塔夫...

    文章 seancheney 2017-10-10 781浏览量

  • GPU计算的十大质疑——GPU计算再思考

    作者:陈晓炜   原文链接:http://www.hpcwire.com/hpcwire/2011-06-09/top_10_objections_to_gpu_computing_reconsidered.html 作者:Dr. Vincent Natoli, Stone Ridge Techn...

    文章 阿里云柳璃 2014-06-18 2076浏览量

  • 从图森未来的数据处理平台,看Serverless 工作流应用场景

    Serverless工作流来了! 发布会传送门 抢先了解Serverless技术干货 4月,阿里云Serverless工作流正式商业化,这是一款用于协调多个分布式任务执行的全托管 Serverless 云服务。产品致力于简化开发和运行业务流程所需要的任务协调、状态管理以及错误处理等繁琐工作,让...

    文章 小攻云攻略 2020-04-18 268浏览量

  • 从图森未来的数据处理平台,看Serverless 工作流应用场景

    Serverless工作流来了! 发布会传送门 抢先了解Serverless技术干货 4月,阿里云Serverless工作流正式商业化,这是一款用于协调多个分布式任务执行的全托管 Serverless 云服务。产品致力于简化开发和运行业务流程所需要的任务协调、状态管理以及错误处理等繁琐工作,让...

    文章 云攻略小攻 2020-04-18 1047浏览量

  • Serverless 工作流给人工智能带来了哪些变化?

    4月,阿里云 Serverless 工作流正式商业化,这是一款用于协调多个分布式任务执行的全托管 Serverless 云服务。产品致力于简化开发和运行业务流程所需要的任务协调、状态管理以及错误处理等繁琐工作,让用户聚焦业务逻辑开发。 精准打造云上自动生产线,Serverless 工作流正式商用 ...

    文章 中间件小哥 2020-04-29 836浏览量

  • Serverless 工作流 + 函数计算批量处理海量 OSS 文件最佳实践

    背景介绍 OSS 简单的接口和卓越的可扩展性让不同场景的应用程序每天可以轻松存储几个到几十亿个对象文件。简单的 key/value 数据访问结构极大地简化了数据的上传和读取。然而,除了上传和读取,很快就围绕 OSS 产生了一系列新的应用场景,举几个例子: 海量 OSS 文件复制 (bucket ...

    文章 shuaichang 2020-04-21 2205浏览量

  • Java消息队列总结只需一篇解决ActiveMQ、RabbitMQ、ZeroMQ、Kafka

      一、消息队列概述 消息队列中间件是分布式系统中重要的组件,主要解决应用解耦,异步消息,流量削锋等问题,实现高性能,高可用,可伸缩和最终一致性架构。目前使用较多的消息队列有ActiveMQ,RabbitMQ,ZeroMQ,Kafka,MetaMQ,RocketMQ     二、消息队列...

    文章 欧阳愠斐 2018-09-19 1549浏览量

  • 深度 | 带领国产数据库走向世界,POLARDB底层逻辑是什么?

    POLARDB 是阿里云自主研发的下一代云原生分布式数据库,100%兼容MySQL、PostgreSQL等开源数据库,高度兼容Oracle语法,使用RDS服务的客户不需要修改应用代码,可以一键迁移到POLARDB,体验更大的容量,更高的性能,更低的成本,和更灵活的弹性。 目前,POLARDB是阿里...

    文章 Roin123 2019-10-29 5199浏览量

  • 深度 | 每秒1.4亿次!再度刷新TPS记录的PolarDB如何应对双11“尖峰时刻”?

    2020年是云原生数据库PolarDB全面支撑天猫双十一的第二年,天猫交易、买家、卖家以及物流等系统在双十一期间基于PolarDB为亿万客户提供了顺滑的体验。同时,PolarDB还刷新了去年由自己创造的数据库处理峰值(TPS)纪录,今年TPS峰值高达1.4亿次/秒,较去年提升了60%。 Polar...

    文章 stromal 2020-11-20 4795浏览量

  • 深度 | 带领国产数据库走向世界,POLARDB底层逻辑是什么?

    阿里妹导读:在刚刚结束的乌镇世界互联网大会上,阿里云自主研发的POLARDB云原生数据库当选世界互联网领先科技成果,凭实力站上C位。这个”包管“了北京市每天800万人次的公交出行的下一代分布式数据库到底有多强大?我们请阿里云智能数据库事业部总经理鸣嵩跟大家一起聊聊。 POLARDB 是阿里云自主研...

    文章 技术小能手 2019-10-28 2747浏览量

  • Airbnb 是如何通过 balanced Kafka reader 来扩展 Spark streaming 实时流处理能力的

    Airbnb 日志事件获取 日志事件从客户端(例如移动应用程序和 Web 浏览器)和在线服务发出,其中包含行为或操作的关键信息。每个事件都有一个特定的信息。例如,当客人在 Airbnb.com 上搜索马里布的海滨别墅时,将生成包含位置,登记和结账日期等的搜索事件。 在 Airbnb,事件记录对于我...

    文章 开源大数据EMR 2019-05-19 1201浏览量

  • 开源大数据周刊-第63期

    EMR资讯: 从EMR-3.4.1版本开始本地盘集群。EMR大数据机型整体方案发布,帮助用户更好的使用大数据机型,从数据可靠性,服务可用性和整体性能上进行自动化的运维管理,极大地降低用户使用大数据机型的运维成本。 新功能预告:8月底将发布集群机器组功能,更好地发挥集群弹性计算能力 资讯 用大数...

    文章 开源大数据EMR 2017-08-17 5037浏览量

  • 2017年的第一场顶会,AI 产业巨头都带来了哪些技术干货

    美国西部时间2月4号到8号,AAAI 2017 在旧金山举行。随着 AAAI越来越国际化,在本届会议上,出现了更多的中国面孔。除了 IBM、Google、Facebook、Uber 等外国公司,国内百度、腾讯、华为、小 i 机器人等公司也参与了会议,其中复旦大学与小 i 机器人合作的两篇论文被大会...

    文章 知与谁同 2017-08-01 1300浏览量

  • 双11数据大屏背后的秘密:大规模流式增量计算及应用

    更多精彩内容参见云栖社区大数据频道https://yq.aliyun.com/big-data;此外,通过Maxcompute及其配套产品,低廉的大数据分析仅需几步,详情访问https://www.aliyun.com/product/odps。 摘要:回顾大数据技术领域大事件,最早可追溯到06...

    文章 场景研读 2017-03-13 5915浏览量

  • NERSC扩展深度学习计算能力达15千万亿次FLOPS

    Intel、斯坦福大学和美国国家能源研究科学计算中心(NERSC,National Energy Research Scientific Computing Center)近期宣布实现了首个15千万亿次浮点运算(PetaFLOPS)计算能力的超级计算集群。该工作成果以论文发表,名为“以15千万亿次...

    文章 知与谁同 2017-09-14 1176浏览量

  • 《Spark大数据分析:核心概念、技术及实践》一 第1章 大数据技术一览

     本节书摘来自华章出版社《Spark大数据分析:核心概念、技术及实践》一书中的第1章,第1.1节,作者[美] 穆罕默德·古勒(Mohammed Guller),更多章节内容可以访问云栖社区“华章计算机”公众号查看。 第1章 大数据技术一览 我们正处在大数据时代。数据不仅是任何组织的命脉,而且在指...

    文章 华章计算机 2017-05-02 1020浏览量

  • 深度 | 做到这些值4亿美元:看 Nervana 如何利用深度学习实现数据革命

    2016 年 8 月,英特尔为了加强其人工智能领域的能力,以 4 亿美元的天价收购了机器学习初创公司 Nervana 。该初创公司成立仅仅两年,却被公认为是机器学习技术开发的领导者。近日,Nervana 的联合创始人兼首席执行官 Naveen Rao 博士在 StrataHadoop 上和大家深入...

    文章 青衫无名 2017-08-01 827浏览量

  • 双11数据大屏背后:大规模流式增量计算及应用(附资料)

    首先从理解什么是数据流开始今天的分享,其实在真实的世界中,大部分的数据都是连续产生的数据流,比如手机上产生的GPS信号、用户在互联网上的行为、在线搜索、用户的点击、社交网络分享、即时通信以及一些传感器和物联网设备采集的日志信息等,这些数据都是连续产生的,自然就形成了数据流,在这些数据流产生以后,在...

    文章 小旋风柴进 2017-05-22 1557浏览量

1 2 3 4 ... 13 >

云产品推荐

上海奇点人才服务相关的云产品 小程序定制 上海微企信息技术相关的云产品 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 自然场景识别相关的云产品 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务