• 关于

    分组过滤出现问题怎么解决

    的搜索结果
  • 【干货】蒋步星:关系代数的问题及尝试

    讲座全文: 今天的内容分五个部分,开始先讲一下基本概念和背景;中间三部分都是数据分析的内容,这是今天的重点;最后一块研究得还不够深,但也涉及到关系代数,就放进来一起谈谈。 我们先从编程序谈起。 编程序到现在仍然并不是一件轻松的活。这里我们不去谈那些由于需求不清或变动而导致的困难,那是软件...

    文章 行者武松 2017-04-03 1101浏览量

  • 《计算机网络:自顶向下方法(原书第6版)》一1.8 小结

    本节书摘来华章计算机《计算机网络:自顶向下方法(原书第6版)》一书中的第1章 ,第1.8,(美)James F.Kurose Keith W.Ross 著 陈 鸣 译 更多章节内容可以访问云栖社区“华章计算机”公众号查看。 1.8 小结 在本章中,我们涉及了大量的材料!我们已经看到构成特别的因特网...

    文章 华章计算机 2017-06-02 6532浏览量

  • C#黔驴技巧之去重(Distinct)

    C#黔驴技巧之去重(Distinct) 前言关于C#中默认的Distinct方法在什么情况下才能去重,这个就不用我再多讲,针对集合对象去重默认实现将不再满足,于是乎我们需要自定义实现来解决这个问题,接下来我们详细讲解几种常见去重方案,孰好孰歹自行判之。 分组首先给出我们需要用到的对象,如下: pu...

    文章 幸运券发放 2020-05-10 341浏览量

  • 从MapReduce的执行来看如何优化MaxCompute(原ODPS) SQL

    SQL基础有这些操作(按照执行顺序来排列): from join(left join, right join, inner join, outer join ,semi join) where group by select sum distinct count order by 如果我们能理...

    文章 隐林 2017-07-21 5625浏览量

  • 中国互联网大会:数据挖掘解决微博商业化难题

           在8月14日下午举办的互联网大会2013中国大数据发展论坛上,腾讯微博相关负责人高自光分享了大数据技术的运用经验。他表示,大数据本身可以实现三个方面的效果: 第一对内容本身的理解,这个内容不限于一篇微博、一个视频、一篇文章,可能还有广告; 第二对用户的理解,用户的行为、轨迹等信息; ...

    文章 小旋风柴进 2017-04-03 807浏览量

  • MapReduce的模式,算法以及用例

    本文译自 Mapreduce Patterns, Algorithms, and Use Cases 在这篇文章里总结了几种网上或者论文中常见的MapReduce模式和算法,并系统化的解释了这些技术的不同之处。所有描述性的文字和代码都使用了标准hadoop的MapReduce模型,包括Ma...

    文章 dongzhumao 2015-01-28 669浏览量

  • Hive性能优化

    1.概述   继续《那些年使用Hive踩过的坑》一文中的剩余部分,本篇博客赘述了在工作中总结Hive的常用优化手段和在工作中使用Hive出现的问题。下面开始本篇文章的优化介绍。 2.介绍   首先,我们来看看Hadoop的计算框架特性,在此特性下会衍生哪些问题? 数据量大不是问题,数据倾斜是个问...

    文章 smartloli 2016-04-19 3005浏览量

  • Hive性能优化

    1.概述   继续《那些年使用Hive踩过的坑》一文中的剩余部分,本篇博客赘述了在工作中总结Hive的常用优化手段和在工作中使用Hive出现的问题。下面开始本篇文章的优化介绍。 2.介绍   首先,我们来看看Hadoop的计算框架特性,在此特性下会衍生哪些问题? 数据量大不是问题,数据倾斜是个问...

    文章 smartloli 2016-04-25 2978浏览量

  • Hive性能优化(全面)

    作者:浪尖原文链接本文转载自公众号:Spark学习技巧 1.介绍 首先,我们来看看Hadoop的计算框架特性,在此特性下会衍生哪些问题? 数据量大不是问题,数据倾斜是个问题。 jobs数比较多的作业运行效率相对比较低,比如即使有几百行的表,如果多次关联多次汇总,产生十几个jobs,耗时很长。原...

    文章 开源大数据EMR 2019-12-30 786浏览量

  • 稳定性专题 | 通过链路追踪快速发现和定位业务问题的实践

    导读 『StabilityGuide』是阿里多位阿里技术工程师共同发起的稳定性领域的知识库开源项目,涵盖性能压测、故障演练、JVM、应用容器、服务框架、流量调度、监控、诊断等多个技术领域,以更结构化的方式来打造稳定性领域的知识库,欢迎您的加入。 ✅ @GitHub :https://github....

    文章 中间件小哥 2020-01-20 5126浏览量

  • 系统架构-性能篇章2(系统拆分2-问题)

    在文章《系统架构-性能篇章2(系统拆分1)》有提及到过关于系统在什么情况下会拆分,拆分的目之类的问题,本文会阐述一些关于拆分过程中遇到的各种各样的常见问题进行分析,和上一个文章中提及到的一样,讲解的目录如下: 1、负载均衡设备的问题。 2、不同系统之间的通信问题。 3、数据写入和查找的问题。 4、...

    文章 钟隐 2011-11-15 1370浏览量

  • 一个秒杀系统的设计思考

    秒杀大家都不陌生。自2011年首次出现以来,无论是双十一购物还是 12306 抢票,秒杀场景已随处可见。简单来说,秒杀就是在同一时刻大量请求争抢购买同一商品并完成交易的过程。从架构视角来看,秒杀系统本质是一个高性能、高一致、高可用的三高系统。而打造并维护一个超大流量的秒杀系统需要进行哪些关注,就是...

    文章 云管家chinaygj 2020-06-23 1338浏览量

  • 【Linux】Linux中正则表达式

    当从一个文件或命令输出中抽取或过滤文本时,可以使用正则表达式。   以下是在基本命令中使用正则表达式的一些定义及用法   基本元字符集及其含义 ^ 匹配行首 $ 匹配行尾 . 匹配任意单个字符 * 字符*   匹配0或多个此字符 / 屏蔽一...

    文章 沧海一笑dj 2014-12-10 1561浏览量

  • SLS:海量日志数据管理利器

    SLS:海量日志数据管理利器 日志是大规模集群管理系统中非常关键的部分,服务器上的各种日志数据(如访问日志、应用日志等)可以帮助我们回答如运维、开发、运营、客服、安全等各种问题,例如: 运维:服务是否正常,流量和QPS是多少; 开发:线上有没有异常和错误发生; 运营:多少账号开通了服务,其...

    文章 yq传送门 2016-12-25 9699浏览量

  • Apache Storm 官方文档 —— Trident 教程

    原文链接    译者:魏勇 Trident 是 Storm 的一种高度抽象的实时计算模型,它可以将高吞吐量(每秒百万级)数据输入、有状态的流式处理与低延时的分布式查询无缝结合起来。如果你了解 Pig 或者 Cascading 这样的高级批处理工具,你就会发现他们和 Trident 的概念非常相似。...

    文章 ali清英 2016-04-01 1342浏览量

  • Apache Storm 官方文档 —— Trident 教程

    Trident 是 Storm 的一种高度抽象的实时计算模型,它可以将高吞吐量(每秒百万级)数据输入、有状态的流式处理与低延时的分布式查询无缝结合起来。如果你了解 Pig 或者 Cascading 这样的高级批处理工具,你就会发现他们和 Trident 的概念非常相似。Trident 同样有联结(...

    文章 青衫无名 2017-05-22 1319浏览量

  • SQL入门,就这么简单

    SQL入门,就这么简单 随着时代的发展,人类活动产生的信息越来越多,大家常说,现在这个时代是大数据时代。在这样一个前提下,数据的存储成为我们必须要认真对待和研究的问题了。SQL(Structured Query Language)结构化查询语言,是当今三大主流关系型数据库(MsSQL,MySQL,...

    文章 优惠码发放 2020-04-22 377浏览量

  • HIVE TopN shuffle 原理

    HIVE TopN Shuffle TopN 问题是排序中的一个经典问题。对于一个长度为 m 的数组,取其最大的 n (n <= m) 条数据,可以不必对整个数组进行全排。一般的算法对 m 进行全排的复杂度大约为 mlog2(m)。假设我们只取其中最大的 n 条,那么可以把这个复杂度降低到 ...

    文章 xy_xin 2019-03-21 1120浏览量

  • SLS:海量日志数据管理利器

    作者:周琦(花名:简志)    日志是大规模集群管理系统中非常关键的部分,服务器上的各种日志数据(如访问日志、应用日志等)可以帮助我们回答各种问题,例如:        ■ 运维:服务是否正常,流量和QPS是多少;        ■ 开发:线上有没有异常和错误发生;        ■ 运营:多少...

    文章 sheeta 2016-03-14 6459浏览量

  • 阿里巴巴电商搜索推荐实时数仓演进之路

    作者:张照亮(士恒)阿里巴巴搜索事业部高级技术专家 1. 业务背景 阿里巴巴电商搜索推荐实时数据仓库承载了阿里巴巴集团淘宝、淘宝特价版、饿了么等多个电商业务的实时数仓场景,提供了包括实时大屏、实时报表、实时算法训练、实时A/B实验看板等多种数据应用支持。 数据的价值 我们认为数据处于阿里巴巴搜索推...

    文章 May-Hologres 2020-09-08 3120浏览量

  • 基于containerpilot的服务注册与发现

    所谓分久必合合久必分,分治可以解决all in one的问题,但是更多的问题因为隔离而产生,为了解决这些问题又会有相应的工具产生。作为已经不算火热的微服务概念,落地解决方案也渐渐成熟和成型,为了说明containerpilot的适用场景,首先简单说明白几个基本概念。 微服务 不管是前端还是后端服务...

    文章 vincenthou 2017-11-04 2172浏览量

  • Java程序员在写SQL程序时候常犯的10个错误

    Java程序员编程时需要混合面向对象思维和一般命令式编程的方法,能否完美的将两者结合起来完全得依靠编程人员的水准: 技能(任何人都能容易学会命令式编程) 模式(有些人用“模式-模式”,举个例子,模式可以应用到任何地方,而且都可以归为某一类模式) 心境(首先,要写个好的面向对象程序是比命令式程序难的...

    文章 shy丶gril 2016-05-18 1579浏览量

  • 【NIO系列】——之TCP探秘

    很开心,上半年发布的spring boot 2中,默认的web 容器是netty ,这说明“反应式” 容器已经是大势所趋,无论是go 语言的协从线程,还是java 基于reactor 线程模型,都是基于事件编程实现高并发的实例。这周开始我会讲关于NiO的一切,底层原理是什么,应用架构有哪些,如何利...

    文章 wier_ali 2018-06-29 2841浏览量

  • Hadoop/Spark相关面试问题总结

    版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/qq1010885678/article/details/46916857 Hadoop/Spark相关面试问题...

    文章 xiaohei.info 2015-07-16 1022浏览量

  • Java程序员在写SQL程序时候常犯的10个错误

    Java程序员编程时需要混合面向对象思维和一般命令式编程的方法,能否完美的将两者结合起来完全得依靠编程人员的水准: 技能(任何人都能容易学会命令式编程) 模式(有些人用“模式-模式”,举个例子,模式可以应用到任何地方,而且都可以归为某一类模式) 心境(首先,要写个好的面向对象程序是比命令式程...

    文章 楚兴 2013-08-05 1214浏览量

  • 云栖PPT下载 | 破解企业数据库“疑难杂症”,最佳实践专场划重点了!

    数据库是整个企业数据最核心的承载载体,在线上使用过程中,用户经常会遇到以下问题:如何保障业务连续性、数据库研发效率低、数据库存在性能瓶颈及数据存在安全风险等等。 本次的企业级数据库专场中,我们邀请到了数位阿里巴巴资深专家及高级专家为大家分享阿里巴巴的数据库实践经验及产品化解决方案,同时也邀请了客户...

    文章 Roin123 2019-10-16 1213浏览量

  • 前端开发知识点整理

    目录 专业技能 前端理论 浏览器 HTML CSS JavaScript 编程通用 SEO 数据统计 数据分析 网络基础 交叉领域理论 产品设计相关 后端基础 前端实践 解决实际问题 学习型项目 前端工程 第一阶段:框架应...

    文章 水灵儿 2017-12-14 2281浏览量

  • 《AngularJS深度剖析与最佳实践》一1.5 实现更多功能:主题

    本节书摘来自华章出版社《AngularJS深度剖析与最佳实践》一书中的第1章,第1.5节,作者 雪狼 破狼 彭洪伟,更多章节内容可以访问云栖社区“华章计算机”公众号查看 1.5 实现更多功能:主题 1.5.1 实现主题列表 我们还没有实现发帖和取帖子列表的后端功能,甚至连这个API该设计成什么样...

    文章 华章计算机 2017-05-02 1151浏览量

  • Spark面试

    1、简答说一下hadoop的map-reduce编程模型 首先map task会从本地文件系统读取数据,转换成key-value形式的键值对集合 使用的是hadoop内置的数据类型,比如longwritable、text等 将键值对集合输入mapper进行业务处理过程,将其转换成需要的key...

    文章 wsc449 2018-01-17 1494浏览量

  • Intel研究院院长吴甘沙演讲全文:大数据分析师的卓越之道(32PPT珍藏版)

    亲爱的各位同仁,各位同学,早上好。大数据时代数据分析师应该做什么改变?我今天的标题是大数据分析师的卓越之道。这个演讲信息量比较大,我讲的不一定对,即使对的我也不一定真懂了,所以请大家以批判的方式去理解。 这是一个典型的数据分析的场景,下面是基础设施,数据采集、存储到处理,左边是数据处理,右边价...

    文章 小旋风柴进 2017-05-02 1044浏览量

1 2 3 >

云产品推荐

上海奇点人才服务相关的云产品 小程序定制 上海微企信息技术相关的云产品 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 自然场景识别相关的云产品 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务