• 关于

    数据采集系统常见故障

    的搜索结果
  • SAN LUN Mapping出错导致文件系统共享冲突的完美解决方案

    【用户单位】中国联通某分公司【数据恢复故障描述】 SUN 光纤存储系统,中心存储为6枚300G硬盘组成的RAID6,划分为若干LUN,MAP到不同业务的服务器上,服务器上运行SUN SOLARIS操作系统。 正常工作状态下,用户需要新增应用,所以增加了一台IBM服务器,之后在线状态下将存储中的某个...

    文章 北亚企安 2017-06-19 1076浏览量

  • 阿里:千亿交易背后的0故障发布

    前言 近几年,我们在发布效率和稳定性方面做了不少工作,其中效率简单的说就是发布耗时,一个是发布的速度,比如一个应用是1个小时发布完成,还是5分钟发布完成?另一个是人员介入,开发在发布过程中是否需要介入处理各种发布过程中出现的问题?这两者都做好了,才能说是发布效率提升了。稳定性最基础的是系统的稳定性...

    文章 阿里云头条 2018-04-20 4974浏览量

  • 无人值守时代,运维如何保障发布质量?

    导读:阿里巴巴千亿交易背后,如何尽量避免发布故障?在面对实际运维过程中遇到的问题该如何解决?近日,在GOPS大会上,阿里巴巴运维技术专家少荃,给我们带来了解决方案和思路。 作者:陆叶平(花名少荃),阿里巴巴研发效能事业部技术专家。目前从事运维中台(阿里内部叫诺曼底)建设方面的工作,是集...

    文章 云效平台 2018-04-18 3248浏览量

  • Quick BI 数据可视化分析平台

    2020年入选全球Gartner ABI魔力象限,为中国首个且唯一入选BI产品

    广告

  • 一个系统,搞定闲鱼服务端复杂问题告警-定位-快速处理

    作者:闲鱼技术-吴白 引言 服务端问题排查(服务稳定性/基础设施异常/业务数据不符合预期等)对于开发而言是家常便饭,问题并不可怕,但是每天都要花大量时间去处理问题会很可怕;另一方面故障的快速解决至关重要。那么目前问题排查最大的障碍是什么呢?我们认为有几个原因导致:1) 大量的告警信息。2) 链路的...

    文章 闲鱼技术 2019-07-24 11553浏览量

  • Elasticsearch 全观测技术解析与应用(三):能力呈现与应用价值

    点击免费下载《Elasticsearch 全观测技术解析与应用》>>> 分享嘉宾:朱杰 这节课承接《全观测技术原理与技术生态》,介绍Elastic整套工具带来的能力,以及用demo展示怎么用这些能力构建全方位的观测性。 实现全观测主要有以下步骤 第一步是数据采集,这些数据可能来自...

    文章 工程师甲 2020-12-17 372浏览量

  • 一个系统,搞定闲鱼服务端复杂问题告警-定位-快速处理

    作者|吴白出品|阿里巴巴新零售淘系技术部 服务端问题排查对开发而言是家常便饭,问题并不可怕但要花大量时间去处理;另一方面故障的快速解决至关重要。 目前问题排查最大的障碍是什么呢?我们认为有以下几个原因: 大量的告警信息。 链路的复杂性。 排查过程繁复。 依赖经验。 实际工作中的排查思路并非无迹...

    文章 淘系技术 2019-08-29 2489浏览量

  • 收藏!一张图帮你快速建立大数据知识体系

    前言 最早提出“大数据”时代到来的是全球知名咨询公司麦肯锡,麦肯锡称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”数据,让一切有迹可循,让一切有源可溯。我们每天都在产生数据,创造大数据和使用大数据...

    文章 茶什i 2020-06-11 9170浏览量

  • 闲鱼神探——线上问题定位与快速解决

    作者:闲鱼技术-迎墨 神探产品定位 神探是一款面向服务端稳定性问题自动定位并辅助快速解决故障的线上排查工具。软件工程领域存在一个共识:维护代码所花费的时间要远多于写代码。而整个代码维护过程中,最惊心动魄与扣人心弦的部分,莫过于问题排查,线上问题持续发生,带来的问题,一方面是大量时间投入和繁复操作,...

    文章 闲鱼技术 2020-07-28 819浏览量

  • LC3视角:Kubernetes下日志采集、存储与处理技术实践

    Kubernetes日志处理的趋势与挑战 Kubernetes的serveless化 Kubernetes容器技术促进了技术栈的去耦合,通过引入栈的分层使得开发者可以更加关注自身的应用程序和业务场景。从Kubernetes本身来看,这个技术解耦也在更进一步发展,容器化的一个发展的趋势是:这些容器都...

    文章 唐恺 2018-07-05 12950浏览量

  • 阿里如何做到百万量级硬件故障自愈?

    随着阿里大数据产品业务的增长,服务器数量不断增多,IT运维压力也成比例增大。各种软、硬件故障而造成的业务中断,成为稳定性影响的重要因素之一。本文详细解读阿里如何实现硬件故障预测、服务器自动下线、服务自愈以及集群的自平衡重建,真正在影响业务之前实现硬件故障自动闭环策略,对于常见的硬件故障无需人工干预...

    文章 隐林 2018-11-24 3310浏览量

  • 萨纳斯光伏大数据体系之光伏设备运行分析

    导读:随着光伏电站规模的不断扩大,光伏设备的数量也在增加。而光伏电站一般地处偏远地带,运维人员较少,为保证光伏电站的安全、高效、低成本运行,就势必要对电站设备运行水平进行全面准确分析,精准运维。 光伏电站的设备组成: 光伏电站设备是光伏电站的基本支撑,一般由气象站、太阳能电池阵列、汇流箱、直流柜、...

    文章 寒凝雪 2017-07-03 1015浏览量

  • 阿里如何做到百万量级硬件故障自愈?

    随着阿里大数据产品业务的增长,服务器数量不断增多,IT运维压力也成比例增大。各种软、硬件故障而造成的业务中断,成为稳定性影响的重要因素之一。本文详细解读阿里如何实现硬件故障预测、服务器自动下线、服务自愈以及集群的自平衡重建,真正在影响业务之前实现硬件故障自动闭环策略,对于常见的硬件故障无需人工干预...

    文章 技术小能手 2018-11-19 2567浏览量

  • Oracle数据库运维场景下,智能运维如何落地生根?

    导语 从马车到汽车是为了提升运输效率,而随着时代的发展,如今我们又希望用自动驾驶把驾驶员从开车这项体力劳动中解放出来,增加运行效率,同时也可减少交通事故发生率,这也是企业对于智能运维的诉求。 从人工运维到自动化运维是为了减少人力成本,降低操作风险,提高运维效率,但自动化运维的本质依然是人与自动化工...

    文章 袋鼠云 2020-08-11 102浏览量

  • 开源监控利器Prometheus初探

    前言: Kubernetes作为当下最炙手可热的容器管理平台,在给应用部署运维带来便捷的同时,也给应用及性能监控带来了新的挑战。本文给大家分享一款十分火热的开源监控工具Prometheus,让我们一起来看它是如何兼顾传统的应用监控、主机 性能监控和Kubernetes监控的。 目录: 一、Prom...

    文章 店家小二 2018-12-18 1838浏览量

  • [Hadoop]chukwa的简单介绍

    Apache 的开源项目 hadoop, 作为一个分布式存储和计算系统,已经被业界广泛应用。很多大型企业都有了各自基于 hadoop 的应用和相关扩展。当 1000+ 以上个节点的 hadoop 集群变得常见时,集群自身的相关信息如何收集和分析呢?针对这个问题, Apache 同样提出了相应的解决...

    文章 自娱 2016-04-07 1576浏览量

  • 深入解读面向微服务的分布式秒级监控系统Infinsight

    背景 在云服务环境中,服务的质量一向是云服务厂商关注的重点,为了最大的保证云服务质量,以及在出现故障时能够协助用户对故障进行快速的定位,监控服务在其中起着非常重要的作用。 目前,许多云厂商提供的监控服务多在分钟级,这种级别的监控服务对于瞬息万变的服务变化,往往粒度过大了。尤其是针对某些瞬间的资源抖...

    文章 伯邑 2019-03-15 1765浏览量

  • 基于MaxCompute/Dataworks实现数据仓库管理与全链路数据体系

    前言   就这样,大数据领域蓬勃发展了好几年,有很多伙伴执迷于技术,成为了分布式计算与存储的领域专家。也有很多伙伴执迷于数据,成为了行业的数据研发专家。当然还有很多小伙伴,热衷于工具系统开发,成为了数据技术专家。那么我们回过头来考虑,什么是大数据,什么又是数据仓库,什么又是数据技术。大数据其实是个...

    文章 隐林 2019-04-28 1817浏览量

  • Serverless下日志采集、存储、分析实践

    Serverless与日志 Serverless,即一种无服务器化的思维,开发者不用过多地考虑传统的服务器采购、硬件运维、网络拓扑、资源扩容等基础设施运行问题,让DevOps人员可以将精力回归到业务本身的创新性、稳定性上来。 在绝大部分场景下,使用Serverless架构是一种双赢的选择: 用户...

    文章 唐恺 2018-10-23 7927浏览量

  • 揭秘双11丝滑般剁手之路背后的网络监控技术

    概要:刚刚结束的2020天猫双11中,MaxCompute交互式分析(Hologres)+实时计算Flink搭建的云原生实时数仓首次在核心数据场景落地,为大数据平台创下一项新纪录。借此之际,我们将陆续推出云原生实时数仓双11实战系列内容,本篇将重点介绍Hologres在阿里巴巴网络监控部门成功替换...

    文章 May-Hologres 2020-11-23 3401浏览量

  • 2017双11技术揭秘—双十一海量数据下EagleEye的使命和挑战

    作者:王华锋(水彧) 背景 双十一一直是阿里巴巴集团每年要打的一场大战役。要打赢这场战役,技术上,不仅仅是几个应用、几个系统的事,也不是多少个开发+多少个测试就能完成的事,而是需要各大系统协同作战、每个应用各司其职、技术人员通力合作才能取得最终的胜利。 EagleEye作为阿里集团老牌的链路跟踪系...

    文章 中间件小哥 2017-12-26 4721浏览量

  • 如何在一分钟内实现微服务系统下的架构可视化

    为什么需要架构可视化 随着企业进行微服务架构改造,系统架构复杂度越来越高,架构变化日益频繁,微服务改造后的实际架构模型可能与预期已经产生了巨大差异,架构师或系统运维人员很难准确记忆所有资源实例的构成和交互情况;其次,系统架构在动态演化过程中可能引入了一些不可靠的因素,比如弱依赖变强依赖、局部容量不...

    文章 中间件小哥 2018-11-28 3947浏览量

  • [喵咪BELK实战(1)]浅谈日志的重要性以及介绍BELK

    前言 哈喽大家好呀!这次主要为大家带来BELK日志系统相关的博文,日志大家都知道,比如nginx请求日志,系统的日志,自己程序写入的日志,可以说是日志无处不在,但是对于这些无处不在的日志我们怎么去查看分析它们呢?这个就比较有意思了,随着系统逐渐增大排查问题的成本越来越高,这个时候就需要引入日志系统...

    文章 喵了个咪_ 2020-08-11 49浏览量

  • 6 个 K8s 日志系统建设中的典型问题,你遇到过几个?

    作者 |  元乙  阿里云日志服务数据采集客户端负责人,目前采集客户端 logtail 在集团百万规模部署,每天采集上万应用数 PB 数据,经历多次双 11、双 12 考验。 导读:随着 K8s 不断更新迭代,使用 K8s 日志系统建设的开发者,逐渐遇到了各种复杂的问题和挑战。本篇文章中,作者结合...

    文章 阿里巴巴云原生小助手 2019-09-18 3252浏览量

  • 八年来我们到底经历了什么?——中间件专家带你“重走”双11高可用架构演进之路

    双11的技术挑战 双11技术挑战的本质使用用有限的成本去是实现最大化的用户体验和集群整体吞吐能力,用最合理的代价解决零点峰值,支撑好业务的狂欢。阿里做双11已经有八年之久了,八年来双11的交易额增长200倍,交易峰值增长400多倍,系统复杂度和大促支撑难度以指数级攀升;并且经过多年的发展,双11技...

    文章 场景研读 2017-08-04 7587浏览量

  • 展望下一代医疗集成平台

     【导读】 医疗信息集成在我国医院信息化的发展中,已经落地实施了将近十年。这十年间,信息集成平台的建设,从一、两家的最佳实践案例到全国医院的大规模实施,再到国家卫健委的互联互通标准化测评,已经经过了行业内的充分论证与实践,取得了蓬勃的发展。那么,究竟集成平台需要具备哪些特性,才能更好地满足:1) ...

    文章 游客43uqs2p44ldyw 2020-06-23 274浏览量

  • AI助力日志中心智能化运营

    摘要:AIOps将人工智能应用于运维领域,基于已有的运维数据通过机器学习的方式来进一步解决自动化运维无法解决的问题。运维数据包含海量的日志数据,随着大数据分析水平的提升,需要更加精准地挖掘日志当中的信息。本文将主要介绍日志易在AIOps方面如何做出智能的日志中心以及日志在IT领域中发挥的价值。 ...

    文章 sherlding 2018-06-23 9927浏览量

  • 微服务架构可视化平台实践

    为什么需要架构可视化 随着企业进行微服务架构改造,系统架构复杂度越来越高,架构变化日益频繁,微服务改造后的实际架构模型可能与预期已经产生了巨大差异,架构师或系统运维人员很难准确记忆所有资源实例的构成和交互情况;其次,系统架构在动态演化过程中可能引入了一些不可靠的因素,比如弱依赖变强依赖、局部容量不...

    文章 心远 2018-11-29 1501浏览量

  • 阿里双11网络技术揭秘:百万级物理和虚拟网络设备的智能化之路

    阿里巴巴资深技术专家后羿 后羿:大家好,首先给大家呈现的是阿里巴巴在双11中主要依赖的网络相关技术。在今年双11中我们在稳定性、高性能网关、去堆叠以及25G、骨干网流量调度平台、流量的精准评估、QOS优化和成本优化方面都取得了突破性的进展。 助力双11的重要网络技术 在稳定性的强化方面,在过去一年...

    文章 技术小能手 2018-01-05 4693浏览量

  • 基础设施助力双11(十):百万级物理和虚拟网络设备的智能化之路

    导言 后羿:阿里巴巴资深技术专家,参与8年双11大战,主导阿里“去IOE”战略落地,目前在推动阿里基础设施智能化。 后羿此次给大家分享的是双11的智能化网络实践,关于如何在网络智能领域通过数据手段极致地优化运营场景,在稳定性、成本、效率方面提升网络运营竞争力,给大家呈现了阿里巴巴在双11中主要依赖...

    文章 初商 2019-07-31 766浏览量

  • 深入解读面向微服务的分布式秒级监控系统Infinsight

    原创: 伯邑 背景 在云服务环境中,服务的质量一向是云服务厂商关注的重点,为了保证云服务质量的最大化,以及在出现故障时能够协助用户对故障进行快速的定位,监控服务在其中起着非常重要的作用。 目前,许多云厂商提供的监控服务多在分钟级,这种级别的监控服务对于瞬息万变的服务变化,往往粒度过大了。尤其是针对...

    文章 KB小秘书 2019-07-28 859浏览量

1 2 3 4 ... 10 >

云产品推荐

阿里云企业服务平台 陈四清的老板信息查询 上海奇点人才服务相关的云产品 爱迪商标注册信息 安徽华轩堂药业的公司信息查询 小程序定制 上海微企信息技术相关的云产品 国内短信套餐包 ECS云服务器安全配置相关的云产品 天籁阁商标注册信息 开发者问答 阿里云建站 自然场景识别相关的云产品 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 北京芙蓉天下的公司信息查询