• 阿里:千亿交易背后的0故障发布

    我们针对阿里的故障产生原因做了统计,其中很大一部分都是线上变更引起的,相信在座各位也会遇到或者制造过故障,开发和运维的同学对故障都是很敬畏的。故障大家都遇到过,但是故障的影响差异会比较大。有些故障可能...
    文章 2018-04-20 5064浏览量
  • 无人值守时代,运维如何保障发布质量?

    我们针对阿里的故障产生原因做了统计,其中很大一部分都是线上变更引起的,相信在座各位也会遇到或者制造过故障,开发和运维的同学对故障都是很敬畏的。故障大家都遇到过,但是故障的影响差异会比较大。有些故障可能...
    文章 2018-04-18 3693浏览量
  • 使用SLS发现服务节点异常

    网络原因&xff1a;负载均衡与后台服务器之间的网络不同&xff0c;导致服务节点无法提供服务&xff1b;服务物理节点断电或者down机&xff1a;导致机器上的服务全部不可用&xff1b;服务本身Bug&xff1a;机器上其他服务可用&xff0c;但是...
    文章 2021-08-06 59浏览量
  • Java 编程中关于异常处理的 10 个最佳实践

    这在Java编程中,是一个广为人知的最佳实践,在处理网络和IO类的时候,相当于一个标准。在finally块中关闭资源,在正常和异常执行的情况下,保证之前和稀缺资源的合理释放,这由finally块保证。从Java7开始,该语言...
    文章 2018-07-22 716浏览量
  • Java开发中异常处理的最佳实践

    这在Java编程中,是一个广为人知的最佳实践,在处理网络和IO类的时候,相当于一个标准。在finally块中关闭资源, 在正常和异常执行的情况下,保证之前和稀缺资源的合理释放,这由finally块保证。从Java7开始,该语言...
    文章 2017-08-01 688浏览量
  • OmniPeek 基础之协议分析

    那么Ominpeek提供了哪些功能来快速的帮助我们对网络问题进行故障诊断/定位。1.主机排名,发现网络中通信量最大的主机,对比故障现象与影响范围。2.协议排名,可以对监控的所有协议进行排名,找到使用最多的协议。3....
    文章 2016-04-27 2186浏览量
  • 探讨一下如何打造稳定的报名系统之考务管理报名系统...

    我们的系统包含了招聘公告发布、网上报名、资格审查、在线缴费、考场设置、座位自动编排、准考证生成及打印、成绩查询、面试通知单、短信群发、数据导出Excel、自动生成人才库信息等覆盖人事考试(报名)与考务管理...
    文章 2020-06-13 114浏览量
  • 如何健壮你的后端服务?

    过去两年间看过不少故障,直接或间接原因来自于糟糕的接口。如果你的接口让很多人误用,那要好好反思自己的接口设计了,接口设计虽然看着简单,但是学问很深,建议大家好好看看Joshua Bloch的演讲《How to Design a ...
    文章 2015-12-04 5465浏览量
  • 采用IT监控策略预测数据中心的挑战

    监控存储、网络和服务器的操作使用结果可以指示出其瓶颈和故障。一个很好的信息监测系统将花费更多的资金和工作人员的时间,但使用蛮力的方法将收集多余的数据,可能会导致信息过载,而不是寻找根本原因。存储升级 ...
    文章 2017-07-05 1014浏览量
  • Java异常经典14问,你都能答对吗?

    异常可能来自不同类型的情况,例如用户输入的错误数据,硬件故障网络连接故障等。每当执行java语句时发生任何错误,都会创建一个异常对象,然后JRE会尝试查找异常处理程序来处理异常。如果找到合适的异常处理程序...
    文章 2019-06-12 11712浏览量
  • Java异常经典14问,你都能答对吗?

    异常可能来自不同类型的情况,例如用户输入的错误数据,硬件故障网络连接故障等。每当执行java语句时发生任何错误,都会创建一个异常对象,然后JRE会尝试查找异常处理程序来处理异常。如果找到合适的异常处理程序...
    文章 2019-06-12 129浏览量
  • Linux之系统故障分析与排查

    在有些情况下,可以设置syslog,使其在把日志信息记录到文件的同时将日志信息发送到打印机进行打印,这样无论网络入侵者怎么修改日志都不能清除入侵的痕迹。syslog日志服务是一个常会被攻击的显著目标,破坏了他将会...
    文章 2017-11-16 1727浏览量
  • Linux 运维工程师必备监控工具集(转载)

    MTR 将 traceroute 和 ping 的功能结合到了一个网络诊断工具上。当使用该工具时,它会限制单个数据包的跳数,然后监视它们的到期时到达的位置。然后每秒进行重复。28、Tcpdump Tcpdump 将按照你在命令行中指定的表达...
    文章 2018-02-26 1005浏览量
  • 带你读《计算机网络原理》之二:网络体系结构

    6)对出现的各种差错和意外事故,如数据传送错误、重复或丢失,网络中某个节点的交换机出现故障等,应当有可靠的措施保证接收计算机最终能够收到正确的文件。除此之外,还可以列举出其他要做的工作。由此可见,相互...
    文章 2019-11-07 705浏览量
  • 内核驱动调试方法

    特别,你不应当打开网络-除非,当然,你在调试一个网络驱动.一般地以单用户模式启动系统是一个好主意,如果你将使用 kdb. 作为一个例子,考虑一个快速 scull 调试会话.假设驱动已经加载,我们可以这样告诉 kdb 在 sucll_...
    文章 2017-05-11 822浏览量
  • 一文详解Redis中BigKey、HotKey的发现与处理

    此类高级功能的合理使用能够解放大量Redis的运维、故障处理工作并降低业务的代码复杂度,让运维将精力投入到其它更有价值的工作中,让研发有更多的时间来写更有价值的代码。2 热Key的常见处理办法在Redis Cluster...
    文章 2021-08-25 920浏览量
  • 带你读《基于区块链的物联网项目开发》之一:了解物...

    相反,它们通常有预先准备好的网络网络的一端是设备,另一端则拥有许多Web hook和功能,你可以在这一端连接到你的应用或平台: 与移动网络不同的是,LPWAN网络不提供到设备的互联网连接,而是提供方法创建从设备向...
    文章 2019-10-31 1950浏览量
  • SQL Server错误代码及解释(一)

    1058 无法启动服务,原因可能是它被禁用或与它相关联的设备没有启动。1059 指定了循环服务依存。1060 指定的服务并未以已安装的服务存在。1061 服务无法在此时接受控制信息。1062 服务未启动。1063 服务进程无法连接...
    文章 2016-04-21 3209浏览量
  • 带你读《Python网络编程(原书第2版)》之二:低级...

    连接物理设备并不好玩,它们非常沉而且很笨重,连接所有电缆也很痛苦,并且很容易引起链路故障,每次有故障时又需要拔掉电缆。几年后,Dynamip出现了,创建不同的网络场景变得非常容易。只需要来自Cisco的IOS镜像和...
    文章 2019-11-14 630浏览量
  • 带你读《物联网之魂:物联网协议与物联网操作系统》之...

    2层交换机主要用在小型局域网中,机器数量在二三十台以下,这样的网络环境下,广播包影响不大,2层交换机的快速交换功能、多个接入端口和低廉价格,为小型网络用户提供了完善的解决方案。总之,交换式局域网技术使...
    文章 2019-11-12 759浏览量
  • 带你读《计算机网络原理》之一:计算机网络概述

    同样,带有多个远程终端或远程打印机的计算机系统也不是一个计算机网络,只能称为联机系统(因为历史上的许多终端都不能算是“自治计算机”)。但随着硬件价格的下降,许多终端都具有一定的智能,因而“终端”和...
    文章 2019-11-07 562浏览量
  • 云栖科技评论第21期:Facebook绿色数据中心提供空前的...

    正所谓魔高一尺、道高一丈,考虑到网络威胁不断发展,大多数安全故障背后的主要原因是保护措施已过时,所以需要在合规方面不断完善。关于客户锁箱功能,微软允许用户决定谁可以访问他/她的IT资产和水平,最小化...
    文章 2018-03-02 660浏览量
  • 带你读《工业物联网安全》之一:一个前所未有的机会

    在工业上,物理世界和网络世界的融合意味着可以在数千英里外操作(设备),可实现主动检测和修复机器故障、数字化跟踪供应链、远程提供保养护理,以及许多类似的用途。毫无疑问,这些用途是有前景的。然而,网络威胁...
    文章 2019-11-05 1135浏览量
  • 带你读《计算思维导论》之三:计算平台

    现有计算机基本上都配有25针D形接头的并行接口,称为打印终端接口(Line Print Terminal,LPT),如LPT 1、LPT 2……,一般用来连接打印机或扫描仪。在目前的品牌主板上,上述串口和并口已不再作为标配向用户提供,...
    文章 2019-10-30 3025浏览量
  • Flink 1.10 Container 环境实战

    我们发现作业运行过程中经常遇到 Connection reset by peer 问题,原因是 Flink 在设计时,对网络的稳定要求很高。因为要保证 Exactly once,如果数据传输失败,那么 Flink 就要 fail 整个 task 并重新启动,然后...
    文章 2020-06-09 326浏览量
  • Flink 1.10 Container 环境实战

    我们发现作业运行过程中经常遇到 Connection reset by peer 问题,原因是 Flink 在设计时,对网络的稳定要求很高。因为要保证 Exactly once,如果数据传输失败,那么 Flink 就要 fail 整个 task 并重新启动,然后...
    文章 2020-06-09 636浏览量
  • 软件调试是鸡肋?你的认知决定你的层次!

    其基本目标是要让CPU在这个网络中奔跑时可以完成需求中所定义的功能。对这个网络的其他要求通常还有可靠、灵活、健壮和易于维护,开发者通过简单的改造就能让其他类型的车辆(CPU)在上面行驶…… 开发一个满足以上...
    文章 2018-11-29 1766浏览量
  • 如何成为优秀的技术主管?你要做到这三点

    记录哪些信息,最好打印一定的上下文(链路TraceId、用户Id、订单Id、外部传来的关键数据)而不仅仅是打印线程栈。记录了上下问信息,是否要考虑日志脱敏问题?可以在框架层面实现,比如自定义实现logback的...
    文章 2019-02-27 9210浏览量
  • 深入了解 Flink 网络栈(二):监控、指标和处理背压

    我们甚至可以通过查看两个连续任务的子任务的网络指标来深入了解背压产生的原因: 如果接收器任务的所有子任务的 inPoolUsage 值都很低,并且有任一上游子任务的 outPoolUsage 较高,则可能是网络瓶颈导致了背压。...
    文章 2019-10-30 7178浏览量
  • Everything you should know about etcd

    升级一定要一台一台的进行,且进行升级的过程需要将-initial-cluster-state的状态改为existing,否在如果在系统刚起来且因为网络或者其他原因导致无法同步集群其他节点信息的时候,会使得etcd认为自己需要重新命名...
    文章 2018-01-21 4538浏览量
< 1 2 3 4 6 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化