惊心动魄!程序员们说这些时刻再也不想经历了

简介: 下面的这个场景你熟悉吗: 在一个月黑风高的晚上,大风无情的刮落着树上的枝叶。一个少年突然从睡梦中惊醒,发现已是一身冷汗,他看了看时间,才凌晨三点多,然后又重新闭上眼睛平复心跳,面无表情地躺在床上一动不动,他要努力着让自己睡着,因为他已经好几天没有睡觉了,他的身体需要好好的休息。

下面的这个场景你熟悉吗:

 在一个月黑风高的晚上,大风无情的刮落着树上的枝叶。一个少年突然从睡梦中惊醒,发现已是一身冷汗,他看了看时间,才凌晨三点多,然后又重新闭上眼睛平复心跳,面无表情地躺在床上一动不动,他要努力着让自己睡着,因为他已经好几天没有睡觉了,他的身体需要好好的休息。 
![image](https://yqfile.alicdn.com/2c8b1dd49d1f3358efc0ba29ce88fa2a95be7d37.png)
 三天前的一个中午,当少年像往常一样登录服务器时,却被服务器拒绝登录,多次重输密码,却怎么也登录不了。他这才意识到,服务器被黑客入侵了,服务器上300多个网站瞬间瘫痪。

image

 一时间客户暴打电话,客服妹妹吓得不敢接电话,他试着接了一个,客户一开口,就是破口大骂。整个公司乱成一团。

image
在奋战两夜三天后,服务器终于维护完成,漏洞已被找到,网站全部恢复正常。窗外的大风还在呼呼呼的刮着,又仿佛这一切从未发生过,但是少年的心里却留下了不可抹去的阴影,每天晚上被恶梦惊醒,听到铃声心惊胆颤,不敢登录服务器。

作为一个技术人员,谁都得经历这种挑战。比如:
ftp修改程序是为了偷懒,未备份源文件,结果操作失误,误删文件;
大包大揽技术难题,结果久久未能出成果,最后使得整个工程无法完成;
负责的代码出现超严重bug,把整个活动搞砸。
*

云栖百位技术战友分享的这些技术生涯特殊时刻,你有没有觉得似曾相识?

image云栖网友巴洛克上校:
您在技术生涯中遇到的最大危机是什么?
做前端的目前工作没遇到过太大危机,要是说ftp修改程序是为了偷懒没备份结果删错了还真有,结果趁人没发现重弄了放上去了,再就是我写了好几天的代码再某人一次错误的把插销屏幕变黑那一刻全部变成了乱码而且客户还着急要,当时想杀了他。要说大危机公司确实遇到但是也是4年前我刚去公司不久的事情过事情这样的当时我们公司主要是负责做企业宣传行网站的,那时候还是万网好像还没完全没和阿里合并,但是还有个挺大的Xin网,当时好像是Xin网的主机比万网的便宜所以用的多数是他家的,可是有一天公司的电话响个没完啊很多客户都投诉说自家网站打不开再不就是说被显示为危险网站不让打开,经过查看统计50多个网站被挂马,联系了X网结果是我们正在恢复,可悲的是恢复回来的文件依然是不行;我们自己留的备份都是原始的很多网站中途改过很多次直接恢复了资料和修改的东西全丢了于是乎我们忙活起来了(那时候我还在实习期)把挂马的挨个下下来改啊当时都疯了因为当时还有零几年的纯静态的网站想想那地多些页啊,奋战了4天,才弄好从哪以后公司慢慢把网站全都转到万网了,并且给我们立了条规矩就是网站一周至少备份一次,当然我不管备份的事情哈哈。但自从换到阿里再也没出过这个问题,不得不说阿里很牛啊。

有些让你担惊受怕的往事整得你会夜不能寐?
让我夜不能寐的往事有但是跟工作没太大关系,就是我小时候很小的时候和我表哥玩,那时候他也不大,在我家院子里有个二层楼的高台表哥他手里拎着带尖木棍子爬上去扔让我在下面接着那时候小啊,傻呵呵就去接要现在打死我也不干啊,一下子木棍在就插进我眼睛里了,那种感觉至今难忘啊,我妈急忙送我去医院医生那个酒精球就往眼镜里怼啊,完了有用生理盐水冲那酸爽,最后缝了3针医生告诉我妈你孩子命挺好在偏一点眼睛就瞎了现在想想都后怕。

你是如何应对这些的?
如果我遇到大危机第一件事冷静分析啊看看什么原因造成的,根据原因查找解决办法。
image

image云栖网友ecs333:
之前云还没兴起的时候,自己托管服务器在机房,修改ssh端口,把22注释后,service sshd restart,害得我半夜打机房运维电话。

image

image云栖网友jackyliu:

在上家公司的时候,我负责开发了一个大版本的跨服战功能,一个赛季要一周,整个比赛的进程主要是timer驱动的。这个功能最初在本地测试没有问题,上线时,某些区服会时不时出现比赛不走了。服务器是JAVA写的,也看不到错误日志。这个BUG折磨了我一个月,因为无法自测重现,只能改一版,扔到线上测试测试,如此反复。说结论吧,最后发现,原因是批量加分时,我为每个用户开了一个线程,导致OOM线程退出了,而仅当参赛玩家足够多时,才会OOM。代码写的try catch只捕获Exception,不包括Error,这个bug弄的我现在都有阴影了,现在写代码都是try{}catch(Throwable t){}
这个BUG,前前后后拖累了项目一个多月,运营测试还陪我熬了几个通宵。每次运营来找我,我都害怕,心想:操,程序又自动退出了。后来我都想引咎辞职了,可是我走了谁修这个问题?
后来终于熬出来了,同事和老板也没有明里指责我。没办法,那时候,我做服务器开发才半年吧,经验不足。后来,我在服务器开发上越发在行,在现在公司也是主力开发。一个经验就是,服务器资源一定不能随着用户数ON级别增长。艰难困苦,玉汝于成,与诸位共勉!
image

image云栖网友红尘老方:

         半年前,为单位做的宣传片已接近尾声,两天后为来宾登台播放。结果遭二愣子兄弟误格式化,包括素材视频等若干G的资料全部丢失,该分区还被写入了数据。瞬间感觉天塌地陷!奋斗两天两夜没合眼,好歹最终交了差!泪奔啊!

image

image云栖网友浮生递归:
一次客户网站被黑,被上级单位监测出来,并发通知过来。然而以我的水平,查遍服务器也没找到问题。然后同事里也没人愿意帮忙背这个大锅。我只能按照固定的一些套路,去一一排除,然后做好排查记录,并上报情况。直到现在,也没发现问题到底出在哪里。严重怀疑是误报,TNND。
自己的信息管理系统,部署在某个网站下面。一次该网站被黑,被上传了木马等文件。从安全角度讲,该网站下的所有文件都涉嫌了信息泄露。包括我自己的那个信息管理系统。然后,这个系统里保存了我所有重要的资料,比如各网站的FTP账号密码,后台地址账号密码,已经银行帐号密码等等。现在还是天天在担心,整个数据库被黑客扒过去了,他会不会发现里面的这些资料,然后对这些资料进行利用。那我就杯具了。虽然可以把所有的密码都修改一遍,但是涉及到一百多个密码,实在懒得去改……
每次危机都能让自己安全方面的技术提高一大步。但是毕竟自己不是专业安全维护人员,感觉这方面研究太深也没什么必要。只要做好标准的处理就差不多了。毕竟做人不可能每方面都做到专精。宁精勿杂,宁专勿多才是正道。
image

image云栖网友1277187923309524:
我个人觉得危机很多,也不知道以后还会有什么样的危机。
无法入睡的事情也很多,但是最让人难受的是客户的数据库服务器全崩盘,所有数据全丢失……天天都在想办法修复,要是弄不好,没法在这混了,那段时间提心吊胆的。

image云栖网友欢乐的胖子:
感觉好像只要是跟我稍微有点关系的技术问题都会让我睡不着,这么多年了即使是其他部门负责的业务突然宕机,只要知道了就很揪心,一直关注进展,虽然很多时候并不能帮上忙,但是当问题解决的消息出来后,终于一身轻松。印象最深的是上上个东家,有位很重要的客户数据丢失了,怎么查都查不到,为了排查问题连续通宵好几天,问题解决后还有段时间做梦都梦到在排查问题。

image云栖网友悲剧的冰水:
直接复制sql语句没看内容结果中间有条drop table。还好drop掉的是张老日志表,最后重新导入了。服务器新增结果超负荷跳闸,半个机房的数百台单电源设备全宕。最后赶紧去叫电力师傅上电,新设备暂停上架,整个集团设备上架流程变更,新设备入网新增电力负荷审计流程。。。。带新人去配置板卡,让新人把板卡拿回仓库,结果新人把价值数十万的语言板卡装袋子里甩着玩,然后脱手甩飞。赶紧把板子捡回来测试半个小时。。。想要执行rm -rf 手滑输入个rm -rf /。重装重部3小时。
错误可一不可二。每踩一次坑都是一次进步。
image

image云栖网友石头2017:
就在两个月前,我们的服务器被DDOS攻击了,半小时过去了还没有解决,被老板骂了个狗血喷头,之前也出现过被攻击的情况,不过都是10几分钟后就恢复平静,但是这次不一样,仿佛那边的黑客就盯着我们一样,持续不断的攻击,我们上一台服务器,马上瘫掉,上一台马上瘫掉,两天过去了,中午消停了,可是就在过了个周末,周一又被攻击瘫痪了,似乎那边的黑客想怎么玩我们就怎么玩,又折腾了两天,通宵达旦啊,我们身体都吃不消了,那边老板还在不断催促着,最后上了高防IP,终于消停了,我的娘啊,还得我还得了病毒性疱疹,医生说都是熬夜惹得或!
image

image云栖网友石头1119197705597954:

自己写的代码把服务器搞死机了,瞬间感觉自己闯了大祸   ![image](https://yqfile.alicdn.com/38dbdb4ed370b4c9a4dc975c8df3085a7f5a77ce.png)
          ![image](https://yqfile.alicdn.com/df4a210a7235aef366fc0a351a493004bc7128be.png)**云栖网友石头1119197705597954:** 
                             一年前,正值高考期间,单位所处地段正在进行三改四化项目建设,正在从事高考工作时,突然被人告知单位的网站,oa等所有业务应用都不能访问,心里咯噔了一下,马上向领导告假奔赴机房,发展机房完全断电(受三改四化影响停电),不是有ups吗??怎么会断电?带着疑问检查ups,真是屋漏偏逢连夜雨,赶巧ups竟然罢工了,以为来电就会没问题的,也就没放心上,晚上来电后加班启动机器,结果发现所有的业务服务器全部不能正常启动,单位的服务器全部虚拟化,采用的群集化管理,因非正常断电关机,存储阵列柜发生错误,数据岌岌可危,所有虚拟机出现磁盘链错误无法启动,加班搞了通宵,找dell技术沟通(dell说服务期已过,拒绝提供服务),只能依靠度娘查阅了大量的资料终于恢复,马上第一时间将重要数据做了异地备份,同时ups按流程进入政府采购流程,松了一口气后继续高考工作。好景不长,时隔二天进入学考,又被告知所有业务不能访问了,再次排查,悲催的事情再次发生,因三改四化再次断电,ups还在走流程,只能祈祷不要出问题,来电能正常恢复,可越是担心的事就偏偏发生,等电再次恢复时,所有虚拟机彻底瘫痪,数据全部丢失。幸好出问题时数据全部做了异地备份,不然真不知道如何交代。接二连三的灾难让我产生了放弃自建机房的念头,向领导打报告购买阿里云ecs服务器,给领导算了一笔账,服务器 存储柜硬件费用,15kw的360天的不间断电费远远超过阿里云的租赁费,专业的事情交给专业的人去做,我只管使用,换来了稳定的 安全的服务。一年过去了,阿里云给我带来了前所未有的使用体验,一年来,360天无故障运行,过硬的技术支持,人性化的售后,安全的数据备份(快照及镜像),强大的管理功能,无不得心应手。真实的切身的体验,作为机房管理员的你,是不是有了新的想法?最后申明,我无意为阿里云宣讲什么,只是现在的我,真的工作起来很惬意,很轻松!!!     ![image](https://yqfile.alicdn.com/21bdc51e79de46b0f067588606adb340e411000b.png)
 ![image](https://yqfile.alicdn.com/53b219d83a26a3361ee54e4be10a7fda82b888e2.png) **云栖网友favori:**  
                                                                                                                   最怕的就是'找不到该对象'!!!!!!!!!not found this object     

你的技术生涯经历过什么样的惊魂时刻?快来聚能聊和云栖网友一起分享吧!
技术生涯中遇到的最让你担惊受怕的事件是什么?

相关文章
|
5月前
|
程序员 C# C++
lpszBlogName C#开发多年中途被迫改行C++但工作中又经常偷偷使用C#的C++程序员
通过AUMID解析出packageFamily,再根据PackageManager解析出安装目录 PackageManager是WinRT的类型,如何在c++中使用WinRT,请参考C++/WinRT 以下代码需要管理员权限才能运行。
|
6月前
|
存储 Java 关系型数据库
自信,紧张,焦虑,意外?蚂蚁金服难忘的四面经历,真的太刺激了
前段时间,蚂蚁金服的热度可不小,互联网圈人人都在讨论它上市的事情,实际上蚂蚁金服上市是迟早的事情。这一下,蚂蚁的员工含金量上升了不少,那我之前蚂蚁提前批这波面经,也是时候分享了。
|
Web App开发 安全 中间件
学会这招,技术问题再也难不倒你
学会这招,技术问题再也难不倒你
学会这招,技术问题再也难不倒你
|
程序员
能让程序员瞬间崩溃的五个瞬间,共鸣的同学请举手!
在我们的眼里,程序员好像是无所不能的,那么复杂的App和那些游戏都是他们做出来的,这让我们很难相信还有什么是他做不出来的。不过,就是我们每天眼里看着很厉害的程序员,每天都要面临的就是头疼,头疼,头好疼,特别是我接下来要说的几件事情,几乎是所有程序员都会把头抓秃的事     那么这五件事情究竟是什么事呢? 写着代码停电,代码没有保存 如果有一天突然代码写到一半,眼看就快要完工了,突然一下就断电,代码没保存。
1334 0
|
人工智能 安全 数据挖掘
这么一搞,再也不怕线程打架了
假如我们需要处理一个文本文件,里面有 100万行数据,需要对每条数据做处理,比如将每行数据的数字做一个运算,放入到另一个文件里。
144 0
这么一搞,再也不怕线程打架了
|
架构师 程序员
码农代码之外的生存指南,不要等到而立之年再后悔
  程序员不应该只会写代码。   我觉得在程序员群体中,很多人有个误区,就是觉得作为码农,每天安安静静的敲代码、默默的做好技术就可以了,其他的事情都不用去思考,以为一切都会水到渠成。但是还没等到水到渠成,却先等来了中年焦虑。慢慢的等到自己到了三十多岁的时候,发现公司里年轻且更能加班码农越来越多,带来了职业发展上的焦虑,同时上有老下有小且薪资也慢慢遇到职业瓶颈,又加重了生活财务的焦虑。   最近又翻了翻之前看过的一本书《软技能-代码之外的生存指南》,再次来读,又有一番新的理解。   作为一名程序员,我们的职业与生活中,不能仅仅只关注代码和技术。
209 0
|
芯片
瞧!公务员的工作还可以这样干
盼啊盼,第六届世界互联网大会在乌镇如期而至。 在今天的大会上,小云带来了帮助公务员提升工作效率的“神器”,平头哥压箱底的“宝贝”...... 一起来深入了解下。
9253 0
|
机器学习/深度学习 算法 程序员
积攒了这么多技术干货,总有一款适合你
每天来云栖社区,总会有精彩的技术干货等着你。我们会不断为你整理优质的文章和教程,赶快收藏一下本文吧(本文会不断更新)。
5645 0
瞧!这5000个爱管闲事的工程师干的好事.....
从 2018 年 4 月来到大爱清尘基金开始,师先存就没有正经过过几个周末。
10163 0

相关实验场景

更多