阿里云的磁盘IO不稳定到了什么程度??这还能使用吗?有日志有真相!
Re阿里云的磁盘IO不稳定到了什么程度??这还能使用吗?有日志有真相
在excel中,对日志文件中,按40字节耗时排序
从日志文件中可看出,正常时耗时为0毫秒(因为仅仅只有40字节),但这两天不稳定,一旦出问题,磁盘根本无法访问,磁盘直接卡死
在03:09:21,连续481秒,超过6分钟没有响应!
5月21日零点到9点,超过1500秒出现这种不稳定的情况,占比高达4.62%。这样的磁盘IO,怎么让用户使用???
-------------------------
回4楼gdliwt的帖子
每秒40字节的写操作是频繁的写操作??不知道这个标准是否是阿里云的标准??
我不希望阿里云来迎合我,只希望阿里云的磁盘IO保持稳定。如果阿里云连每秒40字节的写入速度都不能保证,我当然无话可说。
-------------------------
回6楼gdliwt的帖子
你好!这个不是抱怨,而是督促阿里云解决问题。
我的服务期尚未到期,在阿里云出现问题时,我当然是希望阿里云解决问题了。
-------------------------
回9楼lusin的帖子
是的,这个是非常小的数据量,主要是检测阿里云磁盘彻底“卡死”的现象,也就是彻底无法访问磁盘IO。
网址的日志记录写入频率都是高于这个频率的。
而且这个每秒40个字节的写入,是一个计时器,写入后,等待下一秒才写入,并非连续不断写入。就这样低的要求,都无法达到。所以说,磁盘IO卡死时,根本就无法使用。
如果不是日志程序记录,我根本就不知道在03:09;07:02时磁盘IO卡死了几分钟,因为多数时间正常,但要命的是,它不稳定啊,一旦不正常,就卡死了。
其实这个问题非常普遍,只是没有发现而已。客户发现网站临时故障,一般也没有反馈给站长。
-------------------------
回11楼淡淡烟味的帖子
就是使用有问题才测试,否则谁有闲心做个程序来测试呢?都是遇到问题了,才进行测试。
-------------------------
Re阿里云的磁盘IO不稳定到了什么程度??这还能使用吗?有日志有真相
解释一下,日志记录到内存变量,测试正常时才存盘。
同时,日志本身的数据量非常小(也就是每秒不足几十个字节的数据量而已),这点系统开销几乎可忽略不计。实测也证实了这个现象,绝大多数时间写入耗时是0毫秒(毕竟测试仅仅写入40字节),但要命的是不稳定的时候,整个磁盘IO就彻底卡死了。
另外,说明一下,检测程序并非持续不断写入,而是一个计数器,每秒测试一下40字节的写入(正常情况下耗时为0毫秒),之后就一直闲置,等待下一秒才测试。也就是说,检测程序本身基本上是完全闲置的,系统负荷非常轻。
-------------------------
Re阿里云的磁盘IO不稳定到了什么程度??这还能使用吗?有日志有真相
刚才接到了阿里售后工程师的电话,阿里至少在努力解决问题,这点要赞一个!
工程师这么晚还在工作,小小的感动了一把,:)
已经决定周末彻底迁移到另外一个集群,因为集群换了(IP都会变),数据、程序全部需要自己迁移,稍微麻烦一点,不过没有关系,只要能彻底解决问题就好!
-------------------------
回29楼j1zero的帖子
自己做了一个简单的程序,就是一个计数器,每秒执行一次,每次往磁盘写入40个字节,记录前后时间并放入内存变量中。正常情况下均为0毫秒的写入。但偶尔会出现磁盘彻底卡死。
我的这台服务器最近卡死较频繁,今日迁移到另外一个集群了,IP头:121.199,希望不再出现这种现象。
-------------------------
Re阿里云的磁盘IO不稳定到了什么程度??这还能使用吗?有日志有真相
有始有终,我是开贴的楼主,感谢阿里云工程师的协助,今日我的这台服务器已迁移到另外一个集群中了,IP头:121.199
感谢各位网友在这里的讨论,也感谢阿里云工程师的努力!
周末两天都用在迁移数据和程序上了(服务器集群变了,IP也变了,无法云迁移,只能完全依靠手工进行数据集程序的迁移),自己忙了两天,但只要不再出现这种磁盘不稳定的现象,我觉得是值得的!
在与阿里工程师交流过程中了解到,阿里目前已很重视这个问题,并已在加紧解决。这个周末,我在迁移数据中发现原服务器(就是前两周经常出现磁盘卡死的这台服务器)磁盘IO性能至少这两天已有明显改善了。
赞0
踩0