对待棘手bug,新手与大牛的差距在哪里?-阿里云开发者社区

开发者社区> 技术小能手> 正文

对待棘手bug,新手与大牛的差距在哪里?

简介:
+关注继续查看

一行代码引发周边童鞋的Xcode内存爆炸。作为一名喜欢探究到底的工程师,岂能袖手旁观?来自高德的涛澜童鞋,给出了一个样本式的解决思路。下面就让我们一起走进“案发现场”。

image

问题描述:

  • 自上上周起,团队中陆续有iOS开发抱怨电脑特别卡。有细心的同学发现,因为Xcode占用了约6-7G内存,而部分mac只有8G内存,所以内存爆满引起卡顿。
  • 而部分同学的mac是16G内存的,比如我(嘲讽脸),因为内存充足没感觉到卡。
  • 但这个问题影响团队的开发效率,所以需要去解决问题。

内存对比:

在沐浴更衣焚香、杀进程、清缓存后,分别拉取相邻的812版本代码和816版本代码分别编译,得到结论:

  • 812调试时,占用2G内存
  • 816调试时,占用6.8G内存


image


吐槽:

  • 对于这个数据,我们内心是拒绝接受的。有如下2点吐槽:

    • 如果代码乱申请内存,那么内存爆掉的应该是模拟器或真机。而不该是Xcode
    • 如果当前版本新增10w行代码(其实不到),对总代码量增长不超10%,Xcode内存怎么可能翻两翻。
  • 所以我们觉得,这一定是苹果的锅,我们不背

但是不管是谁的锅,肯定是代码或者配置触发的,分析还要继续。

分析方法选择:

  • 摆在我们面前有2个分析方法:

    • 找代码:通过二分法,编译不同日期的版本,找到引发问题的那次提交,确定是哪个改动引起
    • 找内存:分析增大的内存是什么,根据增大的内容分析问题出在哪。
  • 如果使用方法1,编译一次代码需要15分钟,假设问题是某一行代码引起的,估计需要找一天。如果是某多行代码组合影响的问题,时间会更长。而且就算找到代码,也未必知道原理是什么。
  • 所以我选择方法2,不行再退到方法1

分析步骤:

  • 我在run的时候发现:

    • 812初次打开代码内存1G以内,编译运行时内存2G,关闭Xcode后再打开内存2G
    • 816初次打开代码内存1G以内,编译运行时内存6G,关闭Xcode后再打开内存6G

关闭Xcode后再打开,此时Xcode并没有run,所以推测他在做一件事:读缓存

缓存文件:

  • 大家都知道,Xcode编译一个新工程会很慢,但是第二次编译就很快。那是因为他把编译结果存到了缓存文件中。第二次编译只读文件不编译自然就快了。
  • 缓存文件存储在“/Users/你的用户名/Library/Developer/Xcode/DerivedData”目录下
  • 812和816版本的缓存文件对比如下:


image

  • 初步可以看出,缓存文件数量一致,但是大小差距很大。所以下一步就是来找茬:到底谁变大了
  • 经过一番寻找,发现每个类会生成三个文件:

    • .o文件:二进制对象文件,不多说
    • .d文件:文本文件,记录该类依赖的所有文件路径
    • .dia文件:未知二进制文件,但是变大的就是它
  • .dia是有一部分变大了,一部分没变。尝试用二进制工具打开读了一下,有惊喜:


image

  • 这不就是warning嘛

我的吐槽又来了:

  • 是谁!站出来!写了4个G的warning!

继续分析:

那具体是什么导致的warning呢,面对几千个.dia文件,我内心是崩溃的。

  • 幸好找基友沟通,刚好他做了代码warning扫描,发现816比812只是某组代码多了107个warning,其他组没变化,而且是nonnull相关warning,并不重要所以没追究。
  • 我们找到107处warning的代码,查看提交记录,就是在大家反馈卡顿之前。貌似就是它了。我们把warning解了,clean重新编译,问题得解。

问题虽解,但是遗留2个问题:

  1. 怎么就提交了107个warning?
  2. 区区107个warning。为啥会导致内存飙升?我们还剩几百个warning为啥没问题?

问题1:

  • 引发107个warning的只有一行代码
  • 对于nonnull相关warning苹果的潜规则是这样的:

    • 自Xcode6起提供的新功能,可以申明一个函数的参数是必传的(nonnull)还是可选的(nullable) ,这会让代码更严谨,我们是推荐使用的
    • 兼容老代码:整个头文件都没有nonnull/nullable申明的,编译没毛病
    • 对新代码高要求:只要给代码中添加了一个nonnull/nullable,剩余的代码也必须添加,否则其他每个接口就会有warning
  • 所以,这次涉案的代码是个旧工具类,有107个函数。新增的一行代码添加了nonnull。于是产生了107个warning


image


问题2:

举个例子,有A B C三个类

  • A.h有一个warning,其.dia文件中会如下信息:

    • insert '_Nullable' if the pointer may be null
    • insert '_Nonnull' if the pointer should never be null

      • A.m文件绝对路径
      • A.h文件绝对路径
      • A.m文件第几行引用了A.h,存在warning
      • warning在A.h的位置
      • warning描述是:pointer is missing a nullability type specifier (_Nonnull, _Nullable, or _Null_unspecified)
      • fix的两种方法:
  • 总之,一处warning的信息大约是1k
  • 如果B引用了A,则B的.dia文件包含如上所有信息,以及多个B的文件路径,即B的描述信息超过A
  • 如果C引用了B,而B在头文件中引用了A,则C的描述信息超过B

所以

  • 在工程上,107warning的文件,dia约130k。
  • 所有直接间接引用的文件数量大概2500,单个文件都超过130k。文件大小约350M。
  • 加上模拟器有2个cpu架构(i386/x86_64),会生成2份文件,缓存中还有个聚合的dgph文件。以及文件在内存中结构化后占用的内存空间。
  • 所以最终翻了几倍,达到4G的内存占用是可以理解的。

结论:

  • 不要忽略warning,特别是头文件中的warning,会被多处引用导致过大的描述信息
  • 头文件中尽量不要import头文件,会造成过度的引用,放大问题。

后续:

  • 818版本已经fix了core中的所有nonnull问题。后续逐步将warning清零
  • fix后内存占用如图


image

PS:这是苹果的bug么?我觉得还是自己挖坑把自己埋了。

遇到棘手的bug,你的解决思路是什么呢?欢迎在评论区留言,一起交流学习。

来源:阿里技术
原文链接

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
阿里云服务器怎么设置密码?怎么停机?怎么重启服务器?
如果在创建实例时没有设置密码,或者密码丢失,您可以在控制台上重新设置实例的登录密码。本文仅描述如何在 ECS 管理控制台上修改实例登录密码。
9498 0
windows server 2008阿里云ECS服务器安全设置
最近我们Sinesafe安全公司在为客户使用阿里云ecs服务器做安全的过程中,发现服务器基础安全性都没有做。为了为站长们提供更加有效的安全基础解决方案,我们Sinesafe将对阿里云服务器win2008 系统进行基础安全部署实战过程! 比较重要的几部分 1.
9055 0
阿里云服务器如何登录?阿里云服务器的三种登录方法
购买阿里云ECS云服务器后如何登录?场景不同,阿里云优惠总结大概有三种登录方式: 登录到ECS云服务器控制台 在ECS云服务器控制台用户可以更改密码、更换系.
13186 0
如何设置阿里云服务器安全组?阿里云安全组规则详细解说
阿里云安全组设置详细图文教程(收藏起来) 阿里云服务器安全组设置规则分享,阿里云服务器安全组如何放行端口设置教程。阿里云会要求客户设置安全组,如果不设置,阿里云会指定默认的安全组。那么,这个安全组是什么呢?顾名思义,就是为了服务器安全设置的。安全组其实就是一个虚拟的防火墙,可以让用户从端口、IP的维度来筛选对应服务器的访问者,从而形成一个云上的安全域。
7386 0
阿里云服务器ECS登录用户名是什么?系统不同默认账号也不同
阿里云服务器Windows系统默认用户名administrator,Linux镜像服务器用户名root
4014 0
阿里云服务器如何登录?阿里云服务器的三种登录方法
购买阿里云ECS云服务器后如何登录?场景不同,云吞铺子总结大概有三种登录方式: 登录到ECS云服务器控制台 在ECS云服务器控制台用户可以更改密码、更换系统盘、创建快照、配置安全组等操作如何登录ECS云服务器控制台? 1、先登录到阿里云ECS服务器控制台 2、点击顶部的“控制台” 3、通过左侧栏,切换到“云服务器ECS”即可,如下图所示 通过ECS控制台的远程连接来登录到云服务器 阿里云ECS云服务器自带远程连接功能,使用该功能可以登录到云服务器,简单且方便,如下图:点击“远程连接”,第一次连接会自动生成6位数字密码,输入密码即可登录到云服务器上。
21913 0
阿里云ECS云服务器初始化设置教程方法
阿里云ECS云服务器初始化是指将云服务器系统恢复到最初状态的过程,阿里云的服务器初始化是通过更换系统盘来实现的,是免费的,阿里云百科网分享服务器初始化教程: 服务器初始化教程方法 本文的服务器初始化是指将ECS云服务器系统恢复到最初状态,服务器中的数据也会被清空,所以初始化之前一定要先备份好。
6895 0
+关注
技术小能手
云栖运营小编~
7208
文章
9
问答
来源圈子
更多
+ 订阅
文章排行榜
最热
最新
相关电子书
更多
《2021云上架构与运维峰会演讲合集》
立即下载
《零基础CSS入门教程》
立即下载
《零基础HTML入门教程》
立即下载