阿里十年总结之软件测试的价值

简介: 本文是作者十几年工作经验的总结,也对“软件测试的价值”做个探讨,希望有机会跟团队一起走出当前的周期。

前言


阿里集团1+6+N的组织变革后,各个业务单元都独立承担了经营压力。技术团队的规模更小、更敏捷,这对于原有一定规模的质量团队带来了较大的挑战。

最近拜读了很多集团测试大佬总结过往工作经验写下的文字。


我想,自己从事测试工作已经十几年,绝大部分工作历程是在阿里度过的,经历了测试团队的分分合合,见过山川大海,也走过土丘洼地。借此机会,也对“软件测试的价值”做个探讨,也希望有机会跟团队一起走出当前的周期。


质量是什么?


质量是一种奢侈品

以前跟同事聊天时说,一个创业团队是不需要测试的。包括太禅老师文章中关于“来往”的那段,也讲了同样的道理“我觉得在架构还没稳定下来,一切以业务为先的团队中,想发挥测试效能还是比较难的,测试提效离不开研发流程的规范和交付标准的提升,不然只能陷入到人海战术的汪洋大海中。”对于初创公司来说,最重要的是生存,是营收。而质量是大多数业务Break even后才需要追求的东西。


我们也发现,质量文化在工业时代就已经存在了,而且是伴随着第一天生产就存在的。对于工业生产来说,生产的品质决定着产品的良品率、成本等重要的经营指标。在软件工程的初期,质量同样也很重要。彼时的软件还是有点像工业品,以离线的方式来进行交付,严格而规范的过程,需要工程师一次性把质量做好,才能规避很多业务上的风险。


但到了互联网阶段,软件是以在线的方式来进行交付时,在大多数互联网产品的发展的初期阶段,往往是在不断试错的过程。这个阶段的目标是降低试错成本,从而更快的找到和满足用户痛点需求。对于用户规模DAU、业务增长GMV的诉求,远高于对质量的需求。因此,在业务发展的初期,质量成为了一种奢侈品。除非极其重视质量的互联网创业团队才会在这个阶段在质量上做大量的投入。


质量是产品的特性

但很多事情也不是绝对的,最近跟团队中音视频的测试TL沟通。她在音视频领域中工作了十几年,前十年在一家通信行业知名的外企,五年前跟随着原来的技术主管出去创业,一直做的是音视频产品,她还是负责质量工作。我问她,音视频技术在过去的这十几年中有什么本质的变化吗?其实核心的仍然是RTC这样的实时音视频通信技术,但原来的使用场景依赖于专业的终端设备,而这些年RTC更多的运用在如钉钉、Zoom等互联网产品中,用户使用的门槛更低了,但同时终端设备的复杂度更高了。我继续问,为什么在创业团队中还需要你这支质量团队呢?对于音视频产品来说,质量是一种产品特性,而且是最重要的一种特性。我们在使用一款音视频产品时,除了经过互联网改造后的创新功能,最基本的需求仍然是“音画质、卡顿率、清晰度”等指标。而这些指标恰恰都是质量上的指标。因此,对于这样一类的产品来说,质量是必须的,而且能够赋予产品很高的竞争力和壁垒。


摘取了一些关于行业中普遍认为头部的音视频产品的用户评价,绝大多数也印证了上述的判断。

Original comments
Z's audio is pretty great though. I don't know how they get around the latency issues. It seems impossible for musicians to be able to play together in real time from multiple places around the globe. Somehow Z pulls it off really well.
It's funny how people can hear people differently, though. After a couple of listens of the clips for the final verdict, I thought that the Teams audio sounded much better than the Webex. I do have some hearing loss in the upper registers, so that may somehow be affecting my perception of it since you said Teams sounded "tinny", but I guess it is a little subjective.
I think that in community work with less able, often low income, computer users I see that available bandwidth has a big effect on user experience. A future video look at reducing bandwidth and seeing who gives up on video or sound first could be helpful. Thanks
I was really impressed by Teams video superiority; given that and with the audio being all "pretty good" (IMHO),
I'd chose Teams. I also value Teams integration with the MS Office tools for easy of use. This was a missing component of the bake-off.
I work with Teams all day long and because of the interaction and collaboration with Microsoft apps it’s the best in my opinion.
But I believe Z is really friendly simplicity. Webex does the job
For our international organization, the stability, features, and ease of use determine the platform we use. In this regard, Z Meetings and Z Webinar outrank Webex. Teams is an application in a different category.


你的业务是否也具备如此特性呢?


质量的重要性取决于业务


这个阶段,阿里很多测试同学觉得,质量是不是突然不重要了?


我其实也有过这样的困惑,也跟一些行业中的朋友交流过业界的情况。答案是未必,比如某些大厂过去几年一直在做测试的拆分,但面临一定瓶颈后,也开始有些回调。某些大厂还处在业务的快速发展阶段,反而追求更为专业的质量能力,等。


其实,我在阿里工作的这些年也经历过分分合合,从金融到电商,再到现在。不同业务对于质量的诉求是很不一样的。这也体现在开发测试比上,从最开始的2:1的开发测试比到现在20:1,我都经历过,也挺神奇的。很多CTO会关注开发测试比,什么样的比例取决于业务特性,以及处在什么样的发展阶段。可能优秀的测试主管能够力挽狂澜,创造更多的可能。但从最高的业务视角来看岗位设置时,还是看这个岗位所创造的核心价值。


在不太变化的研发过程中,不同的开发测试比例背后,变化是质量活动的取舍。在20:1的团队和2:1的团队在质量上的取舍肯定是不一样的。如果在仅有的资源下,在集成测试阶段将灰度用到了极致。只有在更低的开发测试比例或更高的测试资源投入下,我们才会讲到质量的左移或者右移,才会讲到质量的全生命周期。

image.png

所以,同样的这张软件生命周期图,测试在里面如何开展工作,取决于你看它的方式。


测试能给业务带来什么?

在回答这个问题前,我们回归到测试工作本质上。测试的目的就是以最少的时间和人力找出软件中潜在的各种错误和缺陷,证明软件的功能和性能与需求说明相符。简单来说,测试是用最高效的手段来证伪。

image.png

前些年当算法在电商领域运用得炉火纯青的时候,我认为算法的不可解释性和结果的不可预测性是给测试这个行业带来的最大挑战。因为,这些构成了对测试最本质的“证伪”的颠覆。但没有想到,经营责任制和组织变革给这个专业带来的冲击更早一点。在经营责任制下,如果一个岗位只是用来证明自己生产的产品/技术/被测对象是错的,显然是无法立足的。任何一个岗位都需要思考所带来正向的商业价值。


为什么需要测试?

我们还是要回答这个问题,从业务的视角,我们为什么需要测试?当年,我第一次汇报给开发主管时就想过这个问题。今天翻了一下以前的总结,时过境迁似乎也能够适用。


  • 降低研发和售后成本。


我们假设如果完全没有测试的话,会带来什么?缺陷一定会存在于代码中,特别是模块间和系统间的N2N问题。如果没有测试人员,测试的工作仍然会存在,要么由开发同学来完成,要么由用户来测试。完全由开发来自测,大概率会降低项目开发的效率,同时由于工作思维方式的不一样,一定会有大量N2N的缺陷被遗留到线上,增加修复成本。如果有专业测试人员参与到研发活动中,无疑会提升整体的研发效率。而用户测试是互联网发展过程中的一种尝试,对于新功能的快速迭代上线和测试成本之间取得较好的平衡,但如果大量的依赖于此方法,会造成被灰度用户的大量投诉,从而提升售后成本。


(但坏消息是,有可能管理者要的是直接成本,没有耐心看到综合性效率。)


  • 取得业务/品牌价值的最大化。


上述章节提到,不同的业务对于质量的诉求是不一样的。比如金融行业,对于质量几乎是最苛刻的,如蚂蚁的故障体系中一直在执行一分钱的资损就是P1的标准。对于金融客户来说,无法接受存放着资金的系统是不安全,不可靠的,这也是一家金融公司的品牌。其次是决定着客户生产类的业务,如淘宝的交易系统、营销系统都承载着客户每天的业务生产过程,如果系统出现的错误,影响的可能是客户的营收。因此,这些公司和业务在早期阶段就会把质量要求提到较高的水平,随之而来的是需要有一个专职的测试团队来承载公司层面的目标。


(同样的坏消息是,质量不出问题你就很难看到这项价值,但出问题你估计也没机会看到这项价值。)


  • 合规的需求。


我们在互联网企业,可能很难去想象到测试跟合规还能有关系。但很多企业因为审计、评级等原因,是有合规的需求的。比如我们就经常收到企业客户提出需要我们提供标准的测试报告。

image.png


从质量保障到研发效能

测试团队在过去十多年的发展过程中,从质量保障不断往研发效能的方向拓展。我们做了很多测试工具、平台,解决研发效能中的各种问题,并证明自己能够产生正向的价值。但我们也存在一个问题,做的测试产品好像总是跟随着团队的调整而不断消失,没有足够多的沉淀,跟国外相比我们还是缺少一些优秀的测试框架、工具、产品。


测试团队如何去突破

前两年还写过这样一段文字。

什么样情况下一个团队会消亡?一种是被技术变革的洪流滚滚碾过。随着技术的发展,可能这个团队、这个岗位已经没有存在的价值了。而软件质量团队虽然经过分分合合,但我觉得至少到今天为止,仍然在发挥着很大的价值。甚至通过内建质量/SRE迸发出更大的生命力。

但没有想到今天在阿里对于测试的冲击会如此之大。虽然谈不上消亡,但足以打击很多测试开发工程师的信心。


从横向发展到纵向突破

作为职能团队,能力的横向复制是最恰当的事情。但1+6+N背后是组织更小更敏捷,测试团队的组成单位也会更小,有可能只是几个人的规模。疲于完成业务测试,很难通过(路径二)在有规模的测试部门中横向输出自己的工具、能力来获得价值和认可。转而需要(路径一)寻求个人/团队能力边界的拓展,或者更深入的掌握业务来提升自己的职业壁垒。


image.png

当初在1688的时候,有机会以质量、SRE、PMO三位一体开展工作。以前总觉得是自己的能力,其实更多还是来自于技术发展的机会。


把质量当成一个业务

在面临着业务价值的挑战,特别是当经营责任进一步往二、三级部门压实的情况下,测试所承受的压力也很大。我们需要把质量当成一种业务,逼迫自己去思考去不断探索和深化质量能够给业务带来的直接帮助。


面对变化,质量的工作可以分为三部分:


  • 业务质量是我们的基础,只有业务能够认可我们的价值,我们才有可能活下来。
  • 做好业务质量只是完成了最最基本的工作,除此之外,我们仍然需要沉淀出通用的质量能力,要有更专业的软件工程视角来解决整个技术部的问题。
  • 除此之外,体验是更维度的质量,我们希望通过体验的NPS来链接质量和业务。


image.png

NPS的提升有一定的专业性,本文不详细展开。


围绕着测试专业做创新

在更专业的软件工程能力方面,我们也在做一些探索。


  • 找到测试能力能够服务于客户的机会点。我们会从一些小的客户诉求开始,如上文提到的测试报告,未来我们希望可以提供更多深度的产品工具。
  • 如何将各种前沿的技术如大模型应用在测试领域,让测试更加唾手可及。

例:通过大模型去自动生成自动化脚本,让自动化测试更加唾手可及。

image.png

质量可能成为一种先进的工作模式吗?

忘了很久以前,看的是文章还是书籍,里面介绍的是日本在工业化中的崛起,靠的是质量文化。很多词,例如持续改善Kaizen、防呆Pokayoka这种古怪的日语发音,都直接被吸收成为英语单词。虽如前面所说,不同的业务特性对质量的要求不一样。互联网时代的产品可能拼的是创新,对商业需求的洞察。但会不会有一天,互联网技术也像工业技术一样的时候,质量也会成为某一家公司某一个行业可以用来突破的路线时,那时质量一定能够成为皇冠上的那颗明珠。                            


作者 | 傲野

来源 | 阿里云开发者公众号

相关文章
|
3天前
|
人工智能 搜索推荐 Serverless
使用金庸的著作,来测试阿里通义千问最新开放的长文档处理功能
使用金庸的著作,来测试阿里通义千问最新开放的长文档处理功能
95 7
使用金庸的著作,来测试阿里通义千问最新开放的长文档处理功能
|
3天前
|
缓存 运维 容灾
入行5年,谈谈我在阿里做测试开发的经验
作者在阿里一直从事测试开发相关工作,这几年学习很多、收获很多,作者希望给还在该方向摸爬滚打的同学一些启发和方向。
127 1
|
3天前
|
监控 测试技术 API
价值驱动测试尝试
价值驱动测试尝试
16 0
|
3天前
|
运维 负载均衡 网络协议
函数计算FC报错问题之测试报错如何解决
函数计算(Function Compute,FC)是一个事件驱动的全托管计算服务,允许用户编写并上传代码,而无需管理服务器运行和维护;在使用过程中,可能会遇到各种报错,本合集聚焦于函数计算FC常见的报错问题,提供一系列的故障排查指导和解决建议,帮助用户优化云端函数执行
75 2
|
3天前
|
测试技术 API Apache
5个关键问题让单元测试的价值最大化
本文讨论的单元测试策略来自于实践中遇到的真实问题,作者总结出了5个关键策略问题并给出了解决之道。
|
3天前
|
存储 SQL 测试技术
通过降本增效,提升测试价值
通过降本增效,提升测试价值
37 0
|
3天前
|
缓存 运维 测试技术
如何让测试用例更有价值
如何让测试用例更有价值
22 0
|
3天前
|
测试技术 持续交付 UED
软件测试的价值
软件测试的价值
|
3天前
|
Kubernetes 架构师 测试技术
软件测试|测试专家(前阿里P8)聊测试职业发展常见瓶颈
软件测试|测试专家(前阿里P8)聊测试职业发展常见瓶颈
60 0
|
8月前
|
机器学习/深度学习 人工智能 自然语言处理
牛刀小试:我用自创的测试集参加了阿里中文竞技场双模型评测
8月我自己创建了一个包含320个问题的大语言模型测试集,刚好阿里魔搭社区正在举办中文模型评测活动,本着对这些模型效果的好奇,刚好手里也有“验丹指南”,所以就抽时间来玩一把模型测试。

热门文章

最新文章