带你读《SAS数据分析开发之道 软件质量的维度》第一章概览1.1引言(六)

简介: 带你读《SAS数据分析开发之道 软件质量的维度》第一章概览1.1引言

风险


从软件开发角度来讲,基本的风险包括软件功能性故障和性能故障。例如,一个   无恶意的威胁(如大数据)会利用软件的漏洞如一个潜在的错误,当遇到大数据时,该错误能限制有效范围,给商业价值带来风险(无效性能或功能性故障这些术语的定义在下面的威胁、漏洞及风险文本框中。尽管项目管理知识体系PMBOK)及其他资料将正面的风险看作机会,但本书只讨论负面的风险。

威胁、漏洞及风险

威胁 “可能会为一个或多个项目目标带来负面影响的风险。”“系统或系统环境的一种状态,该状态会从一个或多个已知的风险维度造成不利影响。”漏洞“信息系统、密码系统或部件(如系统安全程序、硬件设计、内部控制)存在的缺点,这些缺点可能会被其他程序利用。”风险 “一种未知的事件或情况,一旦发生,就会对一个或多个项目目标造成正面或负面的影响。”“系统组件、运算符、用户及环境中,非常态事件或故障发生的可能性与该事件或故障产生后果的组合。”故障

故障

软件故障通常是由利用漏洞的威胁引起的,但并不是所有的威胁和漏洞都会导致软件故障。错误(人为错误)可能会隐藏在代码中,开发人员可能会也可能不会发现这些漏洞。隐含的漏洞包括编码错误(缺陷,这些错误还不会导致故障,而已知的漏洞所包含的编码错误(潜在缺陷)则已经被识别,但尚待解决。第 4章将深入探究并区分这些术语。

例如,下面的 SAS代码在文献中通常看作是一种决定数据集中观测数据量的方法 :

procsqlnoprint;selectcount(*)into:obstotfromtemp;

quit;

 

该代码对观测数据少于 1亿的数据集有效,但由于这个阈值是交叉的,所以&OBSTOT会在数字记数法和科学记数法之间变化。例如,含有 1000万个观测数据的数据集会被表示为10000000,而含有 1亿个观测数据的数据集则被表示为 1E8

(1×108。对于运行此代码的SAS从业人员来讲,若要查看日志中观测数据的数量,这一差异不会有什么问题。然而,若后续的程序试图评价或比较    &OBSTOT,且被价的数据是在科学记数法模式下,则会出现运行错误,错误代码如下 :

%letobstot=1E8;

%if&obstot<5000000%then%putLESSTHAN5MILLION;

%else%putGREATERTHAN5MILLION;

 

LESSTHAN5MILLION

 

很显然,1亿并不小于 500万,但由于有两个潜在的错误,所以代码会存在漏洞,而改正其中一个错误就可消除漏洞,改变 &OBSTOT的赋值,添加一个能容纳更大数据的格式就可消除第一个错误,如使用 FORMAT指令进行演示。通过在

%SYSEVALF宏函数中添加数值比较就可消除第二个错误,这样会将 1E8解释为数字,而不是文本。我们对两种解决方案都进行了演示,而且改正任何一处错误都会消除漏    洞,防止故障的发生。

procsqlnoprint;

selectcount(*)format=15.0into:obstot

fromtemp;


quit;

 

%if%sysevalf(&obstot<5000000)%then%putLESSTHAN5MILLION;

%else%putGREATERTHAN5MILLION;

 

GREATERTHAN5MILLION

 

因为故障只发生在观测数据增加时,所以可以称作可扩展性错误。SAS从业人员没有预料到(并测试)遇到大型数据集时会出现什么状况。但如果 1 亿个观测数据阈

值不交叉,即便存在错误,代码也会继续运行,而不会出现故障。我们将在第 9扩展性“SAS 应用阈值部分深入讨论这种错误类型。

开发人员经常会有意地在软件中添加漏洞,例如,一个熟悉前述软件漏洞(被大    数据漏动利用的开发人员在设计能够处理含有小于1 万个观测数据的数据集软件时,可能会选择忽略软件中的这一错误。因为风险可忽略不计,因此,可以接受并如期发    布含有漏洞的软件。在其他情况下,威胁可能会带来较大的风险,但这些风险也会被    接受,因为消除或降低风险所花费的成本要远高于从中获得的好处。

未被利用的漏洞不会降低软件的可靠性,因为不会发生任何故障。例如,上述的潜在漏洞永远不会被利用,因为不会遇到大数据。然而,漏洞确实会增加软件发生故障的风险,因此,开发人员应知道软件的具体风险是什么。在这个例子中,风险是由SQL   程序内大数据的意外处理引起的,如果漏洞被利用,造成运行时错误或其他故障,那么软件的可靠性就会降低。我们在下一部分要讲到的风险登记表能帮助SAS   从业人员记录已知漏洞、预期风险及初步解决方案,以更好地评估和管理软件产品的风险级别。






相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps&nbsp;
相关文章
|
4月前
|
机器学习/深度学习 数据挖掘 BI
推荐一款 Python 数据分析报告开发与分享神器
推荐一款 Python 数据分析报告开发与分享神器
|
4月前
|
机器学习/深度学习 数据采集 人工智能
Python可以应用于多个领域,如Web开发、数据分析、机器学习等
Python可以应用于多个领域,如Web开发、数据分析、机器学习等
|
8月前
|
数据挖掘
怎么理解数据分析、维度和指标?
怎么理解数据分析、维度和指标?
|
9月前
|
SQL 数据采集 数据可视化
数据开发模块中的SQL和数据分析模块中的SQL查询
数据开发模块中的SQL和数据分析模块中的SQL查询
151 1
|
9月前
|
机器学习/深度学习 人工智能 算法
Python编程入门基础及高级技能、Web开发、数据分析和机器学习与人工智能
Python编程入门基础及高级技能、Web开发、数据分析和机器学习与人工智能
132 0
|
11月前
|
机器学习/深度学习 人工智能 分布式计算
在多元宇宙中,SAS探索下一代数据分析的生产力
在多元宇宙中,SAS探索下一代数据分析的生产力
|
12月前
|
SQL 存储 数据挖掘
ChatGPT 数据仓库实战:Kaggle 酒店入住数据分析与维度建模
ChatGPT 数据仓库实战:Kaggle 酒店入住数据分析与维度建模
|
12月前
|
数据挖掘 索引 Python
python开发:空气质量历史数据分析(四)
python开发:空气质量历史数据分析(四)
python开发:空气质量历史数据分析(四)
|
12月前
|
数据挖掘 定位技术 Python
python开发:空气质量历史数据分析(三)
python开发:空气质量历史数据分析(三)
|
9天前
|
人工智能 数据可视化 数据挖掘
【python】Python航空公司客户价值数据分析(代码+论文)【独一无二】
【python】Python航空公司客户价值数据分析(代码+论文)【独一无二】