《深入解析sas:数据处理、分析优化与商业应用》一1.1 SAS系统简介

本文涉及的产品
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
全局流量管理 GTM,标准版 1个月
云解析 DNS,旗舰版 1个月
简介:

本节书摘来自华章出版社《深入解析sas:数据处理、分析优化与商业应用》一书中的第1章,第1.1节,作者 夏坤庄 徐唯 潘红莲 林建伟,更多章节内容可以访问云栖社区“华章计算机”公众号查看

1.1 SAS系统简介

SAS提供了一套集成的可扩展的解决方案和使用灵活、功能强大的SAS编程语言,用于执行如下任务:数据输入和获取、数据转换处理和管理、报表绘制和图形、统计和数学分析、商业规划、预测、运筹优化,以及应用开发等。
SAS可以在多种操作系统下运行,包括Windows、UNIX、Linux以及Mainframe等。同时,SAS程序代码具有很好的移植性,在一种环境下开发的SAS代码可以在其他操作系统下运行。
SAS系统的核心Base SAS由以下部分组成。
DATA步:用于处理和管理数据。
SAS过程(Procedure):用于分析、处理和制作报表。
可扩展和定制SAS软件程序的宏语言(Macro Facility):可以减少程序文本,使SAS程序编写得更有效且易于维护,便于编写更为复杂的程序逻辑。
DATA步调试器:当提交的DATA步运行出错或产生的输出结果与预期不一致时,可以借助它来跟踪DATA步的执行情况,从而帮助发现程序逻辑中的错误。
输出交付系统(Output Delivery System,ODS):该系统会产生各种易于访问的格式输出,例如,HTML文件、传统的列表输出、PostScript文件、RTF文件和输出数据集等。
SAS窗口环境:它是一个开发和测试SAS程序的交互式图形用户界面,本节后面会有更进一步的介绍。
这其中,前面3个是SAS语言的主要元素,本篇后面的章节会专门介绍。
Base SAS软件提供数据处理过程和基础的统计过程FREQ、MEAN、CORR及UNIVARIATE等,可以与其他的SAS产品一起使用,从而实现更强大的数据读取、分析、优化、展示等功能。下面列出了部分常用的SAS产品,用于实现数据读取、统计分析、优化和信息展示等功能。
(1)SAS/ACCESS接口
提供与各种第三方数据源进行交互的功能。例如各种关系型数据库,诸如Oracle、DB2、Teradata等;ERP系统诸如SAP R/3、PeopleSoft等;同样对于Hadoop等也有专门的ACCESS接口。对于不同的数据源,ACCESS接口需要单独的软件使用许可。SAS与第三方的数据源进行交互时,将直接调用该数据库或应用厂商提供的客户端对数据进行访问,从而保证了与数据访问的效率。此外,SAS/ACCESS还提供接口访问Microsoft Access数据库文件和Excel工作簿文件中的数据。
(2)SAS/GRAPH
SAS/GRAPH是SAS系统的数据可视化和展现(图形)组件,用于数据和信息展现,并且它可通过二维和三维图形(包括图表、散点图和地图),可视化地展现数据值之间的关系。还可创建文本幻灯片、生成各种图形输出,并可提供实用程序和管理输出。
(3)SAS/STAT
SAS/STAT软件提供了全面的统计分析方法,共有超过75个统计分析过程,包括T检验、方差分析(ANOVA过程)、聚类分析(CLUSTER过程、VARCLUSTER和FASTCLUS过程)、因子分析(FACTOR过程)、回归分析(REG过程)、逻辑斯蒂(LOGISTIC过程)等。SAS/STAT软件还包括效能和样品容量分析(PSS)应用程序。该软件不断被更新,以反映新的研究成果和方法。
(4)SAS/ETS
提供用于经济计量分析、时间序列分析和预测(ESM过程、ARIMA过程和UCM过程等)、系统建模与仿真(MODEL过程)、离散选择分析、定性有限因变量模型分析、时间序列数据的季节性调整、财务分析和报告、访问经济和金融数据库及时间序列数据的管理。除了以上过程外,SAS/ETS软件还包括对经济和金融数据库以及互动环境的无缝访问,从而进行时间序列预测及投资分析。
(5)SAS/OR
SAS/OR专注于运筹与优化。SAS/OR提供的OPTMODEL建模语言用于构建、解决和维护最优化模型的建模环境,通过OPTMODEL过程的各种求解器或单个过程,例如OPTLP、OPTMILP、OPTMILP过程,解决线性规划、混合整数规划、非线性规划等问题。
以Base SAS软件和以上产品与技术作为基础,构建在SAS智能平台(SAS Intelligence Platform)上的SAS许多商业解决方案,可以帮助各类商业客户和其他组织机构解决诸多业务领域的特定问题,例如客户智能、风险管理、供应链、零售等。关于SAS商业解决方案的内容,在本书的第四篇会有相应的介绍。

相关文章
|
9天前
|
SQL 关系型数据库 MySQL
深入解析MySQL的EXPLAIN:指标详解与索引优化
MySQL 中的 `EXPLAIN` 语句用于分析和优化 SQL 查询,帮助你了解查询优化器的执行计划。本文详细介绍了 `EXPLAIN` 输出的各项指标,如 `id`、`select_type`、`table`、`type`、`key` 等,并提供了如何利用这些指标优化索引结构和 SQL 语句的具体方法。通过实战案例,展示了如何通过创建合适索引和调整查询语句来提升查询性能。
76 9
|
10天前
|
机器学习/深度学习 人工智能 自然语言处理
AI技术深度解析:从基础到应用的全面介绍
人工智能(AI)技术的迅猛发展,正在深刻改变着我们的生活和工作方式。从自然语言处理(NLP)到机器学习,从神经网络到大型语言模型(LLM),AI技术的每一次进步都带来了前所未有的机遇和挑战。本文将从背景、历史、业务场景、Python代码示例、流程图以及如何上手等多个方面,对AI技术中的关键组件进行深度解析,为读者呈现一个全面而深入的AI技术世界。
67 10
|
23天前
|
机器学习/深度学习 人工智能 PyTorch
Transformer模型变长序列优化:解析PyTorch上的FlashAttention2与xFormers
本文探讨了Transformer模型中变长输入序列的优化策略,旨在解决深度学习中常见的计算效率问题。文章首先介绍了批处理变长输入的技术挑战,特别是填充方法导致的资源浪费。随后,提出了多种优化技术,包括动态填充、PyTorch NestedTensors、FlashAttention2和XFormers的memory_efficient_attention。这些技术通过减少冗余计算、优化内存管理和改进计算模式,显著提升了模型的性能。实验结果显示,使用FlashAttention2和无填充策略的组合可以将步骤时间减少至323毫秒,相比未优化版本提升了约2.5倍。
42 3
Transformer模型变长序列优化:解析PyTorch上的FlashAttention2与xFormers
|
20天前
|
前端开发 UED
React 文本区域组件 Textarea:深入解析与优化
本文介绍了 React 中 Textarea 组件的基础用法、常见问题及优化方法,包括状态绑定、初始值设置、样式自定义、性能优化和跨浏览器兼容性处理,并提供了代码案例。
48 8
|
20天前
|
安全 前端开发 Android开发
探索移动应用与系统:从开发到操作系统的深度解析
在数字化时代的浪潮中,移动应用和操作系统成为了我们日常生活的重要组成部分。本文将深入探讨移动应用的开发流程、关键技术和最佳实践,同时分析移动操作系统的核心功能、架构和安全性。通过实际案例和代码示例,我们将揭示如何构建高效、安全且用户友好的移动应用,并理解不同操作系统之间的差异及其对应用开发的影响。无论你是开发者还是对移动技术感兴趣的读者,这篇文章都将为你提供宝贵的见解和知识。
|
26天前
|
测试技术 开发者 Python
使用Python解析和分析源代码
本文介绍了如何使用Python的`ast`模块解析和分析Python源代码,包括安装准备、解析源代码、分析抽象语法树(AST)等步骤,展示了通过自定义`NodeVisitor`类遍历AST并提取信息的方法,为代码质量提升和自动化工具开发提供基础。
43 8
|
21天前
|
机器学习/深度学习 搜索推荐 API
淘宝/天猫按图搜索(拍立淘)API的深度解析与应用实践
在数字化时代,电商行业迅速发展,个性化、便捷性和高效性成为消费者新需求。淘宝/天猫推出的拍立淘API,利用图像识别技术,提供精准的购物搜索体验。本文深入探讨其原理、优势、应用场景及实现方法,助力电商技术和用户体验提升。
|
26天前
|
缓存 NoSQL Java
千万级电商线上无阻塞双buffer缓冲优化ID生成机制深度解析
【11月更文挑战第30天】在千万级电商系统中,ID生成机制是核心基础设施之一。一个高效、可靠的ID生成系统对于保障系统的稳定性和性能至关重要。本文将深入探讨一种在千万级电商线上广泛应用的ID生成机制——无阻塞双buffer缓冲优化方案。本文从概述、功能点、背景、业务点、底层原理等多个维度进行解析,并通过Java语言实现多个示例,指出各自实践的优缺点。希望给需要的同学提供一些参考。
45 7
|
24天前
|
调度 开发者
核心概念解析:进程与线程的对比分析
在操作系统和计算机编程领域,进程和线程是两个基本而核心的概念。它们是程序执行和资源管理的基础,但它们之间存在显著的差异。本文将深入探讨进程与线程的区别,并分析它们在现代软件开发中的应用和重要性。
44 4
|
23天前
|
存储 监控 算法
Java虚拟机(JVM)垃圾回收机制深度解析与优化策略####
本文旨在深入探讨Java虚拟机(JVM)的垃圾回收机制,揭示其工作原理、常见算法及参数调优方法。通过剖析垃圾回收的生命周期、内存区域划分以及GC日志分析,为开发者提供一套实用的JVM垃圾回收优化指南,助力提升Java应用的性能与稳定性。 ####

热门文章

最新文章

推荐镜像

更多