《深入解析sas:数据处理、分析优化与商业应用》一1.4 SAS文件和逻辑库

本文涉及的产品
全局流量管理 GTM,标准版 1个月
公共DNS(含HTTPDNS解析),每月1000万次HTTP解析
云解析 DNS,旗舰版 1个月
简介:

本节书摘来自华章出版社《深入解析sas:数据处理、分析优化与商业应用》一书中的第1章,第1.4节,作者 夏坤庄 徐唯 潘红莲 林建伟,更多章节内容可以访问云栖社区“华章计算机”公众号查看

1.4 SAS文件和逻辑库

在熟悉了SAS窗口环境后,接下来了解一下SAS文件和SAS管理文件的方式。SAS文件是指由SAS创建、维护和管理,并且SAS知道其结构的文件,例如SAS数据集、目录(Catalog)等。通常这些文件也表现为操作环境中的文件,操作环境也会对它们进行管理。所有的SAS文件都存在于SAS逻辑库中。SAS逻辑库用于组织、查找和管理SAS文件。在SAS中,通过该文件所在逻辑库及文件名来使用SAS文件。
SAS数据集由SAS创建和管理,是SAS存储和处理数据的主要方式。根据其文件是否包含数据值分为SAS数据文件和SAS视图。SAS数据文件和SAS视图可以简单理解为与我们经常使用的数据库管理系统中的表和视图。关于SAS逻辑库和数据集将在第2章进行更详细的讲解。
SAS目录(Catalog)是一种特殊的SAS文件,以目录项的形式存储多种不同类型信息。一个SAS目录可包含多种类型的目录项,这些目录项包含系统信息(例如功能键定义)和应用程序信息(例如窗口定义、帮助窗口、格式(Format)、读入格式(Informat)、宏(Macro)或图形输出)。
下面通过“SAS资源管理器”窗口浏览SAS逻辑库及SAS文件。启动SAS窗口环境,在“SAS资源管理器”窗口双击“逻辑库”sashelp。如图1.5所示的界面给出了当前环境下SAS系统中的逻辑库:Maps、Mapsfgk、Mapssas、Sashelp、Sasuser和Work。逻辑库Sashelp中的SAS文件如图1.6所示,图标为数据集,图标为SAS目录。SAS目录还可打开显示更小的单元目录项。
      
image

SAS除了可以处理SAS文件外,还可以处理外部文件和数据库管理系统(Database Management System,DBMS)文件。SAS处理的外部文件指由操作系统管理和维护的数据或文本文件。外部文件通常用于存储SAS需要处理的原始数据、SAS程序语句和过程运行结果(HTML,PDF格式)等,SAS有时也会将一些结果写入外部文件。同时,SAS还可以通过特定的SAS/ACCESS接口软件从其他厂商的软件系统(例如数据库管理系统(DBMS))文件中读取和写入数据。通过SAS/ACCESS接口软件建立到DBMS的SAS逻辑库后,SAS软件可以像访问SAS数据集一样访问DBMS中的表。

相关文章
|
9天前
|
SQL 关系型数据库 MySQL
深入解析MySQL的EXPLAIN:指标详解与索引优化
MySQL 中的 `EXPLAIN` 语句用于分析和优化 SQL 查询,帮助你了解查询优化器的执行计划。本文详细介绍了 `EXPLAIN` 输出的各项指标,如 `id`、`select_type`、`table`、`type`、`key` 等,并提供了如何利用这些指标优化索引结构和 SQL 语句的具体方法。通过实战案例,展示了如何通过创建合适索引和调整查询语句来提升查询性能。
76 9
|
10天前
|
机器学习/深度学习 人工智能 自然语言处理
AI技术深度解析:从基础到应用的全面介绍
人工智能(AI)技术的迅猛发展,正在深刻改变着我们的生活和工作方式。从自然语言处理(NLP)到机器学习,从神经网络到大型语言模型(LLM),AI技术的每一次进步都带来了前所未有的机遇和挑战。本文将从背景、历史、业务场景、Python代码示例、流程图以及如何上手等多个方面,对AI技术中的关键组件进行深度解析,为读者呈现一个全面而深入的AI技术世界。
67 10
|
23天前
|
机器学习/深度学习 人工智能 PyTorch
Transformer模型变长序列优化:解析PyTorch上的FlashAttention2与xFormers
本文探讨了Transformer模型中变长输入序列的优化策略,旨在解决深度学习中常见的计算效率问题。文章首先介绍了批处理变长输入的技术挑战,特别是填充方法导致的资源浪费。随后,提出了多种优化技术,包括动态填充、PyTorch NestedTensors、FlashAttention2和XFormers的memory_efficient_attention。这些技术通过减少冗余计算、优化内存管理和改进计算模式,显著提升了模型的性能。实验结果显示,使用FlashAttention2和无填充策略的组合可以将步骤时间减少至323毫秒,相比未优化版本提升了约2.5倍。
42 3
Transformer模型变长序列优化:解析PyTorch上的FlashAttention2与xFormers
|
20天前
|
前端开发 UED
React 文本区域组件 Textarea:深入解析与优化
本文介绍了 React 中 Textarea 组件的基础用法、常见问题及优化方法,包括状态绑定、初始值设置、样式自定义、性能优化和跨浏览器兼容性处理,并提供了代码案例。
48 8
|
26天前
|
测试技术 开发者 Python
使用Python解析和分析源代码
本文介绍了如何使用Python的`ast`模块解析和分析Python源代码,包括安装准备、解析源代码、分析抽象语法树(AST)等步骤,展示了通过自定义`NodeVisitor`类遍历AST并提取信息的方法,为代码质量提升和自动化工具开发提供基础。
43 8
|
21天前
|
机器学习/深度学习 搜索推荐 API
淘宝/天猫按图搜索(拍立淘)API的深度解析与应用实践
在数字化时代,电商行业迅速发展,个性化、便捷性和高效性成为消费者新需求。淘宝/天猫推出的拍立淘API,利用图像识别技术,提供精准的购物搜索体验。本文深入探讨其原理、优势、应用场景及实现方法,助力电商技术和用户体验提升。
|
26天前
|
缓存 NoSQL Java
千万级电商线上无阻塞双buffer缓冲优化ID生成机制深度解析
【11月更文挑战第30天】在千万级电商系统中,ID生成机制是核心基础设施之一。一个高效、可靠的ID生成系统对于保障系统的稳定性和性能至关重要。本文将深入探讨一种在千万级电商线上广泛应用的ID生成机制——无阻塞双buffer缓冲优化方案。本文从概述、功能点、背景、业务点、底层原理等多个维度进行解析,并通过Java语言实现多个示例,指出各自实践的优缺点。希望给需要的同学提供一些参考。
45 7
|
24天前
|
调度 开发者
核心概念解析:进程与线程的对比分析
在操作系统和计算机编程领域,进程和线程是两个基本而核心的概念。它们是程序执行和资源管理的基础,但它们之间存在显著的差异。本文将深入探讨进程与线程的区别,并分析它们在现代软件开发中的应用和重要性。
44 4
|
23天前
|
存储 监控 算法
Java虚拟机(JVM)垃圾回收机制深度解析与优化策略####
本文旨在深入探讨Java虚拟机(JVM)的垃圾回收机制,揭示其工作原理、常见算法及参数调优方法。通过剖析垃圾回收的生命周期、内存区域划分以及GC日志分析,为开发者提供一套实用的JVM垃圾回收优化指南,助力提升Java应用的性能与稳定性。 ####
|
27天前
|
缓存 并行计算 Linux
深入解析Linux操作系统的内核优化策略
本文旨在探讨Linux操作系统内核的优化策略,包括内核参数调整、内存管理、CPU调度以及文件系统性能提升等方面。通过对这些关键领域的分析,我们可以理解如何有效地提高Linux系统的性能和稳定性,从而为用户提供更加流畅和高效的计算体验。
30 2

热门文章

最新文章

推荐镜像

更多