SAS学习笔记之《SAS编程与数据挖掘商业案例》(1)系统简介和编程基础-阿里云开发者社区

开发者社区> 王小雷> 正文

SAS学习笔记之《SAS编程与数据挖掘商业案例》(1)系统简介和编程基础

简介: SAS学习笔记之《SAS编程与数据挖掘商业案例》(1)系统简介和编程基础 1. SAS系统简介 1.1 SAS是先编译后执行的语言,data步标志着编译的开始。 数据指针:当前内存缓存区,输入数据所在位置。 PDV:Program Data Vector,在DATA步中所有涉及的变量被编程当前向量的一部分。 2. SAS编程基础 2.1 SAS逻
+关注继续查看

SAS学习笔记之《SAS编程与数据挖掘商业案例》(1)系统简介和编程基础

1. SAS系统简介

1.1 SAS是先编译后执行的语言,data步标志着编译的开始。
    数据指针:当前内存缓存区,输入数据所在位置。
    PDV:Program Data Vector,在DATA步中所有涉及的变量被编程当前向量的一部分。

2. SAS编程基础

2.1 SAS逻辑库
                            SAS逻辑库
                    |           |       |
            SAS数据集      SAS目录       其他SAS文件
            |       |
    SAS数据文件  SAS数据视图
2.2 创建逻辑库 libname lb'F:\Data_Model\Bookdata\chapt2';
    删除逻辑库 libname lb clear;
    SAS数据集命名规则:由英文字母、下划线、数字组成且最多不超过32个字符。
    创建永久SAS数据集名为forever
        libname fv 'F:\Data_Model\Book_data\chap2';
        data fv.forever;
        Input x y z;
        Cards;
        1 2 3
        3 4 5
        ;
        run;
    创建临时数据集名为temp
        data temp;
        Input x y z;
        Cards;
        1 2 3
        4 5 6
        ;
        run;
2.3 SAS数据集结构
    一个SAS数据集是数据值和数据集信息的集合。
    数据值:由观测加变量组成,行为观测列为变量;数据集信息:包含该数据集名字、创建时间、在逻辑库中的成员类型等。
2.4 SAS索引
    SAS索引存储SAS数据集中一些变量的值和与该值对应的观测进行直接定位的指针系统。
    创建索引:
    2.4.1 DATA创建索引
            data idx(index=(x));
                input x y z;
                cards;
                1 2 3
                ;
                run;
    2.4.2 SQL过程创建索引
            proc sql;
                create index y on idx(y)/*定义单一索引*/;
                create index yz in idx(y,z);/*定义符合索引*/
            quit;
    2.4.3 DATASETS 过程创建索引
            proc datasets lib=work;
                modifiy idx;
                index create z/nomiss unique;/*定义单一索引*/
                index create xyz=(x y z)/nomiss unique;/*定义符合索引*/
            quit;
    2.4.4 删除索引
            /*删除指定索引;*/
            Proc Sql;
                Drop Index X On Idx;
            Quit;
            /*删除全部索引*/
            Proc Datasets;
                Modify Idx;
                Index Delete _ALL_;
            Quit;
2.5 数据字典,包含了所有的当前进程SAS逻辑库、SAS数据表、SAS目录等非常有用的信息。

3. 数据获取与数据集操作

3.1 数据集操作常用语句
DATA 创建SAS数据集;SET语句 读取数据行,纵向合并SAS数据集;BY语句 控制SET、MERGE、MODIFY、UPDATE语句,并建立变量。
MERGE语句 横向合并两个或两个以上SAS数据集;UPDATE语句 更细SAS数据集;MODIFY语句 修改SAS数据集;
PUT语句 显示或输出数据行;FILE语句 规定当前PUT语句的输出文件;INFILE语句 规定DATA步要读入的外部文件。
3.2 直接访问外部数据库
    3.2.1访问DB2
libname hsdb db2 user=xxx password="xxx" datasrc=datadb;
    3.2.2访问Oracle
libname oralib oracle user = xxx pw = xxx path = dbmssrv schema = educ;

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
JAVA多线程高并发学习笔记(三)——Callable、Future和FutureTask
为什么要是用Callable和Future Runnable的局限性 Executor采用Runnable作为基本的表达形式,虽然Runnable的run方法能够写入日志,写入文件,写入数据库等操作,但是它不能返回一个值,或者抛出一个受检查的异常,有些需要返回值的需求就不能满足了。
1342 0
Python零基础学习笔记(四)——数据类型
python数据类型:Number(数字):包括整数/浮点数(小数)/复数String(字符串)Boolean(布尔值)None(空值)list(列表)tuple(元组)dict(字典)set(集合)
1236 0
应用统计学与R语言实现学习笔记(三)——描述性统计
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/ESA_DSQ/article/details/71190387 Chapter 3 Descriptive Statistics 本篇是第三章,内容是描述性统计。
876 0
服务端编程示例|学习笔记
快速学习服务端编程示例
40 0
深入理解计算机系统结构——并发编程
并发编程 如果逻辑控制流在实际上重叠,那么它们就是并发的,这种常见的现象称为并发,出现在计算机系统的许多不同层面上。 应用级并发在其他情况下也是很有用的: 访问慢速I/O设备。 与人交互。 通过推迟工作以降低延迟。
743 0
【云栖直播】精彩推荐第3期:个性化推荐系统搭建实践
【云栖直播】精彩推荐第3期:个性化推荐系统搭建实践
4193 0
+关注
王小雷
专注大数据,人工智能的多面手,对新兴的技术与知识充满了好奇与渴望!
128
文章
0
问答
文章排行榜
最热
最新
相关电子书
更多
《2021云上架构与运维峰会演讲合集》
立即下载
《零基础CSS入门教程》
立即下载
《零基础HTML入门教程》
立即下载