SAS学习笔记之《SAS编程与数据挖掘商业案例》(1)系统简介和编程基础

简介: SAS学习笔记之《SAS编程与数据挖掘商业案例》(1)系统简介和编程基础1. SAS系统简介1.1 SAS是先编译后执行的语言,data步标志着编译的开始。 数据指针:当前内存缓存区,输入数据所在位置。 PDV:Program Data Vector,在DATA步中所有涉及的变量被编程当前向量的一部分。2. SAS编程基础2.1 SAS逻

SAS学习笔记之《SAS编程与数据挖掘商业案例》(1)系统简介和编程基础

1. SAS系统简介

1.1 SAS是先编译后执行的语言,data步标志着编译的开始。
    数据指针:当前内存缓存区,输入数据所在位置。
    PDV:Program Data Vector,在DATA步中所有涉及的变量被编程当前向量的一部分。

2. SAS编程基础

2.1 SAS逻辑库
                            SAS逻辑库
                    |           |       |
            SAS数据集      SAS目录       其他SAS文件
            |       |
    SAS数据文件  SAS数据视图
2.2 创建逻辑库 libname lb'F:\Data_Model\Bookdata\chapt2';
    删除逻辑库 libname lb clear;
    SAS数据集命名规则:由英文字母、下划线、数字组成且最多不超过32个字符。
    创建永久SAS数据集名为forever
        libname fv 'F:\Data_Model\Book_data\chap2';
        data fv.forever;
        Input x y z;
        Cards;
        1 2 3
        3 4 5
        ;
        run;
    创建临时数据集名为temp
        data temp;
        Input x y z;
        Cards;
        1 2 3
        4 5 6
        ;
        run;
2.3 SAS数据集结构
    一个SAS数据集是数据值和数据集信息的集合。
    数据值:由观测加变量组成,行为观测列为变量;数据集信息:包含该数据集名字、创建时间、在逻辑库中的成员类型等。
2.4 SAS索引
    SAS索引存储SAS数据集中一些变量的值和与该值对应的观测进行直接定位的指针系统。
    创建索引:
    2.4.1 DATA创建索引
            data idx(index=(x));
                input x y z;
                cards;
                1 2 3
                ;
                run;
    2.4.2 SQL过程创建索引
            proc sql;
                create index y on idx(y)/*定义单一索引*/;
                create index yz in idx(y,z);/*定义符合索引*/
            quit;
    2.4.3 DATASETS 过程创建索引
            proc datasets lib=work;
                modifiy idx;
                index create z/nomiss unique;/*定义单一索引*/
                index create xyz=(x y z)/nomiss unique;/*定义符合索引*/
            quit;
    2.4.4 删除索引
            /*删除指定索引;*/
            Proc Sql;
                Drop Index X On Idx;
            Quit;
            /*删除全部索引*/
            Proc Datasets;
                Modify Idx;
                Index Delete _ALL_;
            Quit;
2.5 数据字典,包含了所有的当前进程SAS逻辑库、SAS数据表、SAS目录等非常有用的信息。

3. 数据获取与数据集操作

3.1 数据集操作常用语句
DATA 创建SAS数据集;SET语句 读取数据行,纵向合并SAS数据集;BY语句 控制SET、MERGE、MODIFY、UPDATE语句,并建立变量。
MERGE语句 横向合并两个或两个以上SAS数据集;UPDATE语句 更细SAS数据集;MODIFY语句 修改SAS数据集;
PUT语句 显示或输出数据行;FILE语句 规定当前PUT语句的输出文件;INFILE语句 规定DATA步要读入的外部文件。
3.2 直接访问外部数据库
    3.2.1访问DB2
libname hsdb db2 user=xxx password="xxx" datasrc=datadb;
    3.2.2访问Oracle
libname oralib oracle user = xxx pw = xxx path = dbmssrv schema = educ;
目录
相关文章
|
7月前
|
机器学习/深度学习 人工智能 数据挖掘
【Python数据挖掘】数据挖掘简介及Jupyter notebook操作介绍(图文解释 超详细)
【Python数据挖掘】数据挖掘简介及Jupyter notebook操作介绍(图文解释 超详细)
142 0
|
3月前
|
数据挖掘 索引 Python
Python数据挖掘编程基础3
字典在数学上是一个映射,类似列表但使用自定义键而非数字索引,键在整个字典中必须唯一。可以通过直接赋值、`dict`函数或`dict.fromkeys`创建字典,并通过键访问元素。集合是一种不重复且无序的数据结构,可通过花括号或`set`函数创建,支持并集、交集、差集和对称差集等运算。
27 9
|
3月前
|
数据挖掘 Python 容器
Python数据挖掘编程基础
Python包含四种内置数据结构:列表(List)、元组(Tuple)、字典(Dictionary)和集合(Set),统称为容器。列表与元组均为序列结构,前者使用方括号表示且可修改,后者用圆括号表示且不可修改。列表支持多种方法和列表解析功能,以简化元素操作。例如,通过列表解析可以简洁地实现`d=[i+1 for i in c]`,输出结果为`[2,3,4]`。
38 7
|
2月前
|
搜索推荐 数据挖掘 UED
分享一些利用商品详情数据挖掘潜在需求的成功案例
本文介绍了四个成功利用商品详情数据挖掘潜在需求的案例:亚马逊通过个性化推荐系统提升销售额;小米通过精准挖掘用户需求优化智能硬件生态链;星巴克推出定制化饮品服务满足用户多样化口味;美妆品牌利用数据改进产品配方和设计,制定针对性营销策略。这些案例展示了数据挖掘在提升用户体验和商业价值方面的巨大潜力。
|
3月前
|
数据挖掘 Python
Python数据挖掘编程基础8
在Python中,默认环境下并不会加载所有功能,需要手动导入库以增强功能。Python内置了诸多强大库,例如`math`库可用于复杂数学运算。导入库不仅限于`import 库名`,还可以通过别名简化调用,如`import math as m`;也可指定导入库中的特定函数,如`from math import exp as e`;甚至直接导入库中所有函数`from math import *`。但需注意,后者可能引发命名冲突。读者可通过`help('modules')`查看已安装模块。
47 0
|
3月前
|
人工智能 数据挖掘 Serverless
Python数据挖掘编程基础
函数式编程中的`reduce`函数用于对可迭代对象中的元素进行累积计算,不同于逐一遍历的`map`函数。例如,在Python3中,计算n的阶乘可以使用`reduce`(需从`funtools`库导入)实现,也可用循环命令完成。另一方面,`filter`函数则像一个过滤器,用于筛选列表中符合条件的元素,同样地功能也可以通过列表解析来实现。使用这些函数不仅使代码更加简洁,而且由于其内部循环机制,执行效率通常高于普通的`for`或`while`循环。
31 0
|
3月前
|
分布式计算 数据挖掘 Serverless
Python数据挖掘编程基础6
函数式编程(Functional Programming)是一种编程范型,它将计算机运算视为数学函数计算,避免程序状态及易变对象的影响。在Python中,函数式编程主要通过`lambda`、`map`、`reduce`、`filter`等函数实现。例如,对于列表`a=[5,6,7]`,可通过列表解析`b=[i+3 for i in a]`或`map`函数`b=map(lambda x:x+3, a)`实现元素加3的操作,两者输出均为`[8,9,10]`。尽管列表解析代码简洁,但其本质仍是for循环,在Python中效率较低;而`map`函数不仅功能相同,且执行效率更高。
17 0
|
3月前
|
数据挖掘 Python
Python数据挖掘编程基础5
函数是Python中用于提高代码效率和减少冗余的基本数据结构,通过封装程序逻辑实现结构化编程。用户可通过自定义或函数式编程方式设计函数。在Python中,使用`def`关键字定义函数,如`def pea(x): return x+1`,且其返回值形式多样,可为列表或多个值。此外,Python还支持使用`lambda`定义简洁的行内函数,例如`c=lambda x:x+1`。
41 0
|
3月前
|
数据挖掘 Python
Python数据挖掘编程基础
判断与循环是编程的基础,Python中的`if`、`elif`、`else`结构通过条件句来执行不同的代码块,不使用花括号,依赖缩进区分代码层次。错误缩进会导致程序出错。Python支持`for`和`while`循环,`for`循环结合`range`生成序列,简洁直观。正确缩进不仅是Python的要求,也是一种良好的编程习惯。
31 0
|
3月前
|
数据挖掘 Python
Python数据挖掘编程基础
本章介绍了Python数据挖掘编程的基础知识,涵盖Python入门所需的命令、判断与循环、函数、库导入等内容,并重点讲解了数据分析预处理和建模常用库。通过学习基本运算、数据结构、字符串操作等,帮助读者快速掌握Python语言,为后续数据挖掘工作打下坚实基础。例如,通过代码`a=3`进行赋值,利用`a*3`执行乘法运算,使用`a**3`计算幂,以及通过对字符串的拼接和分割操作,展示Python的强大功能。
55 0

热门文章

最新文章