SAS进阶《深入解析SAS》之开发多语言支持的SAS程序-阿里云开发者社区

开发者社区> 王小雷> 正文

SAS进阶《深入解析SAS》之开发多语言支持的SAS程序

简介: SAS进阶《深入解析SAS》之开发多语言支持的SAS程序 1. 多语言支持的应用程序是指该程序在世界给第使用时,其能够处理的数据,以及处理数据的方式、信息展现的方式都符合当地的语言、文化习惯,这要求应用程序运行时,能够自动进行与地区、语言相关的处理,也就是通常所说的国际化。 2. SBCS、DBCS、MBCS 单字节字符集SBCS指在该字符集中的字符最多由2个字
+关注继续查看

SAS进阶《深入解析SAS》之开发多语言支持的SAS程序

1. 多语言支持的应用程序是指该程序在世界给第使用时,其能够处理的数据,以及处理数据的方式、信息展现的方式都符合当地的语言、文化习惯,这要求应用程序运行时,能够自动进行与地区、语言相关的处理,也就是通常所说的国际化。

2. SBCS、DBCS、MBCS

单字节字符集SBCS指在该字符集中的字符最多由2个字节表示。一个字节8位,仅支持2的8次方=256个码点。
双字节字符集DBCS(Doule-Byte Character Set)指该字符中的字符最多由2个字节表示。
多字节字符集MBCS(Multiple-Byte Character Set)是指该字符集中的字符以多个字节来表示。如UTF-8.

3. 指定系统选项的LOCALE=

在启动SAS时,相应的Locale会在启动时加载的SAS配置文件中指定。

4. 编码选项ENCODING=

SAS提供了系统选项ENCODING=以及一些数据集选项、逻辑库选项和读写文件选项,便于灵活地出各种编码的数据。
(1)会话编码(2)SAS数据集的编码(3)读写外部文件(4)排序序列(SORT默认的排序是二进制排序)

5. 使用SORTREQ=指定其他排序序列的基本形式如下:

PROC SORT DATA=数据集 SORTSEQ=转换表|编码|LIGNUISTIC;
RUN;

6. 语言切换选项

从SAS9.3开始,引入了语言切换(Language Switching)选项,并且在SAS9.4中得到了增强。

7. SAS提供了NL格式(format)和NL输入格式(informat),这些格式能够根据运行的SAS会话的语言/区域来转换日期、日期时间、货币和数字的格式。

8. FORMAT自定义格式,还可以通过指定选项LOCALE来定义只能在指定的Locale下可用的格式。

    /*
    根据美国和中国的对身高的不同标准
    运行该代码会在逻辑库sas的物理路径下生产两个文件formats.sas7bcat和formats_zh_cn.sas7bcat
    */
    proc format lib=saslib.formats;
        value size
            low - 56 = 'Short'
            56 - 66 = 'Medium'
            66 - high = 'Tall';
    run;

    options locale=zh_CN;
    proc form lib=saslib.formats locale;
        value size
            low - 50 = '偏瘦'
            50 - 60 = '中等'
            60 - high = '偏高'
    run;

    /*
    接下来按Locale使用逻辑库saslib中的格式size.,代码如下:
    */
    option fmtsearch=(saslib/locale);
    proc print data=sashelp.class(obs=5);
        format height size.;
    run;

9. 字符串和字符处理函数

SAS提供了字符串函数和CALL例程,以使用户能够很容易地处理字符数据。K函数。
K函数使用以字符为基础的偏移长度,可用于处理SBCS、DBCS、MBCS(UTF-8)数据,使用K函数更加符合语言处理习惯,而且不需要知道每个字符存储为多少个字节。

10. 文本字符串外部化

为了使同一个SAS程序能支持多种语言,需要将代码中的文本字符串提取出来,并在需要使用该字符串的地方使用其通用的表示方式,该过程称为字符串外部化(String Externalizatin)。
步骤:
(1)第一步:抽取字符串并生成.smd文件
(2)第二步:根据.msd文件创建数据集
(3)第三步:在SAS代码中获取字符串
/*
保证所有文本在不同的Locale下以对应的语言显示,包括页眉、页脚、标签等,目前需要支持英文和简体中文。
*/

/*
第一步创建myapp_zh_CN.smd,使用Unicode转义字符,将utf-8原文件转换成Uncode
*/
%macro SMD2ASCII(inf=,outf=,inencoding=,lrecl=);
data _null_;
    attrib tmp length=$ &lrecl;
    infile "&inf" lrecl=&lrecl;
    input;
    file "&outf" lrecl=&lrecl;
    tmp = kpropdata(_infile_,"uesc","&inencoding","ascii");
    put tmp;
run;
%mend SMD2ASCII;

%SMD2ASCII(inf = E:\SHANGHAIRUIMIN\sas\data\shenrufenxisas\ch8\smd\myapp_han.smd,
    outf = E:\SHANGHAIRUIMIN\sas\data\shenrufenxisas\ch8\smd\myapp_zh_CN.smd,
    inencoding = utf-8,
    lrecl = 300);
/*
第二步根据.smd文件创建数据集
*/
%SMD2DS(dir = E:\SHANGHAIRUIMIN\sas\data\shenrufenxisas\ch8\smd,
    basename = myapp,
    locale = zh_CN,
    lib = saslib);
/*
    在使用SASMSG函数从消息数据集中获取文本字符串
    */
%let ds=saslib.myapp;
%let user=SBJKUX;
%let adate=%sysfunc(today(),nldate.);

proc datasets library=saslib nolist;
    modify order_summay;
    label Qountry = %sysfunc(sasmsg(&ds,Country_Label,noquote));
    label Quantity = %sysfunc(sasmsg(&ds,Quantity_Label,noquote));
    label Price = %sysfunc(sasmsg(&ds,Price_Label,noquote));
run;

title %sysfunc(sasmsg(&ds,Report_Title,noquote));
footnote %sysfunc(sasmsg(&ds,Report_Fn,noquote,'&adate',&user));
proc report data=saslib.sales;
run;

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
SAS进阶《深入解析SAS》之开发多语言支持的SAS程序
SAS进阶《深入解析SAS》之开发多语言支持的SAS程序 1. 多语言支持的应用程序是指该程序在世界给第使用时,其能够处理的数据,以及处理数据的方式、信息展现的方式都符合当地的语言、文化习惯,这要求应用程序运行时,能够自动进行与地区、语言相关的处理,也就是通常所说的国际化。 2. SBCS、DBCS、MBCS 单字节字符集SBCS指在该字符集中的字符最多由2个字
1670 0
SAS进阶《深入解析SAS》之Base SAS基础、读取外部数据到SAS数据集
SAS进阶《深入解析SAS》之Base SAS基础、读取外部数据到SAS数据集 前言:在学习完《SAS编程与商业案例》后,虽然能够接手公司的基本工作,但是为了更深入的SAS学习,也为了站在更高的一个层次上去掌握和优化公司工作,故而又咬紧牙关加紧学习《深入解析SAS》.就目前的两本书的对比,显而易见的是本书比《SAS编程…》要厚的多,再者内容更新是2015年著,最后是内容详实
1812 0
SAS进阶《深入解析SAS》之SAS数据挖掘的一般流程
SAS进阶《深入解析SAS》之SAS数据挖掘的一般流程 1. 所谓数据挖掘,是指通过对大量的数据进行选择、探索与建模,来揭示包含在数据中以前不为人所知的模式或规律,从而为商业活动或科学研究提供帮助和服务。 2. 数据挖掘重要的两个类别:有监督分析(SupervisedAnalysis),无监督分析(UnsupervisedAnalysis)。 有监督分析属于目标
1108 0
如何让您的php也支持pthreads多线程
  我们常常会碰到这样一种情况,开发环境在windows下开发,而生产环境确是linux。windows下能正常运行,上传到linux后却无法好好地玩耍了。然后开始了一轮尼玛式的疯狂的查找原因,最后发现是服务器环境问题。
1076 0
SAS进阶《深入解析SAS》之对多数据集的处理
SAS进阶《深入解析SAS》之对多数据集的处理 1. 数据集的纵向串接: 数据集的纵向串接指的是,将两个或者多个数据集首尾相连,形成一个新的数据集。 据集的横向合并: 数据集的横向合并,指的是将两个或者多个数据集根据某种原则横向合并起来,形成新的数据集。 2. 数据集的纵向串接两种方法:1)使用SAS DATA步的SET语句。2)使用SAS过程步的APPEND过程。
1265 0
+关注
王小雷
专注大数据,人工智能的多面手,对新兴的技术与知识充满了好奇与渴望!
128
文章
0
问答
文章排行榜
最热
最新
相关电子书
更多
《2021云上架构与运维峰会演讲合集》
立即下载
《零基础CSS入门教程》
立即下载
《零基础HTML入门教程》
立即下载