本节书摘来自华章计算机《R语言数据挖掘:实用项目解析》一书中的第1章,第1.6节,作者[印度]普拉迪帕塔·米什拉(Pradeepta Mishra),译 黄芸,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
1.6 日期与时间格式化
日期函数返回的是一个Date类,表示自1970年1月1日以来的天数。as.numeric()函数可用于创建一个值为自1/1/1970以来的天数的数值型变量。as.Date()的返回值是一个Date类的对象:
系统时间函数提取了日期和时区时间。当用as.Date函数转换系统时间并将其存储为R中的一个新对象时,我们发现那个对象的类是Date。weekdays函数返回星期名,如“星期一”或者“星期三”。months函数返回日期变量中的月名。quarters函数返回日期对象的季名。年份值也可利用substr()命令提取。示例如下:
如果数据集中给出的日期变量的格式不适用于进一步计算,可以用format函数将其格式化:
下表所示的多种选项均可基于用户需求传递给格式参数。
实际数据集包含的时间数据域有零售中的交易日期、健康服务中的访问日期和BFSI中的处理日期,还有包含至少一个时间元素的时间序列数据。要将日期变量纳入任何统计模型,都需要进行数据转换,比如在零售业场景中计算顾客的历史记录。数据转换可以使用上文提及的选项完成。