py之patsy:patsy的简介、安装、使用方法之详细攻略

简介: py之patsy:patsy的简介、安装、使用方法之详细攻略

patsy的简介

image.png



   Patsy是一个python库,用于描述统计模型(尤其是线性模型,或具有线性组件的模型)和构建设计矩阵。Patsy为python带来了r“formulas”的便利。它受到R和S中使用的公式迷你语言的启发并与之兼容。


  patsy is a Python package for describing statistical models (especially linear models, or models that have a linear component) and building design matrices. It is closely inspired by and compatible with the formula mini-language used in R and S.


        利用Patsy创建模型描述 Patsy是一个python库,用于描述统计模型(尤其是线性模型),方法是通过一个叫做公式语法(formula syntax)的字符串来描述。这种公式语法的灵感来源于R和S语言中的公式语法。


      Patsy的公式是有特殊格式的字符串,像下面这样: y ~ x0 + x1 这种a + b的语法并不代表将a和b相加,而是代表为模型创建的设计矩阵的术语(terms in the design matrix)。patsy.dmatrices函数,取一个公式字符串和一个数据集(可以使DataFrame或dict),然后为线性模型产生设计矩阵。


patsy文档:patsy - Describing statistical models in Python




patsy的安装


pip install patsy

image.png



patsy的使用方法


patsy.dmatrices("y ~ x + a + b + a:b", data)

1、patsy.dmatrices函数,取一个公式字符串和一个数据集(可以使DataFrame或dict),然后为线性模型产生设计矩阵。


data = pd.DataFrame({'x0': [1, 2, 3, 4, 5],

                    'x1': [0.01, -0.01, 0.25, -4.1, 0.],

                    'y': [-1.5, 0., 3.6, 1.3, -2.]})

print(data)

y, X = patsy.dmatrices('y ~ x0 + x1', data)

print(y)

  x0    x1    y

0   1  0.01 -1.5

1   2 -0.01  0.0

2   3  0.25  3.6

3   4 -4.10  1.3

4   5  0.00 -2.0

[[-1.5]

[ 0. ]

[ 3.6]

[ 1.3]

[-2. ]]





 


相关文章
|
1月前
|
存储 人工智能 供应链
就着本体论,再谈语义层
语义层更容易成为企业迈向 AI Agent 的第一站,而本体论更像是企业完成智能决策深水区建设后的下一站。
|
存储 数据采集 机器学习/深度学习
谷歌大数据的三驾马车
当涉及到大规模数据处理时,谷歌公司一直是领先的技术创新者,已经在大数据技术方面有着非常强的实力。下面我将详细介绍谷歌的三项重要技术:Google Bigtable,Google MapReduce和Google File System (GFS)。
3212 1
谷歌大数据的三驾马车
|
3月前
CLion中文乱码的解决方案
CLion中文乱码的解决方案
316 1
|
Kubernetes 固态存储 调度
Kubernetes(k8s)容器编排Pod调度策略
Kubernetes(k8s)容器编排Pod调度策略
570 0
|
Kubernetes 网络协议 关系型数据库
Kubernetes----ExternalName类型的Service
Kubernetes----ExternalName类型的Service
3019 0
|
机器学习/深度学习 数据可视化 算法
|
运维 Linux 虚拟化
Linux 查看 CPU 使用情况
在 Linux 系统中,查看 CPU 使用情况是性能分析和故障排查的重要环节。查看 CPU 使用情况,使用 top 命令或者 htop 命令来查看。
|
Ubuntu Linux 虚拟化
LinuxUbuntu安装VMware tools Segmentation fault (core dumped)怎么解决
更新操作系统和内核:使用apt-get或apt命令更新你的Ubuntu操作系统和内核。运行以下命令更新软件包:
2645 0
|
存储 SQL 缓存
ads的Cube 表模型
【8月更文挑战第13天】
443 1
|
编解码 开发者 Python
【Python】已解决:SyntaxError: (unicode error) ‘unicodeescape’ codec can’t decode bytes in position 2-3: t
【Python】已解决:SyntaxError: (unicode error) ‘unicodeescape’ codec can’t decode bytes in position 2-3: t
5131 0