Python数据分析之方差分析-阿里云开发者社区

开发者社区> 是罗罗攀啊> 正文

Python数据分析之方差分析

简介: 问题 设某苗圃对一花木种子制定了5种不同的处理方法,每种方法处理了6粒种子进行育苗试验。一年后观察苗高获得资料如下表。已知除处理方法不同外,其他育苗条件相同且苗高的分布近似于正态、等方差,试以95%的可靠性判断种子的处理方法对苗木生长是否有显著影响。
+关注继续查看

问题

设某苗圃对一花木种子制定了5种不同的处理方法,每种方法处理了6粒种子进行育苗试验。一年后观察苗高获得资料如下表。已知除处理方法不同外,其他育苗条件相同且苗高的分布近似于正态、等方差,试以95%的可靠性判断种子的处理方法对苗木生长是否有显著影响。

数据预处理

  1. 做过方差分析的都知道,先做个假设H0:不同处理方法对苗木生长无显著影响。
  2. 看下课程老师给的数据


    img_4c1a8b567233b8f7b4e310215507fbf6.png

    copy出来的格式很不友好,我就写了一个python代码进行转化,代码:

import csv
i = 0
f = open('C://Users/Administrator/Desktop/方差分析.txt','r')
csvfile = open('C://Users/Administrator/Desktop/方差分析.csv','wt',newline='',encoding='utf-8')
writer = csv.writer(csvfile)
for fs in f:
    i = i+1
    contents_1 = fs.strip()
    contents = contents_1.split(',  ')
    for content in contents:
        writer.writerow((content,i))
f.close()
csvfile.close()

可以把数据转化为如下格式,方便在python的方差分析中运行:


img_d47add4122de0dadc5bf99dc7a6ae3a0.png

Python方差分析

df = pd.read_excel('C:/Users/Administrator/Desktop/方差分析.xls',header=None,names=['value','group'])
d1 = df[df['group']==1]['value']
d2 = df[df['group']==2]['value']
d3 = df[df['group']==3]['value']
d4 = df[df['group']==4]['value']
d5 = df[df['group']==5]['value']
args = [d1,d2,d3,d4,d5]
f,p = stats.f_oneway(*args)
print(f,p)

结果如图:


img_b029eaf66ce235b4abba5683261f38d9.png

结论

查表得F0.05(4,25)=2.76,因为F=Sb2/Sw2=4.38﹥F0.05(4,25)=2.76,所以推翻(或者说拒绝)假设H0,即不同的处理方法造成了苗木高生长的差异显著。

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
Python数据分析之anaconda安装和使用
今天开始学习Python数据分析了,说到Python数据分析,大家都会推荐使用anaconda,但作为一个初学者,总是很多疑虑,但在实践中解决了一部分,先和大家分享分享。
991 0
Python数据结构
说实话,数据结构是一门很难的课程,我也没有系统的学过,如果有兴趣的同学可以去看看数据结构的书籍,以后可以和我讨论一下,在这里说说我自己的理解吧。 数据结构就是数据以什么样的形式存储;而以什么样的形式存储就得用相应的方法去处理分析数据(这是最近看数据分析的一点小体会),今天不过多的展开,介绍4个python的内置数据结构,分别是列表(list),字典(dict),元组(tuple),集合(set)。
599 0
Python数据分析之简书七日热门数据分析
之前爬了一些数据,没有做分析,今天在练习jupyter notebook的使用,干脆拿了2月七号爬取的七日热门数据来进行简单的分析,主要运用了mongodb的pipeline管道等技术加上charts包的使用。
893 0
【理论+案例实战】Python数据分析之逻辑回归(logistic regression)
逻辑回归是分类当中极为常用的手段,它属于概率型非线性回归,分为二分类和多分类的回归模型。对于二分类的logistic回归,因变量y只有“是”和“否”两个取值,记为1和0。假设在自变量x1,x2,……,xp,作用下,y取“是”的概率是p,则取“否”的概率是1-p。
10234 0
Python数据分析之一元线性回归
问题 制作一元材积表,不懂林学的可能不知道,如图,也就是构造材积和胸径间的关系,这里采用了python的一元线性回归方法(本人用spss做了幂函数非线性回归,效果最好)。
710 0
Python数据持久化-小测验
2018年7月13日考试 1.Python读写csv文件 现有如下图1所示的data.csv文件数据,请使用python读取该csv文件数据,并添加一条记录后输出如图2所示的output.
1096 0
Python数据分析之jieba库的运用
三十年河东,三十年河西,莫欺少年穷!年仅15岁的萧家废物,于此地,立下了誓言,从今以后便一步步走向斗气大陆巅峰!这里是属于斗气的世界,没有花俏艳丽的魔法,有的,仅仅是繁衍到巅峰的斗气! 《斗破苍穹》可谓玄幻小说的巅峰之作,曾经痴迷到彻夜看小说,回不到的过去,等不到的未来!今天就利用python的jieba库以及在线制作词云工具TAGUL,制作《斗破苍穹》词云。
879 0
Python数据分析之方差分析
问题 设某苗圃对一花木种子制定了5种不同的处理方法,每种方法处理了6粒种子进行育苗试验。一年后观察苗高获得资料如下表。已知除处理方法不同外,其他育苗条件相同且苗高的分布近似于正态、等方差,试以95%的可靠性判断种子的处理方法对苗木生长是否有显著影响。
780 0
+关注
是罗罗攀啊
罗攀,硕士研究生,《从零开始学Python网络爬虫》和《从零开始学Python数据分析》作者,Python中文社区,Python爱好者社区专栏作者。擅长网络爬虫、数据分析,在web开发,数据库,机器学习等领域有所涉猎,已开设多次爬虫线上课程
121
文章
0
问答
文章排行榜
最热
最新
相关电子书
更多
《2021云上架构与运维峰会演讲合集》
立即下载
《零基础CSS入门教程》
立即下载
《零基础HTML入门教程》
立即下载