【gloomyfish】基于Java的统计学计算结果

简介: 最近经常跟数值计算的东西打交道,特别是大量样本的统计计算,在常见的描述统计结果中,最常用到的是一下几种:  - 一组样本的平均价值  - 一组样本的中值  - 一组样本中的最小值  - 一组样本中的最大值  - 一组样本的和  - 一组样本的标准方差   其中,样本N(X[1].

最近经常跟数值计算的东西打交道,特别是大量样本的统计计算,在常见的描述统计结果中,最常用到的是一下几种:

 - 一组样本的平均价值

 - 一组样本的中值

 - 一组样本中的最小值

 - 一组样本中的最大值

 - 一组样本的和

 - 一组样本的标准方差

 

其中,样本NX[1].....X[n])的中值的计算与样本的总数有一定的关系:

当样本数量为奇数(odd)时,中值 median=X[n/2]

当样本数量为偶数(even)时,中值 median=(X[n/2] + X[n/2])/2

 

标准方差的计算公式可以参考维基百科http://en.wikipedia.org/wiki/Standard_deviation, 其中样

本的标准方差是指以N为分母(denominator )计算结果,标准方差样本是指以N-1作为分母, N-1

又叫自由度数。

 

在标准的apache common math的组件中,已经包含了一组统计学计算的package,可以很好的计算

上面的结果。而它的标准方差的计算公式正是用N-1作为分母计算出来的结果。这个组件的下载URL

http://commons.apache.org/math/

 

下面是本人基于Java实现的代码,计算结果与apache common math中的DescriptiveStatistics

结果完全一致

 

 

 /** * @author gloomyfish * @date 2011-03-20 */ package com.java.mathutil; import java.util.Arrays; import org.apache.commons.math.stat.descriptive.DescriptiveStatistics; public class StatisticsDemo { private double[] inputData; // input data private double medianValue; // median value private double meanValue; // mean of input data array private double maxValue; // max value of array private double minValue; // min value of array private double sdValue; // standard deviation of array private double sumValue; // sum of array public StatisticsDemo(double[] input) { this.inputData = input; Arrays.sort(inputData); double N = inputData.length; for(int i=0; i<inputData.length; i++) { if(i == 0) { maxValue = inputData[i]; minValue = inputData[i]; } if(maxValue < inputData[i]) { maxValue = inputData[i]; } if(minValue > inputData[i]) { minValue = inputData[i]; } sumValue += inputData[i]; } meanValue = sumValue/N; // if total number is odd // calculate standard deviation and median value // http://en.wikipedia.org/wiki/Standard_deviation if(isOdd(inputData.length)) { medianValue = inputData[inputData.length/2]; } else { double temp = inputData[inputData.length/2] + inputData[(inputData.length/2 -1)]; medianValue = temp/2.0d; } double powSum = 0.0d; for(int k=0; k<inputData.length; k++) { powSum += Math.pow((inputData[k] - meanValue), 2); } // This correction (the use of N − 1 instead of N) is known as Bessel's correction sdValue = Math.sqrt(powSum/(N-(double)1.0d)); } private boolean isOdd(int n) { if((n & 0x1) == 1) return true; else return false; } public double getMedianValue() { return medianValue; } public double getMeanValue() { return meanValue; } public double getMaxValue() { return maxValue; } public double getMinValue() { return minValue; } public double getSdValue() { return sdValue; } public double getSumValue() { return sumValue; } public static void main(String[] args) { double[] data = new double[]{15.23,12.11,7,88,17,89,6.578,13.456,9.1235,20.5678}; // Arrays.sort(data); StatisticsDemo dsd = new StatisticsDemo(data); DescriptiveStatistics ds = new DescriptiveStatistics(); for(int i=0; i<data.length; i++) { ds.addValue(data[i]); } System.out.println("Demo sum = " + dsd.getSumValue()); System.out.println("Demo mean = " + dsd.getMeanValue()); System.out.println("Demo median = " + dsd.getMedianValue()); System.out.println("Demo standard deviation = " + dsd.getSdValue()); System.out.println("DS sum = " + ds.getSum()); System.out.println("DS mean = " + ds.getMean()); System.out.println("DS median = " + ds.getPercentile(50)); System.out.println("DS standard deviation = " + ds.getStandardDeviation()); } }

 

如有误导,后果自负!

 

 

 

目录
相关文章
|
2月前
|
机器学习/深度学习 Java 编译器
解锁硬件潜能:Java向量化计算,性能飙升W倍!
编译优化中的机器相关优化主要包括指令选择、寄存器分配、窥孔优化等,发生在编译后端,需考虑目标平台的指令集、寄存器、SIMD支持等硬件特性。向量化计算利用SIMD技术,实现数据级并行,大幅提升性能,尤其适用于图像处理、机器学习等领域。Java通过自动向量化和显式向量API(JDK 22标准)支持该技术。
77 4
|
3月前
|
自然语言处理 Java Apache
在Java中将String字符串转换为算术表达式并计算
具体的实现逻辑需要填写在 `Tokenizer`和 `ExpressionParser`类中,这里只提供了大概的框架。在实际实现时 `Tokenizer`应该提供分词逻辑,把输入的字符串转换成Token序列。而 `ExpressionParser`应当通过递归下降的方式依次解析
221 14
|
8月前
|
Java
Java计算时间差
这段代码提供了两个方法来计算时间差。`timeDistance` 方法接收两个 `Date` 对象,计算并返回两者之间的天数、小时数和分钟数差异,格式为“X天Y小时Z分钟”。`hourDistance` 方法则接收两个时间字符串,解析后计算并返回两者之间相差的小时数(向上取整)。
309 4
|
10月前
|
存储 Java
java中的常见运算符的计算方式
本文介绍了计算机中二进制数的原码、反码和补码的概念及其转换方式。原码是符号位加真值的绝对值;反码中正数不变,负数其余位取反;补码在反码基础上加1。文章还详细解释了Java中的常见运算符(如按位与、或、异或、移位等)如何基于二进制进行计算,并探讨了使用补码的原因,包括统一符号位处理和扩展表示范围。通过具体代码示例帮助理解这些概念。
159 6
java中的常见运算符的计算方式
|
10月前
|
存储 JavaScript Java
如何在Java中计算绝对值
绝对值表示一个数离0的距离,总是非负的。在Java中,可以通过`Math.abs()`函数或`if-else`条件语句来计算绝对值。使用`Math.abs()`可直接将负数转为正数,而`if-else`则根据条件判断是否取反。本文介绍了这两种方法的具体实现步骤和代码示例,并展示了如何通过用户输入获取数值并输出其绝对值。此外,还提供了完整的代码和编译执行的方法。
376 6
如何在Java中计算绝对值
|
11月前
|
存储 分布式计算 Java
存算分离与计算向数据移动:深度解析与Java实现
【11月更文挑战第10天】随着大数据时代的到来,数据量的激增给传统的数据处理架构带来了巨大的挑战。传统的“存算一体”架构,即计算资源与存储资源紧密耦合,在处理海量数据时逐渐显露出其局限性。为了应对这些挑战,存算分离(Disaggregated Storage and Compute Architecture)和计算向数据移动(Compute Moves to Data)两种架构应运而生,成为大数据处理领域的热门技术。
376 2
|
11月前
|
分布式计算 Java MaxCompute
ODPS MR节点跑graph连通分量计算代码报错java heap space如何解决
任务启动命令:jar -resources odps-graph-connect-family-2.0-SNAPSHOT.jar -classpath ./odps-graph-connect-family-2.0-SNAPSHOT.jar ConnectFamily 若是设置参数该如何设置
|
12月前
|
机器学习/深度学习 算法 搜索推荐
让星星⭐月亮告诉你,Java冒泡排序及其时间复杂度计算
冒泡排序是一种简单的排序算法,通过多次遍历数组,每次比较相邻元素并交换位置,将较小的元素逐步移至数组前端。第一轮结束后,最小值会位于首位;第二轮则将次小值置于第二位,依此类推。经过 (n-1) 轮遍历后,数组完成排序。冒泡排序的时间复杂度为 O(n²),在最优情况下(已排序数组)时间复杂度为 O(n)。示例代码展示了如何实现冒泡排序。
238 1
|
12月前
|
分布式计算 资源调度 Hadoop
Hadoop-10-HDFS集群 Java实现MapReduce WordCount计算 Hadoop序列化 编写Mapper和Reducer和Driver 附带POM 详细代码 图文等内容
Hadoop-10-HDFS集群 Java实现MapReduce WordCount计算 Hadoop序列化 编写Mapper和Reducer和Driver 附带POM 详细代码 图文等内容
263 3
|
12月前
|
消息中间件 Java Kafka
Flink-04 Flink Java 3分钟上手 FlinkKafkaConsumer消费Kafka数据 进行计算SingleOutputStreamOperatorDataStreamSource
Flink-04 Flink Java 3分钟上手 FlinkKafkaConsumer消费Kafka数据 进行计算SingleOutputStreamOperatorDataStreamSource
271 1