散点图中实现数据的线性回归分析

简介: 散点图中实现数据的线性回归分析

很多图表库都支持散点图的线性回归分析,可以显示线性回归很典型就是google

chart与highchart都支持这个功能,通过散点数据计算线性回归得到公式,然后

插值生成即可。

线性回归数据分析

线性回归分析,用来对一组数据实现线性建模,分析线性走势,从而实现对未来

数据的走势预期,线性回归分析是最简单也是最基础的数据回归分析。

 数学基础

抽取数据,计算线性回归计算,得到等式y = a + bx;

最重要的就是要得到斜率b与相关因子a。假设数据集D为(年龄与葡萄糖含量对比)

image.png

package com.gloomyfish.image.game;
 
public class LineRegressionDemo {
  
  private double slope;
  private double intrepter;
  private double[][] xyData;
  
  public LineRegressionDemo(double[][] data)
  {
    this.xyData = data;
  }
  
  public void calculate()
  {
    double sumx=0, sumy=0, sumxy=0, sumxx=0, sumyy=0;
    for(int i=0; i<xyData.length; i++)
    {
      sumx += xyData[i][0];
      sumy += xyData[i][1];
      sumxy += xyData[i][0] * xyData[i][1];
      sumxx += xyData[i][0] * xyData[i][0];
      sumyy += xyData[i][1] * xyData[i][1];
    }
    double n = xyData.length;
    intrepter = ((sumy * sumxx) - sumx * sumxy)/(n*sumxx - (sumx *sumx));   
    slope = (n * sumxy - (sumx* sumy))/(n*sumxx - (sumx * sumx));
    System.out.println("slope = " + slope);
    System.out.println("intrepter = " + intrepter);
  }
  
  public static void main(String[] args)
  {
    double[][] data = new double[][]{{43, 99},{21,65}, {25, 79}, {42, 75}, {57,87}, {59,81}};
    LineRegressionDemo demo = new LineRegressionDemo(data);
    demo.calculate();
    
  }
 
}

对明天最好的准备就是不要虚度今日,算是对自己的勉励!

相关文章
|
6月前
|
机器学习/深度学习 数据可视化 Python
R语言使用逻辑回归Logistic、单因素方差分析anova、异常点分析和可视化分类iris鸢尾花数据集|数据分享
R语言使用逻辑回归Logistic、单因素方差分析anova、异常点分析和可视化分类iris鸢尾花数据集|数据分享
|
27天前
|
机器学习/深度学习 数据可视化 Linux
Seaborn可视化学习笔记(一):可视化神经网络权重分布情况
这篇文章是关于如何使用Seaborn库来可视化神经网络权重分布的教程,包括函数信息、测试代码和实际应用示例。
34 0
|
3月前
|
缓存 算法 前端开发
热力图生成算法及其具体实现
热力图生成算法及其具体实现
51 0
|
6月前
|
机器学习/深度学习 数据可视化 算法
【视频】主成分分析PCA降维方法和R语言分析葡萄酒可视化实例|数据分享
【视频】主成分分析PCA降维方法和R语言分析葡萄酒可视化实例|数据分享
|
5月前
|
自然语言处理 数据可视化 Python
卡方分布和 Zipf 分布模拟及 Seaborn 可视化教程
卡方分布是统计学中的一种连续概率分布,用于假设检验,形状由自由度(df)决定。自由度越大,分布越平缓。NumPy的`random.chisquare()`可生成卡方分布随机数。Seaborn能可视化卡方分布。练习包括模拟不同自由度的卡方分布、进行卡方检验。瑞利分布描述信号处理中幅度分布,参数为尺度(scale)。Zipf分布常用于自然语言等幂律特征数据,参数a控制形状。NumPy的`random.zipf()`生成Zipf分布随机数。
71 0
|
6月前
|
机器学习/深度学习 数据可视化 数据挖掘
R语言逻辑回归logistic对ST股票风险建模分类分析混淆矩阵、ROC曲线可视化
R语言逻辑回归logistic对ST股票风险建模分类分析混淆矩阵、ROC曲线可视化
|
6月前
|
数据可视化
R语言GAMLSS模型对艾滋病病例、降雪量数据拟合、预测、置信区间实例可视化
R语言GAMLSS模型对艾滋病病例、降雪量数据拟合、预测、置信区间实例可视化
|
6月前
|
数据可视化 算法
R语言主成分分析(PCA)葡萄酒可视化:主成分得分散点图和载荷图
R语言主成分分析(PCA)葡萄酒可视化:主成分得分散点图和载荷图
|
6月前
|
算法 数据挖掘 Go
R语言k-Shape时间序列聚类方法对股票价格时间序列聚类
R语言k-Shape时间序列聚类方法对股票价格时间序列聚类
|
6月前
|
机器学习/深度学习 数据可视化 数据挖掘
R语言用逻辑回归预测BRFSS中风数据、方差分析anova、ROC曲线AUC、可视化探索
R语言用逻辑回归预测BRFSS中风数据、方差分析anova、ROC曲线AUC、可视化探索