散点图中实现数据的线性回归分析

简介: 散点图中实现数据的线性回归分析

很多图表库都支持散点图的线性回归分析,可以显示线性回归很典型就是google

chart与highchart都支持这个功能,通过散点数据计算线性回归得到公式,然后

插值生成即可。

线性回归数据分析

线性回归分析,用来对一组数据实现线性建模,分析线性走势,从而实现对未来

数据的走势预期,线性回归分析是最简单也是最基础的数据回归分析。

 数学基础

抽取数据,计算线性回归计算,得到等式y = a + bx;

最重要的就是要得到斜率b与相关因子a。假设数据集D为(年龄与葡萄糖含量对比)

image.png

package com.gloomyfish.image.game;
 
public class LineRegressionDemo {
  
  private double slope;
  private double intrepter;
  private double[][] xyData;
  
  public LineRegressionDemo(double[][] data)
  {
    this.xyData = data;
  }
  
  public void calculate()
  {
    double sumx=0, sumy=0, sumxy=0, sumxx=0, sumyy=0;
    for(int i=0; i<xyData.length; i++)
    {
      sumx += xyData[i][0];
      sumy += xyData[i][1];
      sumxy += xyData[i][0] * xyData[i][1];
      sumxx += xyData[i][0] * xyData[i][0];
      sumyy += xyData[i][1] * xyData[i][1];
    }
    double n = xyData.length;
    intrepter = ((sumy * sumxx) - sumx * sumxy)/(n*sumxx - (sumx *sumx));   
    slope = (n * sumxy - (sumx* sumy))/(n*sumxx - (sumx * sumx));
    System.out.println("slope = " + slope);
    System.out.println("intrepter = " + intrepter);
  }
  
  public static void main(String[] args)
  {
    double[][] data = new double[][]{{43, 99},{21,65}, {25, 79}, {42, 75}, {57,87}, {59,81}};
    LineRegressionDemo demo = new LineRegressionDemo(data);
    demo.calculate();
    
  }
 
}

对明天最好的准备就是不要虚度今日,算是对自己的勉励!

相关文章
|
8月前
|
数据挖掘
跟着 Nature 学作图 | 相关性热图(显示相关性散点图)
跟着 Nature 学作图 | 相关性热图(显示相关性散点图)
233 0
|
1月前
|
机器学习/深度学习 数据可视化 Python
R语言使用逻辑回归Logistic、单因素方差分析anova、异常点分析和可视化分类iris鸢尾花数据集|数据分享
R语言使用逻辑回归Logistic、单因素方差分析anova、异常点分析和可视化分类iris鸢尾花数据集|数据分享
|
25天前
|
自然语言处理 数据可视化 Python
卡方分布和 Zipf 分布模拟及 Seaborn 可视化教程
卡方分布是统计学中的一种连续概率分布,用于假设检验,形状由自由度(df)决定。自由度越大,分布越平缓。NumPy的`random.chisquare()`可生成卡方分布随机数。Seaborn能可视化卡方分布。练习包括模拟不同自由度的卡方分布、进行卡方检验。瑞利分布描述信号处理中幅度分布,参数为尺度(scale)。Zipf分布常用于自然语言等幂律特征数据,参数a控制形状。NumPy的`random.zipf()`生成Zipf分布随机数。
22 0
|
1月前
|
机器学习/深度学习 数据可视化 算法
【视频】主成分分析PCA降维方法和R语言分析葡萄酒可视化实例|数据分享
【视频】主成分分析PCA降维方法和R语言分析葡萄酒可视化实例|数据分享
|
1月前
|
数据可视化
R语言GAMLSS模型对艾滋病病例、降雪量数据拟合、预测、置信区间实例可视化
R语言GAMLSS模型对艾滋病病例、降雪量数据拟合、预测、置信区间实例可视化
|
1月前
|
数据可视化 算法 数据挖掘
【视频】KMEANS均值聚类和层次聚类:R语言分析生活幸福指数可视化|数据分享(下)
【视频】KMEANS均值聚类和层次聚类:R语言分析生活幸福指数可视化|数据分享
|
1月前
|
数据可视化 算法 数据挖掘
【视频】KMEANS均值聚类和层次聚类:R语言分析生活幸福指数可视化|数据分享(上)
【视频】KMEANS均值聚类和层次聚类:R语言分析生活幸福指数可视化|数据分享
|
1月前
|
数据可视化 算法
R语言主成分分析(PCA)葡萄酒可视化:主成分得分散点图和载荷图
R语言主成分分析(PCA)葡萄酒可视化:主成分得分散点图和载荷图
|
1月前
|
算法 数据挖掘 Go
R语言k-Shape时间序列聚类方法对股票价格时间序列聚类
R语言k-Shape时间序列聚类方法对股票价格时间序列聚类
|
1月前
|
机器学习/深度学习 数据可视化 算法
R语言高维数据的主成分pca、 t-SNE算法降维与可视化分析案例报告
R语言高维数据的主成分pca、 t-SNE算法降维与可视化分析案例报告