【算法与数据结构】6 学会对算法进行性能测试

本文涉及的产品
性能测试 PTS,5000VUM额度
简介: 【算法与数据结构】6 学会对算法进行性能测试

一、前情回顾

👉传送门:1 详解线性查找法

👉传送门:2 线性查找的优化

👉传送门:3 线性查找的测试

👉传送门:4 循环不变量与复杂度分析

👉传送门:5 常见的时间复杂度

二、算法性能测试

Integer[] data = {24, 18, 12, 9, 16, 66, 32, 4};


我们对于之前的线性查找的算法,只是使用了一个含有8个元素的data数组进行测试,这个数组规模太小,在现代计算机上,对于O ( n ) O(n)O(n)这个级别的复杂度,需要一定规模的数据才能看到相应的性能


1.生成测试用例

//作用:为我们生成一个数组,
public class ArrayGenerator {
    // 用户无需生成一个ArrayGenerator的对象,因此将构造函数设置为私有
    private ArrayGenerator(){}
    //使用静态方法
    //生成一个数组,数组中的元素是顺序存放
    public static Integer[] generateOrderedArray(int n){
        //对线性查找进行测试,所以生成的数组中的元素就是[0...n-1]
        //其中n的大小是变化的,是用户进行输入指定
        Integer[] arr = new Integer[n];
        for (int i = 0; i < n; i++) {
            arr[i] = i;
        }
        return arr;
    }
}
 return arr;
    }
}


新建一个ArrayGenerator类,专门用于生成数组

数组生成中的方法采用静态方法,且用户无需生成一个ArrayGenerator的对象,因此将构造函数设置为私有

此处主要用于测试前面的线性查找算法的性能,所以生成的数组中的元素顺序存放,范围[ 0... n − 1 ] [0...n-1][0...n−1],其中n是由用户进行指定的

2.使用测试用例

public class LinearSearchGenerator {
    private LinearSearchGenerator(){}
    public static <E> int search(E[] data, E target) {
        for (int i = 0; i < data.length; i++) {
            if (data[i] == target)
                return i;    //如果找到目标,返回对应的索引值
        }
        return -1;          //如果没有找到目标,返回-1
    }
    public static void main(String[] args) {
        //准备用于查找的数组,数组中有100000个元素
        Integer[] data = ArrayGenerator.generateOrderedArray(100000);
        int res = LinearSearchGenerator.search(data, 100000);
        System.out.println(res); //输出res
    }
}


data数组直接使用ArrayGenerator.generateOrderedArray()生成

首次传入的参数为100000,并且将查找的target值设为100000

很明显,在一个元素个数只有100000的数组中,且数组的元素是顺序存放的[0…100000),查询是否有100000这个数的结果一定是-1

2.1 检验测试用例的用时

为了检验出对于这次查询,这次的函数调用具体消耗了多少时间,我们可以使用Java为我们提供的nanoTime()方法做一个计时

public class LinearSearchGenerator {
    private LinearSearchGenerator(){}
    public static <E> int search(E[] data, E target) {
        for (int i = 0; i < data.length; i++) {
            if (data[i] == target)
                return i;    //如果找到目标,返回对应的索引值
        }
        return -1;          //如果没有找到目标,返回-1
    }
    public static void main(String[] args) {
  int n = 100000;
        //准备用于查找的数组,数组中有100000个元素
        Integer[] data = ArrayGenerator.generateOrderedArray(n);
        //nanoTime()方法返回的其实是一个时间戳,
        // 是一个长整型,当前用纳秒计算的时间戳
        long startTime = System.nanoTime();
        int res = LinearSearchGenerator.search(data, n);
        System.out.println(res); //输出res
        long endTime = System.nanoTime();
        //endTime - startTime的值就是两个时间戳之间的线性查找所用的时间,单位是纳秒
        //纳秒与秒之间是10^9
        //对于结果可以是一个浮点数,所以除以1000000000.0
        double time = (endTime - startTime) / 1000000000.0;
        System.out.println(time + " s");
    }
}


nanoTime()方法返回的其实是一个时间戳,用纳秒计算

在线性查找算法前使用一次,在线性查找算法结束后使用一次

endTime - startTime的值就是两个时间戳之间的线性查找所用的时间,单位是纳秒

结果如下:

消耗时间也与硬件有关,所以时间不一定相同

2.1 不同规模的测试用例的用时比较

public class LinearSearchGenerator {
    private LinearSearchGenerator() {
    }
    public static <E> int search(E[] data, E target) {
        for (int i = 0; i < data.length; i++) {
            if (data[i] == target)
                return i;    //如果找到目标,返回对应的索引值
        }
        return -1;          //如果没有找到目标,返回-1
    }
    public static void main(String[] args) {
        //不同规模的数据
        int[] dataSize = {1000000, 10000000};
        for (int n : dataSize) {
            //准备用于查找的数组
            Integer[] data = ArrayGenerator.generateOrderedArray(n);
            //nanoTime()方法返回的其实是一个时间戳,
            // 是一个长整型,当前用纳秒计算的话时间戳
            long startTime = System.nanoTime();
            //对于每个规模的数据,可以通过增加查找次数来达到扩大时间规模的目的
            /*因为直接进行查找特别大的规模的数据,比如1亿个数据,
              尤其我们需要的是连续空间,在一般的计算机上可能也会费一点劲,
              我们通过多做几回,对100万个数据进行100次查找,时间也会相对稳定一些
             */
            for (int k = 0; k < 100; k++) {
                LinearSearchGenerator.search(data, n);
            }
            long endTime = System.nanoTime();
            //endTime - startTime的值就是两个时间戳之间的线性查找所用的时间,单位是纳秒
            //纳秒与秒之间是10^9
            //对于结果可以是一个浮点数,所以除以1000000000.0
            double time = (endTime - startTime) / 1000000000.0;
            System.out.println("n = " + n + ", 100runs: " + time + " s");
        }
    }
}


直接将不同规模的数据存放在数组中

int[] dataSize = {1000000, 10000000};

对于每个规模的数据,可以通过增加查找次数来达到扩大时间规模的目的

因为直接进行查找特别大的规模的数据,比如1亿个数据,尤其我们需要的是连续空间,在一般的计算机上可能也会费一点劲,我们通过多做几回,对100万个数据进行100次查找,时间也会相对稳定一些

并且多次测量就有多组数据,可以进行统计分析,计算平均值、标准差等

for (int k = 0; k < 100; k++) {
  LinearSearchGenerator.search(data, n);
}


对于1000000和10000000这两个规模的数据,分别执行查找100次,最后的结果如下:

消耗时间也与硬件有关,所以每次时间都不相同

从运行结果中,可以看到,对于100万级别的数据,进行100次的查询,大概是0.13s的时间,对于1000万级别,大概是0.7s的时间

0.7大概是0.13的5倍(其实有时候是6倍以上甚至10倍,这与计算机的性能有关),而我们第一次的数据规模是第二次的10倍

从侧面证明了线性查找法的时间复杂度是O ( n ) O(n)O(n)级别的,时间性能和数据规模之间是线性关系

时间复杂度描述的是随着n的增长相应的算法的性能增长的趋势其实就是这个意思


相关实践学习
通过性能测试PTS对云服务器ECS进行规格选择与性能压测
本文为您介绍如何利用性能测试PTS对云服务器ECS进行规格选择与性能压测。
相关文章
|
21天前
|
算法 数据处理 C语言
C语言中的位运算技巧,涵盖基本概念、应用场景、实用技巧及示例代码,并讨论了位运算的性能优势及其与其他数据结构和算法的结合
本文深入解析了C语言中的位运算技巧,涵盖基本概念、应用场景、实用技巧及示例代码,并讨论了位运算的性能优势及其与其他数据结构和算法的结合,旨在帮助读者掌握这一高效的数据处理方法。
33 1
|
25天前
|
机器学习/深度学习 算法 数据挖掘
K-means聚类算法是机器学习中常用的一种聚类方法,通过将数据集划分为K个簇来简化数据结构
K-means聚类算法是机器学习中常用的一种聚类方法,通过将数据集划分为K个簇来简化数据结构。本文介绍了K-means算法的基本原理,包括初始化、数据点分配与簇中心更新等步骤,以及如何在Python中实现该算法,最后讨论了其优缺点及应用场景。
76 4
|
22天前
|
存储 算法 搜索推荐
Python 中数据结构和算法的关系
数据结构是算法的载体,算法是对数据结构的操作和运用。它们共同构成了计算机程序的核心,对于提高程序的质量和性能具有至关重要的作用
|
22天前
|
数据采集 存储 算法
Python 中的数据结构和算法优化策略
Python中的数据结构和算法如何进行优化?
|
1月前
|
算法
数据结构之路由表查找算法(深度优先搜索和宽度优先搜索)
在网络通信中,路由表用于指导数据包的传输路径。本文介绍了两种常用的路由表查找算法——深度优先算法(DFS)和宽度优先算法(BFS)。DFS使用栈实现,适合路径问题;BFS使用队列,保证找到最短路径。两者均能有效查找路由信息,但适用场景不同,需根据具体需求选择。文中还提供了这两种算法的核心代码及测试结果,验证了算法的有效性。
96 23
|
21天前
|
并行计算 算法 测试技术
C语言因高效灵活被广泛应用于软件开发。本文探讨了优化C语言程序性能的策略,涵盖算法优化、代码结构优化、内存管理优化、编译器优化、数据结构优化、并行计算优化及性能测试与分析七个方面
C语言因高效灵活被广泛应用于软件开发。本文探讨了优化C语言程序性能的策略,涵盖算法优化、代码结构优化、内存管理优化、编译器优化、数据结构优化、并行计算优化及性能测试与分析七个方面,旨在通过综合策略提升程序性能,满足实际需求。
49 1
|
1月前
|
C语言
【数据结构】栈和队列(c语言实现)(附源码)
本文介绍了栈和队列两种数据结构。栈是一种只能在一端进行插入和删除操作的线性表,遵循“先进后出”原则;队列则在一端插入、另一端删除,遵循“先进先出”原则。文章详细讲解了栈和队列的结构定义、方法声明及实现,并提供了完整的代码示例。栈和队列在实际应用中非常广泛,如二叉树的层序遍历和快速排序的非递归实现等。
175 9
|
1月前
|
存储 算法
非递归实现后序遍历时,如何避免栈溢出?
后序遍历的递归实现和非递归实现各有优缺点,在实际应用中需要根据具体的问题需求、二叉树的特点以及性能和空间的限制等因素来选择合适的实现方式。
32 1
|
23天前
|
存储 缓存 算法
在C语言中,数据结构是构建高效程序的基石。本文探讨了数组、链表、栈、队列、树和图等常见数据结构的特点、应用及实现方式
在C语言中,数据结构是构建高效程序的基石。本文探讨了数组、链表、栈、队列、树和图等常见数据结构的特点、应用及实现方式,强调了合理选择数据结构的重要性,并通过案例分析展示了其在实际项目中的应用,旨在帮助读者提升编程能力。
43 5
|
1月前
|
存储 算法 Java
数据结构的栈
栈作为一种简单而高效的数据结构,在计算机科学和软件开发中有着广泛的应用。通过合理地使用栈,可以有效地解决许多与数据存储和操作相关的问题。
下一篇
DataWorks