8天玩转并行开发——第八天 用VS性能向导解剖你的程序

简介:

     最后一篇,我们来说说vs的“性能向导",通常我们调试程序的性能一般会使用Stopwatch,如果希望更加系统的了解程序,我们就需要

用到”性能向导“,通过性能报告便于我们快速的发现并找到潜在的性能问题。

 

首先我们上一段需要改进的代码:

using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Diagnostics;

namespace Test
{
    class Program
    {
        static object obj = new object();

        static void Main(string[] args)
        {
            var watch = Stopwatch.StartNew();

            var range = ParallelEnumerable.Range(1, 100000000);

            var query = (from n in range.AsParallel()
                         where n % 5 == 0
                         select Calculate(n)).Average();

            watch.Stop();

            Debug.WriteLine("耗费时间:{0}", watch.Elapsed);
            Console.WriteLine("耗费时间:{0}", watch.Elapsed);
        }

        /// <summary>
        /// 模拟复杂的数学计算
        /// </summary>
        /// <param name="num"></param>
        /// <returns></returns>
        static double Calculate(int num)
        {
            lock (obj)
            {
                var sqrt = Math.Sqrt(num);

                var pow = Math.Pow(sqrt, 5);

                var log10 = Math.Log10(pow);

                var floor = Math.Floor(log10);

                return floor;
            }
        }
    }
}

记住,我们的程序需要改成Release版本,因为这里包含了太多的优化信息。

 

找到”工具栏”->"分析"->"启动性能向导",选中“并发”->"可视化多线程应用程序的行为"。

然后选中我们的程序Test

 

最后点击完成,如果是第一次使用的话会提示你“是否立即配置符号”,这是因为我们的并行计算用到了window函数,所以我们调试的时候

需要加载这些符号。点击“是”,然后勾选“MicroSoft符号服务器”,点击确定就OK了。

 

稍等一会,我们会看到三种视图:CPU使用率,线程,内核。

然后我们进入“CPU使用率”,看看情况。

从图中:我们可以获知如下信息:

①:从图中的绿色破浪线可以看出,我们的程序确实是多核计算。

②:并行计算耗时16515ms,平均CPU使用率:39%。,这里要注意,性能剖析器也需要耗费CPU周期,所以执行时间要稍大于实际时间。

 

然后,我们点击“线程“tab,看看效果

 

通过点击各个”线程”的绿色小条,然后看下“分析报告”:发现程序被三个task承载执行:主线程(644),辅助线程(4824),辅助线程(1564)。

 

然后我们点击“可见时间线分析”中的“同步”,看看同步是由谁贡献出来的,清楚的看到Monitor.Enter,这是因为我的代码里面有lock。

而且阻塞时间还是蛮厉害的,这里就是我们可以优化的点。

 

接下来,我们看看“核心”标签

这个标签给我们展示的是:各个线程是如何的映射到可用逻辑处理器内核的,具体的也没有什么好说的。

 

刚才也说了,我们程序的Monitor那一块是一个优化点,仔细论证代码,我们发现lock锁是多余的,接下来我们要做的事情就是去掉lock,

然后看看效果:


static double Calculate(int num)
        {
                var sqrt = Math.Sqrt(num);

                var pow = Math.Pow(sqrt, 5);

                var log10 = Math.Log10(pow);

                var floor = Math.Floor(log10);

                return floor;
        }

 

 

最后我们发现,程序的执行时间确实加速了。不过这里面还有很多的东西等待挖掘,我也就简单的分析到此了。

最后希望大家能够在此系列中获取一丝营养。


相关文章
|
机器学习/深度学习 存储 并行计算
一篇就够:高性能推理引擎理论与实践 (TensorRT)
本文分享了关于 NVIDIA 推出的高性能的深度学习推理引擎 TensorRT 的背后理论知识和实践操作指南。
14903 9
一篇就够:高性能推理引擎理论与实践 (TensorRT)
|
Oracle 网络协议 关系型数据库
Oracle会话超时设置1:在sqlnet.ora和listener.ora中设置
这篇文章是Oracle会话超时设置的第一个文章,简述和Oracle 数据库 net services有关的会话超时管理。
2220 0
Oracle会话超时设置1:在sqlnet.ora和listener.ora中设置
|
机器学习/深度学习 并行计算 异构计算
NVIDIA CUDA/cuDNN历代版本下载地址
NVIDIA CUDA/cuDNN历代版本下载地址
5107 0
NVIDIA CUDA/cuDNN历代版本下载地址
|
关系型数据库 MySQL PostgreSQL
MySQL和PostgreSQL的常用语法差异
背景 在去年的DBMS评比中,PostgreSQL夺冠,PostgreSQL一直保持上升姿态,越来越多的客户选择使用PostgreSQL,还有一部分客户从MySQL迁往PostgreSQL,那PostgreSQL和MySQL对于开发者来说的差异在哪里呢?末学对比了下语法差异,不一样的地方用红色标记了出来,供大家参考。
14309 0
|
存储 算法 数据处理
|
12月前
|
存储 缓存 监控
ClickHouse 架构原理及核心特性详解
ClickHouse 是由 Yandex 开发的开源列式数据库,专为 OLAP 场景设计,支持高效的大数据分析。其核心特性包括列式存储、字段压缩、丰富的数据类型、向量化执行和分布式查询。ClickHouse 通过多种表引擎(如 MergeTree、ReplacingMergeTree、SummingMergeTree)优化了数据写入和查询性能,适用于电商数据分析、日志分析等场景。然而,它在事务处理、单条数据更新删除及内存占用方面存在不足。
3857 21
|
程序员 开发者 Python
探索Python中的装饰器:从基础到高级应用
本文旨在全面解析Python中一个强大而灵活的特性——装饰器(Decorators)。我们将从装饰器的基本定义出发,逐步深入到它们的高级应用。通过具体的代码示例和详细的解释,读者将能够掌握如何有效地使用装饰器来增强函数和类的功能,以及如何创建自定义装饰器来解决特定问题。无论是Python初学者还是经验丰富的开发者,都能在本文中找到有价值的内容,以提升编程技巧和代码质量。
400 1
|
Linux C++
linux系统中QT里面多线程的使用方法
linux系统中QT里面多线程的使用方法
446 0
|
机器学习/深度学习 供应链 监控
ERP系统中的供应链风险识别与应对策略解析
【7月更文挑战第25天】 ERP系统中的供应链风险识别与应对策略解析
1052 1
|
Docker 容器
docker启动,重启,关闭命令
docker启动,重启,关闭命令
367 0