.NET的并发编程(TPL编程)是什么? (下)

简介: .NET的并发编程(TPL编程)是什么? (下)

2.3 CPU的发展

      过去,CPU速度一直随着时间在变快。所以,在一台旧机器上运行得慢的程序在新机器上一般会快些。然而,CPU 厂商没有延续CPU越来越快的趋势。由于CPU厂商不能做到一直提升CPU的速度,所以它们侧重于将晶体管做得越来越小,使一个芯片上能够容纳更多的晶体管。今天,一个硅芯片可以容纳2个或者更多的CPU内核。这样一来,如果在写软件时能利用多个内核,软件就能运行得更快些。

今天的计算机使用了以下三种多CPU技术。

  1. 多个CPU
  2. 超线程芯片
  3. 多核芯片

2.4 使用线程的理由

使用线程有以下三方面的理由。

  1. 使用线程可以将代码同其他代码隔离
          这将提高应用程序的可靠性。事实上,这正是Windows在操作系统中引入线程概念的原因。Windows之所以需要线程来获得可靠性,是因为你的应用程序对于操作系统来说是的第三方组件,而微软不会在你发布应用程序之前对这些代码进行验证。如果你的应用程序支持加载由其它厂商生成的组件,那么应用程序对健壮性的要求就会很高,使用线程将有助于满足这个需求。
  2. 可以使用线程来简化编码
          有的时候,如果通过一个任务自己的线程来执行该任务,或者说单独一个线程来处里该任务,编码会变得更简单。但是,如果这样做,肯定要使用额外的资源,也不是十分“经济”(没有使用尽量少的代码达到目的)。现在,即使要付出一些资源作为代价,我也宁愿选择简单的编码过程。否则,干脆坚持一直用机器语言写程序好了,完全没必要成为一名C#开发人员。但有的时候,一些人在使用线程时,觉得自己选择了一种更容易的编码方式,但实际上,它们是将事情(和它们的代码)大大复杂化了。通常,在你引入线程时,引入的是要相互协作的代码,它们可能要求线程同步构造知道另一个线程在什么时候终止。一旦开始涉及协作,就要使用更多的资源,同时会使代码变得更复杂。所以,在开始使用线程之前,务必确定线程真的能够帮助你。
  3. 可以使用线程来实现并发执行
          如果(而且只有)知道自己的应用程序要在多CPU机器上运行,那么让多个任务同时运行,就能提高性能。现在安装了多个CPU(或者一个多核CPU)的机器相当普遍,所以设计应用程序来使用多个内核是有意义的。

回到顶部

3 数据并行(Data Parallelism)

3.1 数据并行

      数据并行是指对源集合或数组中的元素同时(即并行)执行相同操作的情况。在数据并行操作中,源集合被分区,以便多个线程可以同时在不同的段上操作。

数据并行性是指对源集合或数组中的元素同时任务并行库(TPL)通过system.threading.tasks.parallel类支持数据并行。这个类提供了for和for each循环的基于方法的并行实现。

您为parallel.for或parallel.foreach循环编写循环逻辑,就像编写顺序循环一样。您不必创建线程或将工作项排队。在基本循环中,您不必使用锁。底层工作TPL已经帮你处理。

下面代码展示顺序和并行:

// Sequential version            
foreach (var item in sourceCollection)
{
    Process(item);
}
// Parallel equivalent
Parallel.ForEach(sourceCollection, item => Process(item));

并行循环运行时,TPL对数据源进行分区,以便循环可以同时在多个部分上运行。在后台,任务调度程序根据系统资源和工作负载对任务进行分区。如果工作负载变得不平衡,调度程序会在多个线程和处理器之间重新分配工作。

下面的代码来展示如何通过Visual Studio调试代码:

public static void test()
        {
            int[] nums = Enumerable.Range(0, 1000000).ToArray();
            long total = 0;
            // Use type parameter to make subtotal a long, not an int
            Parallel.For<long>(0, nums.Length, () => 0, (j, loop, subtotal) =>
            {
                subtotal += nums[j];
                return subtotal;
            },
                (x) => Interlocked.Add(ref total, x)
            );
            Console.WriteLine("The total is {0:N0}", total);
            Console.WriteLine("Press any key to exit");
            Console.ReadKey();
        }
  • 选择调试 > 开始调试,或按F5。
  • 应用在调试模式下启动,并会在断点处暂停。
  • 在中断模式下打开线程通过选择窗口调试 > Windows > 线程。 您必须位于一个调试会话以打开或请参阅线程和其他调试窗口。

3.2 Parallel.For剖析

查看Parallel.For的底层,

public static ParallelLoopResult For<TLocal>(int fromInclusive, int toExclusive, Func<TLocal> localInit, Func<int, ParallelLoopState, TLocal, TLocal> body, Action<TLocal> localFinally);

清楚的看到有个func函数,看起来很熟悉。

[TypeForwardedFrom("System.Core, Version=3.5.0.0, Culture=Neutral, PublicKeyToken=b77a5c561934e089")]
    public delegate TResult Func<out TResult>();

原来是定义的委托,有多个重载,具体查看文档:https://docs.microsoft.com/en-us/dotnet/api/system.func-4?view=netframework-4.7.2

实际上TPL之前,实现并发或多线程,基本都要使用委托。

TIP:关于委托,大家可以查看(https://docs.microsoft.com/en-us/dotnet/csharp/tour-of-csharp/delegates)。或者《细说委托》(https://www.cnblogs.com/laoyu/archive/2013/01/13/2859000.html)

回到顶部

4 数据和任务并行中潜在的缺陷

      在许多情况下,parallel.for和parallel.foreach可以比普通的顺序循环提供显著的性能改进。然而,并行循环的工作引入了复杂性,这可能会导致在顺序代码中不常见或根本不会遇到的问题。本主题列举了一些实践来帮您避免这些问题,当你在写并行代码的时候。

4.1 不要假设并行总是很快

     在某些情况下,并行循环的运行速度可能比其顺序等效循环慢。基本的经验法则是,具有很少迭代和快速用户委托的并行循环不太可能加快速度。但是,由于有很多因素会影响性能,我建议您测量实际结果。

4.2 避免写入共享缓存

     在顺序代码中,读写静态变量或者字段是很正常的。然而,每当多个线程同时访问这些变量时,就有很大的竞争条件潜力。即使您可以使用锁来同步对变量的访问,同步成本也会损害性能。因此,我们建议您尽可能避免或至少限制对并行循环中共享状态的访问。最好的方式是使用Parallel.For 和 Parallel.ForEach的重载方法,在并行循环期间,它们使用System.Threading.ThreadLocal泛型类型的变量来存储线程本地状态。通过使用并行循环,您将产生划分源集合和同步工作线程的开销。并行化的好处进一步受到计算机上处理器数量的限制。在一个处理器上运行多个计算绑定线程并不能加快速度。因此,要注意不要过度使用并行。

过度使用并行最常见的场景发生在嵌套循环中。在大多数情况下,最好仅在外层循环使用并行,除非以下几种场景适用:

  • 内层循环很长
  • 您正在对每笔订单执行昂贵的计算。
  • 目标系统有足够的处理器来处理通过并行处理对客户订单的查询而产生的线程数。

在所有情况下,确定最佳查询形状的最佳方法都是测试和度量。

4.3 避免调用非线程安全的方法

      从并行循环中写入非线程安全的实例方法可能会导致数据损坏,这在程序中可能会被检测到,也可能不会被检测到。它可能导致异常。在以下示例中,多线程会尝试同时调用FileStream.WriteByte方法,但是这个是不被支持的。

FileStream fs = File.OpenWrite(path);
byte[] bytes = new Byte[10000000];
// ...
Parallel.For(0, bytes.Length, (i) => 

参考文献:

  1. https://docs.microsoft.com/en-us/dotnet/standard/parallel-programming/
  2. https://docs.microsoft.com/en-us/dotnet/csharp/tour-of-csharp/delegates
  3. https://www.cnblogs.com/laoyu/archive/2013/01/13/2859000.html
  4. 《C#并发经典实例》
  5. 《CLR via C#》第3版
  6. https://www.52interview.com/solutions/38
相关文章
|
1天前
|
Go 开发者
Golang深入浅出之-HTTP客户端编程:使用net/http包发起请求
【4月更文挑战第24天】Go语言的`net/http`包在HTTP客户端编程中扮演重要角色,但使用时需注意几个常见问题:1) 检查HTTP状态码以确保请求成功;2) 记得关闭响应体以防止资源泄漏;3) 设置超时限制,避免长时间等待;4) 根据需求处理重定向。理解这些细节能提升HTTP客户端编程的效率和质量。
11 1
|
4月前
|
人工智能 机器人 C#
Windows编程课设(C#)——基于WPF和.net的即时通讯系统(仿微信)
一款参考QQ、微信的即时通讯软件。采用CS结构,客户端基于.Net与WPF开发,服务端使用Java开发。
|
7月前
|
人工智能 自然语言处理 程序员
.NET开发工作效率提升利器 - CodeGeeX AI编程助手
.NET开发工作效率提升利器 - CodeGeeX AI编程助手
139 0
|
7月前
|
人工智能 自然语言处理 程序员
.NET开发工作效率提升利器 - CodeGeeX AI编程助手
.NET开发工作效率提升利器 - CodeGeeX AI编程助手
106 1
|
9月前
|
SQL 开发框架 缓存
|
11月前
|
人工智能 机器人 API
.NET面向AI编程——SK框架(SemanticKernel)的简易入门实践
随着ChatGPT开始在各个领域遍地开花,有关的应用也开始层出不穷。随着微软开源SK框架,无疑是给.NET开发者带来面向AI应用的新机遇。以下内容,通过创建一个简单的prompt开始,开发一个使用SK框架进行开发的入门教程,供参考。
214 0
|
存储 Go 网络架构
Go HTTP 编程 | 02 - net/http 包剖析
Go HTTP 编程 | 02 - net/http 包剖析
Go HTTP 编程 | 02 - net/http 包剖析
C#编程-140:Net.Mail类发送邮件
C#编程-140:Net.Mail类发送邮件
C#编程-140:Net.Mail类发送邮件
C#编程-64:ADO.NET对象模型复习笔记
C#编程-64:ADO.NET对象模型复习笔记
C#编程-64:ADO.NET对象模型复习笔记
|
3月前
|
开发框架 前端开发 .NET
ASP.NET CORE 3.1 MVC“指定的网络名不再可用\企图在不存在的网络连接上进行操作”的问题解决过程
ASP.NET CORE 3.1 MVC“指定的网络名不再可用\企图在不存在的网络连接上进行操作”的问题解决过程
43 0