C#异步笔记

0x00 异步编程模式的历史

.NET Framework 提供了执行异步操作的三种模式:

  • 异步编程模型 (APM) 模式(即 IAsyncResult 模式),在该模式下,异步操作需要使用 Begin 和 End 方法(例如,异步写入操作需要使用 BeginWrite 和 EndWrite 方法) 不建议新的开发使用此模式。 有关详细信息,请参阅异步编程模型 (APM)

  • 基于事件的异步模式 (EAP),这种模式需要 Async 后缀,也需要一个或多个事件、事件处理程序委托类型和 EventArg 派生类型。 EAP 是在 .NET Framework 2.0 中引入的。 不建议新的开发使用这种模式。 有关详细信息,请参阅基于事件的异步模式 (EAP)

  • 基于任务的异步模式 (TAP),该模式使用单一方法表示异步操作的开始和完成。 TAP 是在 .NET Framework 4 中引入的,并且它是在 .NET Framework 中进行异步编程的推荐使用方法。 C# 中的 async 和 await 关键词以及 Visual Basic 语言中的 Async 和 Await 运算符为 TAP 添加了语言支持。 有关详细信息,请参阅基于任务的异步模式 (TAP)

现在主要使用TAP来编程。

 

0x01 Task和 Task<T>

任务是用于实现称之为并发 Promise 模型的构造。 简单地说,它们“承诺”,会在稍后完成工作,让你使用干净的 API 与 promise 协作。

  • Task 表示不返回值的单个操作。
  • Task<T> 表示返回 T 类型的值的单个操作。

请务必将任务理解为工作的异步抽象,而非在线程之上的抽象。 默认情况下,任务在当前线程上执行,且在适当时会将工作委托给操作系统。 可选择性地通过 Task.Run API 显式请求任务在独立线程上运行。

任务会公开一个 API 协议来监视、等候和访问任务的结果值(如 Task<T>)。 含有 await关键字的语言集成可提供高级别抽象来使用任务。

任务运行时,使用 await 在任务完成前将控制让步于其调用方,可让应用程序和服务执行有用工作。 任务完成后代码无需依靠回调或事件便可继续执行。 语言和任务 API 集成会为你完成此操作。 如果正在使用 Task<T>,任务完成时,await 关键字还将“打开”返回的值。下面进一步详细介绍了此工作原理。

0x02 针对 I/O 的操作的Task

以下部分介绍了使用典型异步 I/O 调用时会出现的各种情况。 我们先看两个例子。

第一个示例调用异步方法,并返回活动任务,很可能尚未完成。

C#
public Task<string> GetHtmlAsync() { // Execution is synchronous here var client = new HttpClient(); return client.GetStringAsync("http://www.dotnetfoundation.org"); } 

第二个示例还使用了 async 和 await 关键字对任务进行操作。

C#
public async Task<string> GetFirstCharactersCountAsync(string url, int count) { // Execution is synchronous here var client = new HttpClient(); // Execution of GetFirstCharactersCountAsync() is yielded to the caller here // GetStringAsync returns a Task<string>, which is *awaited* var page = await client.GetStringAsync("http://www.dotnetfoundation.org"); // Execution resumes when the client.GetStringAsync task completes, // becoming synchronous again. if (count > page.Length) { return page; } else { return page.Substring(0, count); } } 

对 GetStringAsync() 的调用通过低级别 .NET 库进行(可能是调用其他异步方法),直到其到达 P/Invoke 互操作调用,进入本机网络库。 本机库随后可能会调入系统 API 调用(例如 Linux 上套接字的 write())。 可能会使用 TaskCompletionSource 在本机/托管边界创建一个任务对象。 将通过层向上传递任务对象,对其进行操作或直接返回,最后返回到初始调用方。

在上述的第二个示例中,Task<T> 对象将直接从 GetStringAsync 返回。 由于使用了 await 关键字,因此该方法会返回一个新建的任务对象。 控制会从 GetFirstCharactersCountAsync 方法中的该位置返回到调用方。 Task<T> 对象的方法和属性确保调用方监视任务进度,当执行完 GetFirstCharactersCountAsync 中剩余的代码时,任务便完成。

调用系统 API 后,请求位于内核空间,一路来到操作系统的网络子系统(例如 Linux 内核中的 /net)。 此处操作系统将对网络请求进行异步处理。 所用操作系统不同,细节可能有所不同(可能会将设备驱动程序调用安排为发送回运行时的信号,或者会执行设备驱动程序调用然后有一个信号发送回来),但最终都会通知运行时网络请求正在进行中。 此时,设备驱动程序工作处于已计划、正在进行或是已完成(请求已“通过网络”发出),但由于这些均为异步进行,设备驱动程序可立即着手处理其他事项!

例如,在 Windows 中操作系统线程调用网络设备驱动程序并要求它通过表示操作的中断请求数据包 (IRP) 执行网络操作。 设备驱动程序接收 IRP,调用网络,将 IRP 标记为“待定”,并返回到操作系统。 由于现在操作系统线程了解到 IRP 为“待定”,因此无需再为此作业进行进一步操作,将其“返回”,这样它就可用于完成其他工作。

请求完成且数据通过设备驱动程序返回后,会经由中断通知 CPU 新接收到的数据。 处理中断的方式因操作系统不同而有所不同,但最终都会通过操作系统将数据传递到系统互操作调用(例如,Linux 中的中断处理程序将安排 IRQ 的下半部分通过操作系统异步向上传递数据)。 请注意这仍是异步进行的! 在下一个可用线程能执行异步方法且“打开”已完成任务的结果前,结果会排队等候。

在整个过程中,关键点在于没有线程专用于运行任务。 尽管需要在一些上下文中执行工作(即,操作系统确实必须将数据传递到设备驱动程序并响应中断),但没有专用于等待数据从请求返回的线程。 这让系统能处理更多的工作而不是等待某些 I/O 调用结束。

这对服务器方案而言意味着什么?

此模型可很好地处理典型的服务器方案工作负荷。 由于没有专用于阻止未完成任务的线程,服务器线程池可服务更多的 Web 请求。相比服务器将线程专用于接收到的每个请求,使用 async 和 await 能够使服务器多处理一个数量级的请求。

这对客户端方案而言意味着什么?

使用 async 和 await 对客户端应用带来的最大好处在于提高了响应能力。 尽管可以手动生成线程让应用响应,但相比仅使用 async 和 await,生成线程的操作更加昂贵。 特别是对于手机游戏等应用而言,在涉及 I/O 时尽可能少地影响 UI 线程,这点至关重要。

更重要的是,由于绑定 I/O 的工作在 CPU 上几乎没有耗时,所以将整个 CPU 线程专用于执行几乎没有任何作用的工作将是一种资源浪费。

此外,使用 async 方法将工作调度到 UI 线程(例如,更新 UI)十分简单,且无需额外的工作(例如调用线程安全的委托)。

 

0x03 针对 CPU 的操作的Task

绑定 CPU 的 async 代码与绑定 I/O 的 async 代码有些许不同。 由于工作在 CPU 上执行,无法解决线程专用于计算的问题。 async 和 await 的运用使得可以与后台线程交互并让异步方法调用方可响应。 请注意这不会为共享数据提供任何保护。 如果正在使用共享数据,仍需要采用合适的同步策略。

这里详细介绍了绑定 CPU 的异步调用的方方面面:

C#
public async Task<int> CalculateResult(InputData data) { // This queues up the work on the threadpool. var expensiveResultTask = Task.Run(() => DoExpensiveCalculation(data)); // Note that at this point, you can do some other work concurrently, // as CalculateResult() is still executing! // Execution of CalculateResult is yielded here! var result = await expensiveResultTask; return result; } 

CalculateResult() 在调用它的线程上执行。 调用 Task.Run 时,它会在线程池上对昂贵的绑定 CPU 的操作 DoExpensiveCalculation() 进行排队,并收到一个 Task<int> 句柄。DoExpensiveCalculation() 最终在下一个可用线程上并行运行(很可能在另一个 CPU 内核上)。 当 DoExpensiveCalculation() 在另一线程处理任务时,由于调用 CalculateResult() 的线程仍在执行,这时可能会出现并行工作的情况。

一旦遇到 awaitCalculateResult() 执行会让步于调用方,在 DoExpensiveCalculation() 执行运算的同时,允许其他任务在当前线程执行。DoExpensiveCalculation() 完成后,结果会在主线程上排队等待运行。 最后,主线程将返回执行得到 DoExpensiveCalculation() 结果的 CalculateResult()

异步为什么在此处会起作用?

async 和 await 是在需要可响应性时管理绑定 CPU 的工作的最佳实践。 存在多个可将异步用于绑定 CPU 的工作的模式。 请务必注意,使用异步成本有少许费用,不推荐紧凑循环使用它。 如何编写此新功能的代码完全取决于你。

 

0x04 异步方法的运行机制

异步编程中最需弄清的是控制流是如何从方法移动到方法的。 下图可引导你完成该过程。

关系图中的数值对应于以下步骤。

    1. 事件处理程序调用并等待 AccessTheWebAsync 异步方法。

    2. AccessTheWebAsync 可创建 HttpClient 实例并调用 GetStringAsync 异步方法以下载网站内容作为字符串。

    3. GetStringAsync 中发生了某种情况,该情况挂起了它的进程。 可能必须等待网站下载或一些其他阻止活动。 为避免阻止资源,GetStringAsync 会将控制权出让给其调用方 AccessTheWebAsync

      GetStringAsync 返回 Task<TResult>,其中 TResult 为字符串,并且 AccessTheWebAsync 将任务分配给 getStringTask 变量。 该任务表示调用 GetStringAsync 的正在进行的进程,其中承诺当工作完成时产生实际字符串值。

    4. 由于尚未等待 getStringTask,因此,AccessTheWebAsync 可以继续执行不依赖于 GetStringAsync 得出的最终结果的其他工作。 该任务由对同步方法 DoIndependentWork 的调用表示。

    5. DoIndependentWork 是完成其工作并返回其调用方的同步方法。

    6. AccessTheWebAsync 已用完工作,可以不受 getStringTask 的结果影响。 接下来,AccessTheWebAsync 需要计算并返回该下载字符串的长度,但该方法仅在具有字符串时才能计算该值。

      因此,AccessTheWebAsync 使用一个 await 运算符来挂起其进度,并把控制权交给调用 AccessTheWebAsync 的方法。 AccessTheWebAsync 将 Task<int> 返回给调用方。 该任务表示对产生下载字符串长度的整数结果的一个承诺。

      备注

      如果 GetStringAsync(因此 getStringTask)在 AccessTheWebAsync 等待前完成,则控制会保留在 AccessTheWebAsync 中。 如果异步调用过程 (getStringTask) 已完成,并且 AccessTheWebSync 不必等待最终结果,则挂起然后返回到 AccessTheWebAsync 将造成成本浪费。

      在调用方内部(此示例中的事件处理程序),处理模式将继续。 在等待结果前,调用方可以开展不依赖于 AccessTheWebAsync 结果的其他工作,否则就需等待片刻。 事件处理程序等待 AccessTheWebAsync,而 AccessTheWebAsync 等待 GetStringAsync

    7. GetStringAsync 完成并生成一个字符串结果。 字符串结果不是通过按你预期的方式调用 GetStringAsync 所返回的。 (记住,该方法已返回步骤 3 中的一个任务)。相反,字符串结果存储在表示 getStringTask 方法完成的任务中。 await 运算符从 getStringTask 中检索结果。 赋值语句将检索到的结果赋给 urlContents

    8. 当 AccessTheWebAsync 具有字符串结果时,该方法可以计算字符串长度。 然后,AccessTheWebAsync 工作也将完成,并且等待事件处理程序可继续使用。 在此主题结尾处的完整示例中,可确认事件处理程序检索并打印长度结果的值。
      如果你不熟悉异步编程,请花 1 分钟时间考虑同步行为和异步行为之间的差异。 当其工作完成时(第 5 步)会返回一个同步方法,但当其工作挂起时(第 3 步和第 6 步),异步方法会返回一个任务值。 在异步方法最终完成其工作时,任务会标记为已完成,而结果(如果有)将存储在任务中。

 

0x05 命名约定

按照约定,将“Async”追加到包含 async 修饰符的方法的名称中。

如果某一约定中的事件、基类或接口协定建议其他名称,则可以忽略此约定。 例如,你不应重命名常用事件处理程序,例如 Button1_Click