This commit is contained in:
louzefeng
2024-07-11 05:50:32 +00:00
parent bf99793fd0
commit d3828a7aee
6071 changed files with 0 additions and 0 deletions

View File

@@ -0,0 +1,237 @@
<audio id="audio" title="15 | 消息队列和事件循环:页面是怎么“活”起来的?" controls="" preload="none"><source id="mp3" src="https://static001.geekbang.org/resource/audio/39/c2/39407fedc5ad363289679a42aa7203c2.mp3"></audio>
前面我们讲到了每个渲染进程都有一个主线程并且主线程非常繁忙既要处理DOM又要计算样式还要处理布局同时还需要处理JavaScript任务以及各种输入事件。要让这么多不同类型的任务在主线程中有条不紊地执行这就需要一个系统来统筹调度这些任务这个统筹调度系统就是我们今天要讲的消息队列和事件循环系统。
在写这篇文章之前,我翻阅了大量的资料,却发现没有一篇文章能把消息循环系统给讲清楚的,所以我决定用一篇文章来专门介绍页面的事件循环系统。事件循环非常底层且非常重要,学会它能让你理解页面到底是如何运行的, 所以在本篇文章中,我们会将页面的事件循环给梳理清楚、讲透彻。
为了能让你更加深刻地理解事件循环机制,我们就从最简单的场景来分析,然后带你一步步了解浏览器页面主线程是如何运作的。
需要说明的是文章中的代码我会采用C++来示范。如果你不熟悉C++也没有关系这里并没有涉及到任何复杂的知识点只要你了解JavaScript或Python你就会看懂。
## 使用单线程处理安排好的任务
我们先从最简单的场景讲起,比如有如下一系列的任务:
- 任务11+2
- 任务220/5
- 任务37*8
- 任务4打印出任务1、任务2、任务3的运算结果
现在要在一个线程中去执行这些任务,通常我们会这样编写代码:
```
void MainThread(){
int num1 = 1+2; //任务1
int num2 = 20/5; //任务2
int num3 = 7*8; //任务3
print(&quot;最终计算的值为:%d,%d,%d&quot;,num1,num2,num3) //任务4
}
```
在上面的执行代码中,我们把所有任务代码按照顺序写进主线程里,等线程执行时,这些任务会按照顺序在线程中依次被执行;等所有任务执行完成之后,线程会自动退出。可以参考下图来直观地理解下其执行过程:
<img src="https://static001.geekbang.org/resource/image/72/bc/72726678ac6604116c1d5dad160780bc.png" alt="">
## 在线程运行过程中处理新任务
但并不是所有的任务都是在执行之前统一安排好的大部分情况下新的任务是在线程运行过程中产生的。比如在线程执行过程中又接收到了一个新的任务要求计算“10+2”那上面那种方式就无法处理这种情况了。
**要想在线程运行过程中,能接收并执行新的任务,就需要采用事件循环机制**。我们可以通过一个for循环语句来监听是否有新的任务如下面的示例代码
```
//GetInput
//等待用户从键盘输入一个数字,并返回该输入的数字
int GetInput(){
int input_number = 0;
cout&lt;&lt;&quot;请输入一个数:&quot;;
cin&gt;&gt;input_number;
return input_number;
}
//主线程(Main Thread)
void MainThread(){
for(;;){
int first_num = GetInput()
int second_num = GetInput()
result_num = first_num + second_num;
print(&quot;最终计算的值为:%d&quot;,result_num)
}
}
```
相较于第一版的线程,这一版的线程做了两点改进。
- **第一点引入了循环机制**,具体实现方式是在线程语句最后添加了一个**for循环语句**,线程会一直循环执行。
- **第二点是引入了事件**,可以在线程运行过程中,等待用户输入的数字,等待过程中线程处于暂停状态,一旦接收到用户输入的信息,那么线程会被激活,然后执行相加运算,最后输出结果。
通过引入事件循环机制,就可以让该线程“活”起来了,我们每次输入两个数字,都会打印出两数字相加的结果,你可以结合下图来参考下这个改进版的线程:
<img src="https://static001.geekbang.org/resource/image/9e/e3/9e0f595324fbd5b7cd1c1ae1140f7de3.png" alt="">
## 处理其他线程发送过来的任务
上面我们改进了线程的执行方式,引入了事件循环机制,可以让其在执行过程中接受新的任务。不过在第二版的线程模型中,所有的任务都是来自于线程内部的,如果另外一个线程想让主线程执行一个任务,利用第二版的线程模型是无法做到的。
那下面我们就来看看其他线程是如何发送消息给渲染主线程的,具体形式你可以参考下图:
<img src="https://static001.geekbang.org/resource/image/2e/05/2eb6a8ecb7cb528da4663573d74eb305.png" alt="">
从上图可以看出渲染主线程会频繁接收到来自于IO线程的一些任务接收到这些任务之后渲染进程就需要着手处理比如接收到资源加载完成的消息后渲染进程就要着手进行DOM解析了接收到鼠标点击的消息后渲染主线程就要开始执行相应的JavaScript脚本来处理该点击事件。
那么如何设计好一个线程模型,能让其能够接收其他线程发送的消息呢?
一个通用模式是使用**消息队列**。在解释如何实现之前,我们先说说什么是消息队列,可以参考下图:
<img src="https://static001.geekbang.org/resource/image/6d/5e/6d141ec0925590d83d97a37cce8e6f5e.png" alt="">
从图中可以看出,**消息队列是一种数据结构,可以存放要执行的任务**。它符合队列“**先进先出**”的特点,也就是说**要添加任务的话,添加到队列的尾部;要取出任务的话,从队列头部去取**。
有了队列之后,我们就可以继续改造线程模型了,改造方案如下图所示:
<img src="https://static001.geekbang.org/resource/image/2a/ab/2ac6bc0361cb4690c5cc83d8abad22ab.png" alt="">
从上图可以看出,我们的改造可以分为下面三个步骤:
1. 添加一个消息队列;
1. IO线程中产生的新任务添加进消息队列尾部
1. 渲染主线程会循环地从消息队列头部中读取任务,执行任务。
有了这些步骤之后,那么接下来我们就可以**按步骤使用代码来实现第三版的线程模型**。
首先,构造一个队列。当然,在本篇文章中我们不需要考虑队列实现的细节,只是构造队列的接口:
```
class TaskQueue{
public:
Task takeTask(); //取出队列头部的一个任务
void pushTask(Task task); //添加一个任务到队列尾部
};
```
接下来,改造主线程,让主线程从队列中读取任务:
```
TaskQueue task_queue
void ProcessTask();
void MainThread(){
for(;;){
Task task = task_queue.takeTask();
ProcessTask(task);
}
}
```
在上面的代码中我们添加了一个消息队列的对象然后在主线程的for循环代码块中从消息队列中读取一个任务然后执行该任务主线程就这样一直循环往下执行因此只要消息队列中有任务主线程就会去执行。
主线程的代码就这样改造完成了。这样改造后,主线程执行的任务都全部从消息队列中获取。所以如果有其他线程想要发送任务让主线程去执行,只需要将任务添加到该消息队列中就可以了,添加任务的代码如下:
```
Task clickTask;
task_queue.pushTask(clickTask)
```
由于是多个线程操作同一个消息队列,所以在添加任务和取出任务时还会加上一个同步锁,这块内容你也要注意下。
## 处理其他进程发送过来的任务
通过使用消息队列我们实现了线程之间的消息通信。在Chrome中跨进程之间的任务也是频繁发生的那么如何处理其他进程发送过来的任务你可以参考下图
<img src="https://static001.geekbang.org/resource/image/e2/c6/e2582e980632fd2df5043f81a11461c6.png" alt="">
从图中可以看出,**渲染进程专门有一个IO线程用来接收其他进程传进来的消息**,接收到消息之后,会将这些消息组装成任务发送给渲染主线程,后续的步骤就和前面讲解的“处理其他线程发送的任务”一样了,这里就不再重复了。
## 消息队列中的任务类型
现在你知道页面主线程是如何接收外部任务的了,那接下来我们再来看看消息队列中的任务类型有哪些。你可以参考下[Chromium的官方源码](https://cs.chromium.org/chromium/src/third_party/blink/public/platform/task_type.h)这里面包含了很多内部消息类型如输入事件鼠标滚动、点击、移动、微任务、文件读写、WebSocket、JavaScript定时器等等。
除此之外消息队列中还包含了很多与页面相关的事件如JavaScript执行、解析DOM、样式计算、布局计算、CSS动画等。
以上这些事件都是在主线程中执行的所以在编写Web应用时你还需要衡量这些事件所占用的时长并想办法解决单个任务占用主线程过久的问题。
## 如何安全退出
当页面主线程执行完成之后又该如何保证页面主线程能够安全退出呢Chrome是这样解决的确定要退出当前页面时页面主线程会设置一个退出标志的变量在每次执行完一个任务时判断是否有设置退出标志。
如果设置了,那么就直接中断当前的所有任务,退出线程,你可以参考下面代码:
```
TaskQueue task_queue
void ProcessTask();
bool keep_running = true;
void MainThread(){
for(;;){
Task task = task_queue.takeTask();
ProcessTask(task);
if(!keep_running) //如果设置了退出标志,那么直接退出线程循环
break;
}
}
```
## 页面使用单线程的缺点
上面讲述的就是页面线程的循环系统是如何工作的,那接下来,我们继续探讨页面线程的一些特征。
通过上面的介绍,你应该清楚了,页面线程所有执行的任务都来自于消息队列。消息队列是“先进先出”的属性,也就是说放入队列中的任务,需要等待前面的任务被执行完,才会被执行。鉴于这个属性,就有如下两个问题需要解决。
**第一个问题是如何处理高优先级的任务。**
比如一个典型的场景是监控DOM节点的变化情况节点的插入、修改、删除等动态变化然后根据这些变化来处理相应的业务逻辑。一个通用的设计的是利用JavaScript设计一套监听接口当变化发生时渲染引擎同步调用这些接口这是一个典型的观察者模式。
不过这个模式有个问题因为DOM变化非常频繁如果每次发生变化的时候都直接调用相应的JavaScript接口那么这个当前的任务执行时间会被拉长从而导致**执行效率的下降**。
如果将这些DOM变化做成异步的消息事件添加到消息队列的尾部那么又会影响到监控的实时性因为在添加到消息队列的过程中可能前面就有很多任务在排队了。
这也就是说如果DOM发生变化采用同步通知的方式会影响当前任务的**执行效率**;如果采用异步方式,又会影响到**监控的实时性**。
那该如何权衡**效率**和**实时性**呢?
针对这种情况,微任务就应用而生了,下面我们来看看微任务是如何权衡效率和实时性的。
通常我们把消息队列中的任务称为**宏任务**,每个宏任务中都包含了一个**微任务队列**在执行宏任务的过程中如果DOM有变化那么就会将该变化添加到微任务列表中这样就不会影响到宏任务的继续执行因此也就解决了执行效率的问题。
等宏任务中的主要功能都直接完成之后这时候渲染引擎并不着急去执行下一个宏任务而是执行当前宏任务中的微任务因为DOM变化的事件都保存在这些微任务队列中这样也就解决了实时性问题。
**第二个是如何解决单个任务执行时长过久的问题。**
因为所有的任务都是在单线程中执行的,所以每次只能执行一个任务,而其他任务就都处于等待状态。如果其中一个任务执行时间过久,那么下一个任务就要等待很长时间。可以参考下图:
<img src="https://static001.geekbang.org/resource/image/8d/cc/8de4b43fca99b180fdffe6a5af07b5cc.png" alt="">
从图中你可以看到如果在执行动画过程中其中有个JavaScript任务因执行时间过久占用了动画单帧的时间这样会给用户制造了卡顿的感觉这当然是极不好的用户体验。针对这种情况JavaScript可以通过回调功能来规避这种问题也就是让要执行的JavaScript任务滞后执行。至于浏览器是如何实现回调功能的我们在后面的章节中再详细介绍。
## 实践:浏览器页面是如何运行的
有了上面的基础知识之后,我们最后来看看浏览器的页面是如何运行的。
你可以打开开发者工具点击“Performance”标签选择左上角的“start porfiling and load page”来记录整个页面加载过程中的事件执行情况如下图所示
<img src="https://static001.geekbang.org/resource/image/c0/1b/c0d59d5b58e387f30cc39ceb4d54f31b.png" alt="">
从图中可以看出我们点击展开了Main这个项目其记录了主线程执行过程中的所有任务。图中灰色的就是一个个任务每个任务下面还有子任务其中的Parse HTML任务是把HTML解析为DOM的任务。值得注意的是在执行Parse HTML的时候如果遇到JavaScript脚本那么会暂停当前的HTML解析而去执行JavaScript脚本。
至于Performance工具在后面的章节中我们还会详细介绍在这里你只需要建立一个直观的印象就可以了。
## 总结
好了,今天就讲到这里,下面我来总结下今天所讲的内容。
- 如果有一些确定好的任务,可以使用一个单线程来按照顺序处理这些任务,这是第一版线程模型。
- 要在线程执行过程中接收并处理新的任务,就需要引入循环语句和事件系统,这是第二版线程模型。
- 如果要接收其他线程发送过来的任务,就需要引入消息队列,这是第三版线程模型。
- 如果其他进程想要发送任务给页面主线程那么先通过IPC把任务发送给渲染进程的IO线程IO线程再把任务发送给页面主线程。
- 消息队列机制并不是太灵活,为了适应效率和实时性,引入了微任务。
基于消息队列的设计是目前使用最广的消息架构无论是安卓还是Chrome都采用了类似的任务机制所以理解了本篇文章的内容后你再理解其他项目的任务机制也会比较轻松。
## 思考时间
今天给你留的思考题是:结合消息队列和事件循环,你认为微任务是什么?引入微任务能带来什么优势呢?
欢迎在留言区与我分享你的想法,也欢迎你在留言区记录你的思考过程。感谢阅读,如果你觉得这篇文章对你有帮助的话,也欢迎把它分享给更多的朋友。

View File

@@ -0,0 +1,265 @@
<audio id="audio" title="16 | WebAPIsetTimeout是如何实现的" controls="" preload="none"><source id="mp3" src="https://static001.geekbang.org/resource/audio/58/ea/585b20c34207844c01dcb487b2c4e8ea.mp3"></audio>
在[上一篇文章](https://time.geekbang.org/column/article/132931)中我们介绍了页面中的事件和消息队列,知道了**浏览器页面是由消息队列和事件循环系统来驱动的**。
那在接下来的两篇文章中,我会通过**setTimeout**和**XMLHttpRequest**这两个WebAPI来介绍事件循环的应用。这两个WebAPI是两种不同类型的应用比较典型并且在JavaScript中的使用频率非常高。你可能觉得它们太简单、太基础但有时候恰恰是基础简单的东西才最重要了解它们是如何工作的会有助于你写出更加高效的前端代码。
本篇文章主要介绍的是**setTimeout**。其实说起setTimeout方法从事开发的同学想必都不会陌生它就是一个**定时器,用来指定某个函数在多少毫秒之后执行**。它会返回一个整数,表示定时器的编号,同时你还可以通过该编号来取消这个定时器。下面的示例代码就演示了定时器最基础的使用方式:
```
function showName(){
console.log(&quot;极客时间&quot;)
}
var timerID = setTimeout(showName,200);
```
执行上述代码输出的结果也很明显通过setTimeout指定在200毫秒之后调用showName函数并输出“极客时间”四个字。
简单了解了setTimeout的使用方法后那接下来我们就来看看浏览器是如何实现定时器的然后再介绍下定时器在使用过程中的一些注意事项。
## 浏览器怎么实现setTimeout
要了解定时器的工作原理,就得先来回顾下之前讲的事件循环系统,我们知道渲染进程中所有运行在主线程上的任务都需要先添加到消息队列,然后事件循环系统再按照顺序执行消息队列中的任务。下面我们来看看那些典型的事件:
- 当接收到HTML文档数据渲染引擎就会将“解析DOM”事件添加到消息队列中
- 当用户改变了Web页面的窗口大小渲染引擎就会将“重新布局”的事件添加到消息队列中。
- 当触发了JavaScript引擎垃圾回收机制渲染引擎会将“垃圾回收”任务添加到消息队列中。
- 同样如果要执行一段异步JavaScript代码也是需要将执行任务添加到消息队列中。
以上列举的只是一小部分事件,这些事件被添加到消息队列之后,事件循环系统就会按照消息队列中的顺序来执行事件。
所以说要执行一段异步任务,需要先将任务添加到消息队列中。不过通过定时器设置回调函数有点特别,它们需要在指定的时间间隔内被调用,但消息队列中的任务是按照顺序执行的,所以为了保证回调函数能在指定时间内执行,你不能将定时器的回调函数直接添加到消息队列中。
那么该怎么设计才能让定时器设置的回调事件在规定时间内被执行呢?你也可以思考下,如果让你在消息循环系统的基础之上加上定时器的功能,你会如何设计?
在Chrome中除了正常使用的消息队列之外还有另外一个消息队列这个队列中维护了需要延迟执行的任务列表包括了定时器和Chromium内部一些需要延迟执行的任务。所以当通过JavaScript创建一个定时器时渲染进程会将该定时器的回调任务添加到延迟队列中。
如果感兴趣,你可以参考[Chromium中关于队列部分的源码](https://cs.chromium.org/chromium/src/base/task/sequence_manager/task_queue_impl.h)。
源码中延迟执行队列的定义如下所示:
```
DelayedIncomingQueue delayed_incoming_queue;
```
当通过JavaScript调用setTimeout设置回调函数的时候渲染进程将会创建一个回调任务包含了回调函数showName、当前发起时间、延迟执行时间其模拟代码如下所示
```
struct DelayTask{
int64 id
CallBackFunction cbf;
int start_time;
int delay_time;
};
DelayTask timerTask;
timerTask.cbf = showName;
timerTask.start_time = getCurrentTime(); //获取当前时间
timerTask.delay_time = 200;//设置延迟执行时间
```
创建好回调任务之后,再将该任务添加到延迟执行队列中,代码如下所示:
```
delayed_incoming_queue.push(timerTask)
```
现在通过定时器发起的任务就被保存到延迟队列中了,那接下来我们再来看看消息循环系统是怎么触发延迟队列的。
我们可以来完善[上一篇文章](https://time.geekbang.org/column/article/132931)中消息循环的代码,在其中加入执行延迟队列的代码,如下所示:
```
void ProcessTimerTask(){
//从delayed_incoming_queue中取出已经到期的定时器任务
//依次执行这些任务
}
TaskQueue task_queue
void ProcessTask();
bool keep_running = true;
void MainTherad(){
for(;;){
//执行消息队列中的任务
Task task = task_queue.takeTask();
ProcessTask(task);
//执行延迟队列中的任务
ProcessDelayTask()
if(!keep_running) //如果设置了退出标志,那么直接退出线程循环
break;
}
}
```
从上面代码可以看出来,我们添加了一个**ProcessDelayTask函数**该函数是专门用来处理延迟执行任务的。这里我们要重点关注它的执行时机在上段代码中处理完消息队列中的一个任务之后就开始执行ProcessDelayTask函数。ProcessDelayTask函数会根据发起时间和延迟时间计算出到期的任务然后依次执行这些到期的任务。等到期的任务执行完成之后再继续下一个循环过程。通过这样的方式一个完整的定时器就实现了。
设置一个定时器JavaScript引擎会返回一个定时器的ID。那通常情况下当一个定时器的任务还没有被执行的时候也是可以取消的具体方法是调用**clearTimeout函数**并传入需要取消的定时器的ID。如下面代码所示
```
clearTimeout(timer_id)
```
其实浏览器内部实现取消定时器的操作也是非常简单的就是直接从delayed_incoming_queue延迟队列中通过ID查找到对应的任务然后再将其从队列中删除掉就可以了。
## 使用setTimeout的一些注意事项
现在你应该知道在浏览器内部定时器是如何工作的了。不过在使用定时器的过程中,如果你不了解定时器的一些细节,那么很有可能掉进定时器的一些陷阱里。所以接下来,我们就来讲解一下在使用定时器过程中存在的那些陷阱。
### 1. 如果当前任务执行时间过久,会影响定时器任务的执行
在使用setTimeout的时候有很多因素会导致回调函数执行比设定的预期值要久其中一个就是当前任务执行时间过久从而导致定时器设置的任务被延后执行。我们先看下面这段代码
```
function bar() {
console.log('bar')
}
function foo() {
setTimeout(bar, 0);
for (let i = 0; i &lt; 5000; i++) {
let i = 5+8+8+8
console.log(i)
}
}
foo()
```
这段代码中在执行foo函数的时候使用setTimeout设置了一个0延时的回调任务设置好回调任务后foo函数会继续执行5000次for循环。
通过setTimeout设置的回调任务被放入了消息队列中并且等待下一次执行这里并不是立即执行的要执行消息队列中的下个任务需要等待当前的任务执行完成由于当前这段代码要执行5000次的for循环所以当前这个任务的执行时间会比较久一点。这势必会影响到下个任务的执行时间。
你也可以打开Performance来看看其执行过程如下图所示
<img src="https://static001.geekbang.org/resource/image/1a/4f/1adf4da8ca4315cfb565e798649bd74f.png" alt="">
从图中可以看到执行foo函数所消耗的时长是500毫秒这也就意味着通过setTimeout设置的任务会被推迟到500毫秒以后再去执行而设置setTimeout的回调延迟时间是0。
### 2. 如果setTimeout存在嵌套调用那么系统会设置最短时间间隔为4毫秒
也就是说在定时器函数里面嵌套调用定时器,也会延长定时器的执行时间,可以先看下面的这段代码:
```
function cb() { setTimeout(cb, 0); }
setTimeout(cb, 0);
```
上述这段代码你有没有看出存在什么问题?
你还是可以通过Performance来记录下这段代码的执行过程如下图所示
<img src="https://static001.geekbang.org/resource/image/cb/cd/cbb3b2b1ac8eb4752a585df5445412cd.png" alt="">
上图中的竖线就是定时器的函数回调过程从图中可以看出前面五次调用的时间间隔比较小嵌套调用超过五次以上后面每次的调用最小时间间隔是4毫秒。之所以出现这样的情况是因为在Chrome中定时器被嵌套调用5次以上系统会判断该函数方法被阻塞了如果定时器的调用时间间隔小于4毫秒那么浏览器会将每次调用的时间间隔设置为4毫秒。下面是[Chromium实现4毫秒延迟的代码](https://cs.chromium.org/chromium/src/third_party/blink/renderer/core/frame/dom_timer.cc),你可以看下:
```
static const int kMaxTimerNestingLevel = 5;
// Chromium uses a minimum timer interval of 4ms. We'd like to go
// lower; however, there are poorly coded websites out there which do
// create CPU-spinning loops. Using 4ms prevents the CPU from
// spinning too busily and provides a balance between CPU spinning and
// the smallest possible interval timer.
static constexpr base::TimeDelta kMinimumInterval = base::TimeDelta::FromMilliseconds(4);
```
```
base::TimeDelta interval_milliseconds =
std::max(base::TimeDelta::FromMilliseconds(1), interval);
if (interval_milliseconds &lt; kMinimumInterval &amp;&amp;
nesting_level_ &gt;= kMaxTimerNestingLevel)
interval_milliseconds = kMinimumInterval;
if (single_shot)
StartOneShot(interval_milliseconds, FROM_HERE);
else
StartRepeating(interval_milliseconds, FROM_HERE);
```
所以一些实时性较高的需求就不太适合使用setTimeout了比如你用setTimeout来实现JavaScript动画就不是一个很好的主意。
### 3. 未激活的页面setTimeout执行最小间隔是1000毫秒
除了前面的4毫秒延迟还有一个很容易被忽略的地方那就是未被激活的页面中定时器最小值大于1000毫秒也就是说如果标签不是当前的激活标签那么定时器最小的时间间隔是1000毫秒目的是为了优化后台页面的加载损耗以及降低耗电量。这一点你在使用定时器的时候要注意。
### 4. 延时执行时间有最大值
除了要了解定时器的回调函数时间比实际设定值要延后之外还有一点需要注意下那就是Chrome、Safari、Firefox都是以32个bit来存储延时值的32bit最大只能存放的数字是2147483647毫秒这就意味着如果setTimeout设置的延迟值大于 2147483647毫秒大约24.8天时就会溢出那么相当于延时值被设置为0了这导致定时器会被立即执行。你可以运行下面这段代码
```
function showName(){
console.log(&quot;极客时间&quot;)
}
var timerID = setTimeout(showName,2147483648);//会被理解调用执行
```
运行后可以看到这段代码是立即被执行的。但如果将延时值修改为小于2147483647毫秒的某个值那么执行时就没有问题了。
### 5. 使用setTimeout设置的回调函数中的this不符合直觉
如果被setTimeout推迟执行的回调函数是某个对象的方法那么该方法中的this关键字将指向全局环境而不是定义时所在的那个对象。这点在前面介绍this的时候也提过你可以看下面这段代码的执行结果
```
var name= 1;
var MyObj = {
name: 2,
showName: function(){
console.log(this.name);
}
}
setTimeout(MyObj.showName,1000)
```
这里输出的是1因为这段代码在编译的时候执行上下文中的this会被设置为全局window如果是严格模式会被设置为undefined。
那么该怎么解决这个问题呢?通常可以使用下面这两种方法。
第一种是将`MyObj.showName`放在匿名函数中执行,如下所示:
```
//箭头函数
setTimeout(() =&gt; {
MyObj.showName()
}, 1000);
//或者function函数
setTimeout(function() {
MyObj.showName();
}, 1000)
```
第二种是使用bind方法将showName绑定在MyObj上面代码如下所示
```
setTimeout(MyObj.showName.bind(MyObj), 1000)
```
## 总结
好了,今天我们就介绍到这里,下面我来总结下今天的内容。
- 首先,为了支持定时器的实现,浏览器增加了延时队列。
- 其次由于消息队列排队和一些系统级别的限制通过setTimeout设置的回调任务并非总是可以实时地被执行这样就不能满足一些实时性要求较高的需求了。
- 最后,在定时器中使用过程中,还存在一些陷阱,需要你多加注意。
通过分析和讲解你会发现函数setTimeout在时效性上面有很多先天的不足所以对于一些时间精度要求比较高的需求应该有针对性地采取一些其他的方案。
## 思考时间
今天我们介绍了setTimeout相信你现在也知道它是怎么工作的了不过由于使用setTimeout设置的回调任务实时性并不是太好所以很多场景并不适合使用setTimeout。比如你要使用JavaScript来实现动画效果函数requestAnimationFrame就是个很好的选择。
那么今天留给你的作业是你需要网上搜索了解下requestAnimationFrame的工作机制并对比setTimeout然后分析出requestAnimationFrame实现的动画效果比setTimeout好的原因。
欢迎在留言区与我分享你的想法,也欢迎你在留言区记录你的思考过程。感谢阅读,如果你觉得这篇文章对你有帮助的话,也欢迎把它分享给更多的朋友。

View File

@@ -0,0 +1,267 @@
<audio id="audio" title="17 | WebAPIXMLHttpRequest是怎么实现的" controls="" preload="none"><source id="mp3" src="https://static001.geekbang.org/resource/audio/de/20/de4ad6ac13d014e62592d0499f68c820.mp3"></audio>
在[上一篇文章](https://time.geekbang.org/column/article/134456)中我们介绍了setTimeout是如何结合渲染进程的循环系统工作的那本篇文章我们就继续介绍另外一种类型的WebAPI——XMLHttpRequest。
自从网页中引入了JavaScript我们就可以操作DOM树中任意一个节点例如隐藏/显示节点、改变颜色、获得或改变文本内容、为元素添加事件响应函数等等, 几乎可以“为所欲为”了。
不过在XMLHttpRequest出现之前如果服务器数据有更新依然需要重新刷新整个页面。而XMLHttpRequest提供了从Web服务器获取数据的能力如果你想要更新某条数据只需要通过XMLHttpRequest请求服务器提供的接口就可以获取到服务器的数据然后再操作DOM来更新页面内容整个过程只需要更新网页的一部分就可以了而不用像之前那样还得刷新整个页面这样既有效率又不会打扰到用户。
关于XMLHttpRequest本来我是想一带而过的后来发现这个WebAPI用于教学非常好。首先前面讲了那么网络内容现在可以通过它把HTTP协议实践一遍其次XMLHttpRequest是一个非常典型的WebAPI通过它来讲解浏览器是如何实现WebAPI的很合适这对于你理解其他WebAPI也有非常大的帮助同时在这个过程中我们还可以把一些安全问题给串起来。
但在深入讲解XMLHttpRequest之前我们得先介绍下**同步回调**和**异步回调**这两个概念这会帮助你更加深刻地理解WebAPI是怎么工作的。
## 回调函数 VS 系统调用栈
那什么是回调函数呢Callback Function
将一个函数作为参数传递给另外一个函数,那作为参数的这个函数就是**回调函数**。简化的代码如下所示:
```
let callback = function(){
console.log('i am do homework')
}
function doWork(cb) {
console.log('start do work')
cb()
console.log('end do work')
}
doWork(callback)
```
在上面示例代码中我们将一个匿名函数赋值给变量callback同时将callback作为参数传递给了doWork()函数这时在函数doWork()中callback就是回调函数。
上面的回调方法有个特点就是回调函数callback是在主函数doWork返回之前执行的我们把这个回调过程称为**同步回调**。
既然有同步回调,那肯定也有异步回调。下面我们再来看看异步回调的例子:
```
let callback = function(){
console.log('i am do homework')
}
function doWork(cb) {
console.log('start do work')
setTimeout(cb,1000)
console.log('end do work')
}
doWork(callback)
```
在这个例子中我们使用了setTimeout函数让callback在doWork函数执行结束后又延时了1秒再执行这次callback并没有在主函数doWork内部被调用我们把这种回调函数在主函数外部执行的过程称为**异步回调**。
现在你应该知道什么是同步回调和异步回调了,那下面我们再深入点,站在消息循环的视角来看看同步回调和异步回调的区别。理解了这些,可以让你从本质上理解什么是回调。
我们还是先来回顾下页面的事件循环系统,通过[《15 | 消息队列和事件循环:页面是怎么“活”起来的?》](https://time.geekbang.org/column/article/132931)的学习你应该已经知道浏览器页面是通过事件循环机制来驱动的每个渲染进程都有一个消息队列页面主线程按照顺序来执行消息队列中的事件如执行JavaScript事件、解析DOM事件、计算布局事件、用户输入事件等等如果页面有新的事件产生那新的事件将会追加到事件队列的尾部。所以可以说是**消息队列和主线程循环机制保证了页面有条不紊地运行**。
这里还需要补充一点,那就是当循环系统在执行一个任务的时候,都要为这个任务维护一个**系统调用栈**。这个**系统调用栈**类似于JavaScript的调用栈只不过系统调用栈是Chromium的开发语言C++来维护的其完整的调用栈信息你可以通过chrome://tracing/来抓取。当然你也可以通过Performance来抓取它核心的调用信息如下图所示
<img src="https://static001.geekbang.org/resource/image/d3/77/d3d66afb1a103103e5c3f86c823efb77.png" alt="">
这幅图记录了一个Parse HTML的任务执行过程其中黄色的条目表示执行JavaScript的过程其他颜色的条目表示浏览器内部系统的执行过程。
通过该图你可以看出来Parse HTML任务在执行过程中会遇到一系列的子过程比如在解析页面的过程中遇到了JavaScript脚本那么就暂停解析过程去执行该脚本等执行完成之后再恢复解析过程。然后又遇到了样式表这时候又开始解析样式表……直到整个任务执行完成。
需要说明的是整个Parse HTML是一个完整的任务在执行过程中的脚本解析、样式表解析都是该任务的子过程其下拉的长条就是执行过程中调用栈的信息。
每个任务在执行过程中都有自己的调用栈,那么同步回调就是在当前主函数的上下文中执行回调函数,这个没有太多可讲的。下面我们主要来看看异步回调过程,异步回调是指回调函数在主函数之外执行,一般有两种方式:
- 第一种是把异步函数做成一个任务,添加到信息队列尾部;
- 第二种是把异步函数添加到微任务队列中,这样就可以在当前任务的末尾处执行微任务了。
## XMLHttpRequest运作机制
理解了什么是同步回调和异步回调接下来我们就来分析XMLHttpRequest背后的实现机制具体工作过程你可以参考下图
<img src="https://static001.geekbang.org/resource/image/29/c6/2914a052f4f249a52077692a22ee5cc6.png" alt="">
这是XMLHttpRequest的总执行流程图下面我们就来分析从发起请求到接收数据的完整流程。
我们先从XMLHttpRequest的用法开始首先看下面这样一段请求代码
```
function GetWebData(URL){
/**
* 1:新建XMLHttpRequest请求对象
*/
let xhr = new XMLHttpRequest()
/**
* 2:注册相关事件回调处理函数
*/
xhr.onreadystatechange = function () {
switch(xhr.readyState){
case 0: //请求未初始化
console.log(&quot;请求未初始化&quot;)
break;
case 1://OPENED
console.log(&quot;OPENED&quot;)
break;
case 2://HEADERS_RECEIVED
console.log(&quot;HEADERS_RECEIVED&quot;)
break;
case 3://LOADING
console.log(&quot;LOADING&quot;)
break;
case 4://DONE
if(this.status == 200||this.status == 304){
console.log(this.responseText);
}
console.log(&quot;DONE&quot;)
break;
}
}
xhr.ontimeout = function(e) { console.log('ontimeout') }
xhr.onerror = function(e) { console.log('onerror') }
/**
* 3:打开请求
*/
xhr.open('Get', URL, true);//创建一个Get请求,采用异步
/**
* 4:配置参数
*/
xhr.timeout = 3000 //设置xhr请求的超时时间
xhr.responseType = &quot;text&quot; //设置响应返回的数据格式
xhr.setRequestHeader(&quot;X_TEST&quot;,&quot;time.geekbang&quot;)
/**
* 5:发送请求
*/
xhr.send();
}
```
上面是一段利用了XMLHttpRequest来请求数据的代码再结合上面的流程图我们可以分析下这段代码是怎么执行的。
**第一步创建XMLHttpRequest对象。**
当执行到`let xhr = new XMLHttpRequest()`JavaScript会创建一个XMLHttpRequest对象**xhr**,用来执行实际的网络请求操作。
**第二步为xhr对象注册回调函数。**
因为网络请求比较耗时,所以要注册回调函数,这样后台任务执行完成之后就会通过调用回调函数来告诉其执行结果。
XMLHttpRequest的回调函数主要有下面几种
- ontimeout用来监控超时请求如果后台请求超时了该函数会被调用
- onerror用来监控出错信息如果后台请求出错了该函数会被调用
- onreadystatechange用来监控后台请求过程中的状态比如可以监控到HTTP头加载完成的消息、HTTP响应体消息以及数据加载完成的消息等。
**第三步:配置基础的请求信息。**
注册好回调事件之后接下来就需要配置基础的请求信息了首先要通过open接口配置一些基础的请求信息包括请求的地址、请求方法是get还是post和请求方式同步还是异步请求
然后通过xhr内部属性类配置一些其他可选的请求信息你可以参考文中示例代码我们通过`xhr.timeout = 3000`来配置超时时间也就是说如果请求超过3000毫秒还没有响应那么这次请求就被判断为失败了。
我们还可以通过`xhr.responseType = "text"`来配置服务器返回的格式将服务器返回的数据自动转换为自己想要的格式如果将responseType的值设置为json那么系统会自动将服务器返回的数据转换为JavaScript对象格式。下面的图表是我列出的一些返回类型的描述
<img src="https://static001.geekbang.org/resource/image/85/bf/856d1965676fafa46122e3ad1235dfbf.png" alt="">
假如你还需要添加自己专用的请求头属性可以通过xhr.setRequestHeader来添加。
**第四步:发起请求。**
一切准备就绪之后,就可以调用`xhr.send`来发起网络请求了。你可以对照上面那张请求流程图可以看到渲染进程会将请求发送给网络进程然后网络进程负责资源的下载等网络进程接收到数据之后就会利用IPC来通知渲染进程渲染进程接收到消息之后会将xhr的回调函数封装成任务并添加到消息队列中等主线程循环系统执行到该任务的时候就会根据相关的状态来调用对应的回调函数。
- 如果网络请求出错了就会执行xhr.onerror
- 如果超时了就会执行xhr.ontimeout
- 如果是正常的数据接收就会执行onreadystatechange来反馈相应的状态。
这就是一个完整的XMLHttpRequest请求流程如果你感兴趣可以参考下Chromium对XMLHttpRequest的实现[点击这里查看代码](https://chromium.googlesource.com/chromium/src/+/refs/heads/master/third_party/blink/renderer/core/xmlhttprequest/)。
## XMLHttpRequest使用过程中的“坑”
上述过程看似简单,但由于浏览器很多安全策略的限制,所以会导致你在使用过程中踩到非常多的“坑”。
浏览器安全问题是前端工程师避不开的一道坎,通常在使用过程中遇到的“坑”,很大一部分都是由安全策略引起的,不管你喜不喜欢,它都在这里。本来很完美的一个方案,正是由于加了安全限制,导致使用起来非常麻烦。
而你要做的就是去正视这各种的安全问题。也就是说要想更加完美地使用XMLHttpRequest你就要了解浏览器的安全策略。
下面我们就来看看在使用XMLHttpRequest的过程中所遇到的跨域问题和混合内容问题。
### 1. 跨域问题
比如在极客邦的官网使用XMLHttpRequest请求极客时间的页面内容由于极客邦的官网是[www.geekbang.org](https://www.geekbang.org),极客时间的官网是[time.geekbang.org](https://time.geekbang.org)它们不是同一个源所以就涉及到了跨域在A站点中去访问不同源的B站点的内容。默认情况下跨域请求是不被允许的你可以看下面的示例代码
```
var xhr = new XMLHttpRequest()
var url = 'https://time.geekbang.org/'
function handler() {
switch(xhr.readyState){
case 0: //请求未初始化
console.log(&quot;请求未初始化&quot;)
break;
case 1://OPENED
console.log(&quot;OPENED&quot;)
break;
case 2://HEADERS_RECEIVED
console.log(&quot;HEADERS_RECEIVED&quot;)
break;
case 3://LOADING
console.log(&quot;LOADING&quot;)
break;
case 4://DONE
if(this.status == 200||this.status == 304){
console.log(this.responseText);
}
console.log(&quot;DONE&quot;)
break;
}
}
function callOtherDomain() {
if(xhr) {
xhr.open('GET', url, true)
xhr.onreadystatechange = handler
xhr.send();
}
}
callOtherDomain()
```
你可以在控制台测试下。首先通过浏览器打开[www.geekbang.org](https://www.geekbang.org)然后打开控制台在控制台输入以上示例代码再执行会看到请求被Block了。控制台的提示信息如下
```
Access to XMLHttpRequest at 'https://time.geekbang.org/' from origin 'https://www.geekbang.org' has been blocked by CORS policy: No 'Access-Control-Allow-Origin' header is present on the requested resource.
```
因为 www.geekbang.org 和 time.geekbang.com 不属于一个域,所以以上访问就属于跨域访问了,这次访问失败就是由于跨域问题导致的。
### 2. HTTPS混合内容的问题
了解完跨域问题后我们再来看看HTTPS的混合内容。HTTPS混合内容是HTTPS页面中包含了不符合HTTPS安全要求的内容比如包含了HTTP资源通过HTTP加载的图像、视频、样式表、脚本等都属于混合内容。
通常如果HTTPS请求页面中使用混合内容浏览器会针对HTTPS混合内容显示警告用来向用户表明此HTTPS页面包含不安全的资源。比如打开站点 [https://www.iteye.com/groups](https://www.iteye.com/groups) ,可以通过控制台看到混合内容的警告,参考下图:
<img src="https://static001.geekbang.org/resource/image/4b/63/4b4a210a1e078d9a26fe31e6eab34963.png" alt="">
从上图可以看出通过HTML文件加载的混合资源虽然给出警告但大部分类型还是能加载的。而使用XMLHttpRequest请求时浏览器认为这种请求可能是攻击者发起的会阻止此类危险的请求。比如我通过浏览器打开地址 [https://www.iteye.com/groups](https://www.iteye.com/groups) 然后通过控制台使用XMLHttpRequest来请求 [http://img-ads.csdn.net/2018/201811150919211586.jpg](http://img-ads.csdn.net/2018/201811150919211586.jpg) ,这时候请求就会报错,出错信息如下图所示:
<img src="https://static001.geekbang.org/resource/image/46/a1/46c22d4e54815942c1a86f11b14516a1.png" alt="">
## 总结
好了,今天我们就讲到这里,下面我来总结下今天的内容。
首先我们介绍了回调函数和系统调用栈接下来我们站在循环系统的视角分析了XMLHttpRequest是怎么工作的最后又说明了由于一些安全因素的限制在使用XMLHttpRequest的过程中会遇到跨域问题和混合内容的问题。
本篇文章跨度比较大,不是单纯地讲一个问题,而是将回调类型、循环系统、网络请求和安全问题“串联”起来了。
对比[上一篇文章](https://time.geekbang.org/column/article/134456)setTimeout是直接将延迟任务添加到延迟队列中而XMLHttpRequest发起请求是由浏览器的其他进程或者线程去执行然后再将执行结果利用IPC的方式通知渲染进程之后渲染进程再将对应的消息添加到消息队列中。如果你搞懂了setTimeout和XMLHttpRequest的工作机制后再来理解其他WebAPI就会轻松很多了因为大部分WebAPI的工作逻辑都是类似的。
## 思考时间
网络安全很重要但是又很容易被忽视因为项目需求很少涉及到基础的Web安全。如果忽视了这些基础安全策略在开发过程中会处处遇到安全策略挖下的“大坑”所以对于一名开发者来说Web安全理论很重要也必须要学好。
那么今天我留给你一道开放性的思考题你认为作为一名开发工程师要如何去高效地学习前端的Web安全理论呢
欢迎在留言区与我分享你的想法,也欢迎你在留言区记录你的思考过程。感谢阅读,如果你觉得这篇文章对你有帮助的话,也欢迎把它分享给更多的朋友。

View File

@@ -0,0 +1,200 @@
<audio id="audio" title="18 | 宏任务和微任务:不是所有任务都是一个待遇" controls="" preload="none"><source id="mp3" src="https://static001.geekbang.org/resource/audio/7d/2c/7d3cb9fb9c5345a87d1485249e2ad72c.mp3"></audio>
在前面几篇文章中我们介绍了消息队列并结合消息队列介绍了两种典型的WebAPI——**setTimeout**和**XMLHttpRequest**通过这两个WebAPI我们搞清楚了浏览器的消息循环系统是怎么工作的。不过随着浏览器的应用领域越来越广泛消息队列中这种粗时间颗粒度的任务已经不能胜任部分领域的需求所以又出现了一种新的技术——**微任务**。**微任务可以在实时性和效率之间做一个有效的权衡**。
从目前的情况来看微任务已经被广泛地应用基于微任务的技术有MutationObserver、Promise以及以Promise为基础开发出来的很多其他的技术。所以微任务的重要性也与日俱增了解其底层的工作原理对于你读懂别人的代码以及写出更高效、更具现代的代码有着决定性的作用。
有微任务,也就有宏任务,那这二者到底有什么区别?它们又是如何相互取长补短的?
## 宏任务
前面我们已经介绍过了,页面中的大部分任务都是在主线程上执行的,这些任务包括了:
- 渲染事件如解析DOM、计算布局、绘制
- 用户交互事件(如鼠标点击、滚动页面、放大缩小等);
- JavaScript脚本执行事件
- 网络请求完成、文件读写完成事件。
为了协调这些任务有条不紊地在主线程上执行页面进程引入了消息队列和事件循环机制渲染进程内部会维护多个消息队列比如延迟执行队列和普通的消息队列。然后主线程采用一个for循环不断地从这些任务队列中取出任务并执行任务。我们把这些消息队列中的任务称为**宏任务**。
消息队列中的任务是通过事件循环系统来执行的,这里我们可以看看在[WHATWG规范](https://html.spec.whatwg.org/multipage/webappapis.html#event-loop-processing-model)中是怎么定义事件循环机制的。
由于规范需要支持语义上的完备性所以通常写得都会比较啰嗦这里我就大致总结了下WHATWG规范定义的大致流程
- 先从多个消息队列中选出一个最老的任务这个任务称为oldestTask
- 然后循环系统记录任务开始执行的时间并把这个oldestTask设置为当前正在执行的任务
- 当任务执行完成之后删除当前正在执行的任务并从对应的消息队列中删除掉这个oldestTask
- 最后统计执行完成的时长等信息。
以上就是消息队列中宏任务的执行过程,通过前面的学习,相信你也很熟悉这套执行流程了。
宏任务可以满足我们大部分的日常需求,不过如果有对时间精度要求较高的需求,宏任务就难以胜任了,下面我们就来分析下为什么宏任务难以满足对时间精度要求较高的任务。
前面我们说过页面的渲染事件、各种IO的完成事件、执行JavaScript脚本的事件、用户交互的事件等都随时有可能被添加到消息队列中而且添加事件是由系统操作的JavaScript代码不能准确掌控任务要添加到队列中的位置控制不了任务在消息队列中的位置所以很难控制开始执行任务的时间。为了直观理解你可以看下面这段代码
```
&lt;!DOCTYPE html&gt;
&lt;html&gt;
&lt;body&gt;
&lt;div id='demo'&gt;
&lt;ol&gt;
&lt;li&gt;test&lt;/li&gt;
&lt;/ol&gt;
&lt;/div&gt;
&lt;/body&gt;
&lt;script type=&quot;text/javascript&quot;&gt;
function timerCallback2(){
console.log(2)
}
function timerCallback(){
console.log(1)
setTimeout(timerCallback2,0)
}
setTimeout(timerCallback,0)
&lt;/script&gt;
&lt;/html&gt;
```
在这段代码中我的目的是想通过setTimeout来设置两个回调任务并让它们按照前后顺序来执行中间也不要再插入其他的任务因为如果这两个任务的中间插入了其他的任务就很有可能会影响到第二个定时器的执行时间了。
但实际情况是我们不能控制的比如在你调用setTimeout来设置回调任务的间隙消息队列中就有可能被插入很多系统级的任务。你可以打开Performance工具来记录下这段任务的执行过程也可参考文中我记录的图片
<img src="https://static001.geekbang.org/resource/image/3c/15/3c2b9b474c4df544df61ebd62a7b3715.png" alt="">
setTimeout函数触发的回调函数都是宏任务如图中左右两个黄色块就是setTimeout触发的两个定时器任务。
现在你可以重点观察上图中间浅红色区域,这里有很多一段一段的任务,这些是被渲染引擎插在两个定时器任务中间的任务。试想一下,如果中间被插入的任务执行时间过久的话,那么就会影响到后面任务的执行了。
所以说宏任务的时间粒度比较大执行的时间间隔是不能精确控制的对一些高实时性的需求就不太符合了比如后面要介绍的监听DOM变化的需求。
## 微任务
在理解了宏任务之后,下面我们就可以来看看什么是微任务了。在[上一篇文章](https://time.geekbang.org/column/article/135127)中,我们介绍过异步回调的概念,其主要有两种方式。
**第一种是把异步回调函数封装成一个宏任务,添加到消息队列尾部,当循环系统执行到该任务的时候执行回调函数**。这种比较好理解我们前面介绍的setTimeout和XMLHttpRequest的回调函数都是通过这种方式来实现的。
**第二种方式的执行时机是在主函数执行结束之后、当前宏任务结束之前执行回调函数,这通常都是以微任务形式体现的。**
那这里说的微任务到底是什么呢?
**微任务就是一个需要异步执行的函数,执行时机是在主函数执行结束之后、当前宏任务结束之前。**
不过要搞清楚微任务系统是怎么运转起来的就得站在V8引擎的层面来分析下。
我们知道当JavaScript执行一段脚本的时候V8会为其创建一个全局执行上下文在创建全局执行上下文的同时V8引擎也会在内部创建一个**微任务队列**。顾名思义这个微任务队列就是用来存放微任务的因为在当前宏任务执行的过程中有时候会产生多个微任务这时候就需要使用这个微任务队列来保存这些微任务了。不过这个微任务队列是给V8引擎内部使用的所以你是无法通过JavaScript直接访问的。
也就是说每个宏任务都关联了一个微任务队列。那么接下来,我们就需要分析两个重要的时间点——微任务产生的时机和执行微任务队列的时机。
我们先来看看微任务是怎么产生的?在现代浏览器里面,产生微任务有两种方式。
第一种方式是使用MutationObserver监控某个DOM节点然后再通过JavaScript来修改这个节点或者为这个节点添加、删除部分子节点当DOM节点发生变化时就会产生DOM变化记录的微任务。
第二种方式是使用Promise当调用Promise.resolve()或者Promise.reject()的时候,也会产生微任务。
通过DOM节点变化产生的微任务或者使用Promise产生的微任务都会被JavaScript引擎按照顺序保存到微任务队列中。
好了,现在微任务队列中有了微任务了,那接下来就要看看微任务队列是何时被执行的。
通常情况下在当前宏任务中的JavaScript快执行完成时也就在JavaScript引擎准备退出全局执行上下文并清空调用栈的时候JavaScript引擎会检查全局执行上下文中的微任务队列然后按照顺序执行队列中的微任务。**WHATWG把执行微任务的时间点称为检查点**。当然除了在退出全局执行上下文式这个检查点之外,还有其他的检查点,不过不是太重要,这里就不做介绍了。
如果在执行微任务的过程中产生了新的微任务同样会将该微任务添加到微任务队列中V8引擎一直循环执行微任务队列中的任务直到队列为空才算执行结束。也就是说在执行微任务过程中产生的新的微任务并不会推迟到下个宏任务中执行而是在当前的宏任务中继续执行。
为了直观地理解什么是微任务,你可以参考下面我画的示意图(由于内容比较多,我将其分为了两张):
<img src="https://static001.geekbang.org/resource/image/83/88/839f468be3d683019c309e0acd8cd788.png" alt="">
<img src="https://static001.geekbang.org/resource/image/1d/92/1db319c879610816c0cfea22723fc492.png" alt="">
该示意图是在执行一个ParseHTML的宏任务在执行过程中遇到了JavaScript脚本那么就暂停解析流程进入到JavaScript的执行环境。从图中可以看到全局上下文中包含了微任务列表。
在JavaScript脚本的后续执行过程中分别通过Promise和removeChild创建了两个微任务并被添加到微任务列表中。接着JavaScript执行结束准备退出全局执行上下文这时候就到了检查点了JavaScript引擎会检查微任务列表发现微任务列表中有微任务那么接下来依次执行这两个微任务。等微任务队列清空之后就退出全局执行上下文。
以上就是微任务的工作流程,从上面分析我们可以得出如下几个**结论**
- 微任务和宏任务是绑定的,每个宏任务在执行时,会创建自己的微任务队列。
- 微任务的执行时长会影响到当前宏任务的时长。比如一个宏任务在执行过程中产生了100个微任务执行每个微任务的时间是10毫秒那么执行这100个微任务的时间就是1000毫秒也可以说这100个微任务让宏任务的执行时间延长了1000毫秒。所以你在写代码的时候一定要注意控制微任务的执行时长。
- 在一个宏任务中,分别创建一个用于回调的宏任务和微任务,无论什么情况下,微任务都早于宏任务执行。
## 监听DOM变化方法演变
现在知道了微任务是怎么工作的那接下来我们再来看看微任务是如何应用在MutationObserver中的。MutationObserver是用来监听DOM变化的一套方法而监听DOM变化一直是前端工程师一项非常核心的需求。
比如许多Web应用都利用HTML 与 JavaScript 构建其自定义控件与一些内置控件不同这些控件不是固有的。为了与内置控件一起良好地工作这些控件必须能够适应内容更改、响应事件和用户交互。因此Web应用需要**监视 DOM 变化并及时地做出响应**。
虽然监听DOM的需求是如此重要不过早期页面并没有提供对监听的支持所以那时要观察DOM是否变化唯一能做的就是轮询检测比如使用setTimeout或者setInterval来定时检测DOM是否有改变。这种方式简单粗暴但是会遇到两个问题如果时间间隔设置过长DOM 变化响应不够及时反过来如果时间间隔设置过短又会浪费很多无用的工作量去检查DOM会让页面变得低效。
直到2000年的时候引入了Mutation EventMutation Event采用了**观察者的设计模式**当DOM 有变动时就会立刻触发相应的事件,这种方式属于同步回调。
采用Mutation Event解决了实时性的问题因为DOM一旦发生变化就会立即调用JavaScript接口。但也正是这种实时性造成了严重的性能问题因为每次DOM变动渲染引擎都会去调用JavaScript这样会产生较大的性能开销。比如利用JavaScript动态创建或动态修改50个节点内容就会触发50次回调而且每个回调函数都需要一定的执行时间这里我们假设每次回调的执行时间是4毫秒那么50次回调的执行时间就是200毫秒若此时浏览器正在执行一个动画效果由于Mutation Event触发回调事件就会导致动画的卡顿。
也正是因为使用Mutation Event会导致页面性能问题所以Mutation Event被反对使用并逐步从Web标准事件中删除了。
为了解决了Mutation Event由于同步调用JavaScript而造成的性能问题从DOM4开始推荐使用 MutationObserver 来代替 Mutation Event。MutationObserver API 可以用来监视 DOM 的变化,包括属性的变化、节点的增减、内容的变化等。
那么相比较 Mutation EventMutationObserver 到底做了哪些改进呢?
首先MutationObserver将响应函数改成异步调用可以不用在每次DOM变化都触发异步调用而是等多次DOM变化后**一次触发异步调用**并且还会使用一个数据结构来记录这期间所有的DOM变化。这样即使频繁地操纵DOM也不会对性能造成太大的影响。
我们通过异步调用和减少触发次数来缓解了性能问题那么如何保持消息通知的及时性呢如果采用setTimeout创建宏任务来触发回调的话那么实时性就会大打折扣因为上面我们分析过在两个任务之间可能会被渲染进程插入其他的事件从而影响到响应的实时性。
这时候,**微任务**就可以上场了在每次DOM节点发生变化的时候渲染引擎将变化记录封装成微任务并将微任务添加进当前的微任务队列中。这样当执行到检查点的时候V8引擎就会按照顺序执行微任务了。
综上所述, MutationObserver采用了“**异步+微任务**”的策略。
- 通过**异步**操作解决了同步操作的**性能问题**
- 通过**微任务**解决了**实时性的问题**。
## 总结
好了,今天就介绍到这里,下面我来总结下今天的内容。
首先我们回顾了宏任务,然后在宏任务的基础之上,我们分析了异步回调函数的两种形式,其中最后一种回调的方式就是通过微任务来实现的。
接下来我们详细分析了浏览器是如何实现微任务的,包括微任务队列、检查点等概念。
最后我们介绍了监听DOM变化技术方案的演化史从轮询到Mutation Event再到最新使用的MutationObserver。MutationObserver方案的核心就是采用了微任务机制有效地权衡了实时性和执行效率的问题。
## 思考时间
下篇文章我会从Promise产生的动机角度来分析Promise这需要一定的Promise基础所以今天留给你的作业是搞清楚Promise的工作原理弄清楚下面这段代码的输出结果并解释其原因。
```
function executor(resolve, reject) {
let rand = Math.random();
console.log(1)
console.log(rand)
if (rand &gt; 0.5)
resolve()
else
reject()
}
var p0 = new Promise(executor);
var p1 = p0.then((value) =&gt; {
console.log(&quot;succeed-1&quot;)
return new Promise(executor)
})
var p3 = p1.then((value) =&gt; {
console.log(&quot;succeed-2&quot;)
return new Promise(executor)
})
var p4 = p3.then((value) =&gt; {
console.log(&quot;succeed-3&quot;)
return new Promise(executor)
})
p4.catch((error) =&gt; {
console.log(&quot;error&quot;)
})
console.log(2)
```
欢迎在留言区与我分享你的想法,也欢迎你在留言区记录你的思考过程。感谢阅读,如果你觉得这篇文章对你有帮助的话,也欢迎把它分享给更多的朋友。

View File

@@ -0,0 +1,403 @@
<audio id="audio" title="19 | Promise使用Promise告别回调函数" controls="" preload="none"><source id="mp3" src="https://static001.geekbang.org/resource/audio/5d/d5/5d274a6224f1747def8b25849a8dded5.mp3"></audio>
在[上一篇文章](https://time.geekbang.org/column/article/135624)中我们聊到了微任务是如何工作的并介绍了MutationObserver是如何利用微任务来权衡性能和效率的。今天我们就接着来聊聊微任务的另外一个应用**Promise**DOM/BOM API中新加入的API大多数都是建立在Promise上的而且新的前端框架也使用了大量的Promise。可以这么说Promise已经成为现代前端的“水”和“电”很是关键所以深入学习Promise势在必行。
不过Promise的知识点有那么多而我们只有一篇文章来介绍那应该怎么讲解呢具体讲解思路是怎样的呢
如果你想要学习一门新技术最好的方式是先了解这门技术是如何诞生的以及它所解决的问题是什么。了解了这些后你才能抓住这门技术的本质。所以本文我们就来重点聊聊JavaScript引入Promise的动机以及解决问题的几个核心关键点。
要谈动机我们一般都是先从问题切入那么Promise到底解决了什么问题呢在正式开始介绍之前我想有必要明确下Promise解决的是异步编码风格的问题而不是一些其他的问题所以接下来我们聊的话题都是围绕编码风格展开的。
## 异步编程的问题:代码逻辑不连续
首先我们来回顾下JavaScript的异步编程模型你应该已经非常熟悉页面的事件循环系统了也知道页面中任务都是执行在主线程之上的相对于页面来说主线程就是它整个的世界所以在执行一项耗时的任务时比如下载网络文件任务、获取摄像头等设备信息任务这些任务都会放到页面主线程之外的进程或者线程中去执行这样就避免了耗时任务“霸占”页面主线程的情况。你可以结合下图来看看这个处理过程
<img src="https://static001.geekbang.org/resource/image/01/85/01e40e30db7e8a91eb70ce02fd8a6985.png" alt="">
上图展示的是一个标准的异步编程模型,页面主线程发起了一个耗时的任务,并将任务交给另外一个进程去处理,这时页面主线程会继续执行消息队列中的任务。等该进程处理完这个任务后,会将该任务添加到渲染进程的消息队列中,并排队等待循环系统的处理。排队结束之后,循环系统会取出消息队列中的任务进行处理,并触发相关的回调操作。
这就是页面编程的一大特点:**异步回调**。
Web页面的单线程架构决定了异步回调而异步回调影响到了我们的编码方式到底是如何影响的呢
假设有一个下载的需求使用XMLHttpRequest来实现具体的实现方式你可以参考下面这段代码
```
//执行状态
function onResolve(response){console.log(response) }
function onReject(error){console.log(error) }
let xhr = new XMLHttpRequest()
xhr.ontimeout = function(e) { onReject(e)}
xhr.onerror = function(e) { onReject(e) }
xhr.onreadystatechange = function () { onResolve(xhr.response) }
//设置请求类型请求URL是否同步信息
let URL = 'https://time.geekbang.com'
xhr.open('Get', URL, true);
//设置参数
xhr.timeout = 3000 //设置xhr请求的超时时间
xhr.responseType = &quot;text&quot; //设置响应返回的数据格式
xhr.setRequestHeader(&quot;X_TEST&quot;,&quot;time.geekbang&quot;)
//发出请求
xhr.send();
```
我们执行上面这段代码,可以正常输出结果的。但是,这短短的一段代码里面竟然出现了五次回调,这么多的回调会导致代码的逻辑不连贯、不线性,非常不符合人的直觉,这就是异步回调影响到我们的编码方式。
那有什么方法可以解决这个问题吗?当然有,我们可以封装这堆凌乱的代码,降低处理异步回调的次数。
## 封装异步代码,让处理流程变得线性
由于我们重点关注的是**输入内容(请求信息)<strong>和**输出内容(回复信息)</strong>,至于中间的异步请求过程,我们不想在代码里面体现太多,因为这会干扰核心的代码逻辑。整体思路如下图所示:
<img src="https://static001.geekbang.org/resource/image/83/5c/83dd5231c2e36c636c61af6a6dc80a5c.png" alt="">
从图中你可以看到我们将XMLHttpRequest请求过程的代码封装起来了重点关注输入数据和输出结果。
那我们就按照这个思路来改造代码。首先我们把输入的HTTP请求信息全部保存到一个request的结构中包括请求地址、请求头、请求方式、引用地址、同步请求还是异步请求、安全设置等信息。request结构如下所示
```
//makeRequest用来构造request对象
function makeRequest(request_url) {
let request = {
method: 'Get',
url: request_url,
headers: '',
body: '',
credentials: false,
sync: true,
responseType: 'text',
referrer: ''
}
return request
}
```
然后就可以封装请求过程了这里我们将所有的请求细节封装进XFetch函数XFetch代码如下所示
```
//[in] request请求信息请求头延时值返回类型等
//[out] resolve, 执行成功,回调该函数
//[out] reject 执行失败,回调该函数
function XFetch(request, resolve, reject) {
let xhr = new XMLHttpRequest()
xhr.ontimeout = function (e) { reject(e) }
xhr.onerror = function (e) { reject(e) }
xhr.onreadystatechange = function () {
if (xhr.status = 200)
resolve(xhr.response)
}
xhr.open(request.method, URL, request.sync);
xhr.timeout = request.timeout;
xhr.responseType = request.responseType;
//补充其他请求信息
//...
xhr.send();
}
```
这个XFetch函数需要一个request作为输入然后还需要两个回调函数resolve和reject当请求成功时回调resolve函数当请求出现问题时回调reject函数。
有了这些后,我们就可以来实现业务代码了,具体的实现方式如下所示:
```
XFetch(makeRequest('https://time.geekbang.org'),
function resolve(data) {
console.log(data)
}, function reject(e) {
console.log(e)
})
```
## 新的问题:回调地狱
上面的示例代码已经比较符合人的线性思维了,在一些简单的场景下运行效果也是非常好的,不过一旦接触到稍微复杂点的项目时,你就会发现,如果嵌套了太多的回调函数就很容易使得自己陷入了**回调地狱**,不能自拔。你可以参考下面这段让人凌乱的代码:
```
XFetch(makeRequest('https://time.geekbang.org/?category'),
function resolve(response) {
console.log(response)
XFetch(makeRequest('https://time.geekbang.org/column'),
function resolve(response) {
console.log(response)
XFetch(makeRequest('https://time.geekbang.org')
function resolve(response) {
console.log(response)
}, function reject(e) {
console.log(e)
})
}, function reject(e) {
console.log(e)
})
}, function reject(e) {
console.log(e)
})
```
这段代码是先请求`time.geekbang.org/?category`,如果请求成功的话,那么再请求`time.geekbang.org/column`,如果再次请求成功的话,就继续请求`time.geekbang.org`。也就是说这段代码用了三层嵌套请求,就已经让代码变得混乱不堪,所以,我们还需要解决这种嵌套调用后混乱的代码结构。
这段代码之所以看上去很乱,归结其原因有两点:
- **第一是嵌套调用**,下面的任务依赖上个任务的请求结果,并**在上个任务的回调函数内部执行新的业务逻辑**,这样当嵌套层次多了之后,代码的可读性就变得非常差了。
- **第二是任务的不确定性**,执行每个任务都有两种可能的结果(成功或者失败),所以体现在代码中就需要对每个任务的执行结果做两次判断,这种对每个任务都要进行一次额外的错误处理的方式,明显增加了代码的混乱程度。
原因分析出来后,那么问题的解决思路就很清晰了:
- **第一是消灭嵌套调用**
- **第二是合并多个任务的错误处理**。
这么讲可能有点抽象不过Promise已经帮助我们解决了这两个问题。那么接下来我们就来看看Promise是怎么消灭嵌套调用和合并多个任务的错误处理的。
## Promise消灭嵌套调用和多次错误处理
首先我们使用Promise来重构XFetch的代码示例代码如下所示
```
function XFetch(request) {
function executor(resolve, reject) {
let xhr = new XMLHttpRequest()
xhr.open('GET', request.url, true)
xhr.ontimeout = function (e) { reject(e) }
xhr.onerror = function (e) { reject(e) }
xhr.onreadystatechange = function () {
if (this.readyState === 4) {
if (this.status === 200) {
resolve(this.responseText, this)
} else {
let error = {
code: this.status,
response: this.response
}
reject(error, this)
}
}
}
xhr.send()
}
return new Promise(executor)
}
```
接下来我们再利用XFetch来构造请求流程代码如下
```
var x1 = XFetch(makeRequest('https://time.geekbang.org/?category'))
var x2 = x1.then(value =&gt; {
console.log(value)
return XFetch(makeRequest('https://www.geekbang.org/column'))
})
var x3 = x2.then(value =&gt; {
console.log(value)
return XFetch(makeRequest('https://time.geekbang.org'))
})
x3.catch(error =&gt; {
console.log(error)
})
```
你可以观察上面这两段代码重点关注下Promise的使用方式。
- 首先我们引入了Promise在调用XFetch时会返回一个Promise对象。
- 构建Promise对象时需要传入一个**executor函数**XFetch的主要业务流程都在executor函数中执行。
- 如果运行在excutor函数中的业务执行成功了会调用resolve函数如果执行失败了则调用reject函数。
- 在excutor函数中调用resolve函数时会触发promise.then设置的回调函数而调用reject函数时会触发promise.catch设置的回调函数。
以上简单介绍了Promise一些主要的使用方法通过引入Promise上面这段代码看起来就非常线性了也非常符合人的直觉是不是很酷基于这段代码我们就可以来分析Promise是如何消灭嵌套回调和合并多个错误处理了。
我们先来看看Promise是怎么消灭嵌套回调的。产生嵌套函数的一个主要原因是在发起任务请求时会带上回调函数这样当任务处理结束之后下个任务就只能在回调函数中来处理了。
Promise主要通过下面两步解决嵌套回调问题的。
**首先Promise实现了回调函数的延时绑定**。回调函数的延时绑定在代码上体现就是先创建Promise对象x1通过Promise的构造函数executor来执行业务逻辑创建好Promise对象x1之后再使用x1.then来设置回调函数。示范代码如下
```
//创建Promise对象x1并在executor函数中执行业务逻辑
function executor(resolve, reject){
resolve(100)
}
let x1 = new Promise(executor)
//x1延迟绑定回调函数onResolve
function onResolve(value){
console.log(value)
}
x1.then(onResolve)
```
**其次需要将回调函数onResolve的返回值穿透到最外层**。因为我们会根据onResolve函数的传入值来决定创建什么类型的Promise任务创建好的Promise对象需要返回到最外层这样就可以摆脱嵌套循环了。你可以先看下面的代码
<img src="https://static001.geekbang.org/resource/image/ef/7f/efcc4fcbebe75b4f6e92c89b968b4a7f.png" alt="">
现在我们知道了Promise通过回调函数延迟绑定和回调函数返回值穿透的技术解决了循环嵌套。
那接下来我们再来看看Promise是怎么处理异常的你可以回顾[上篇文章](https://time.geekbang.org/column/article/135624)思考题留的那段代码,我把这段代码也贴在文中了,如下所示:
```
function executor(resolve, reject) {
let rand = Math.random();
console.log(1)
console.log(rand)
if (rand &gt; 0.5)
resolve()
else
reject()
}
var p0 = new Promise(executor);
var p1 = p0.then((value) =&gt; {
console.log(&quot;succeed-1&quot;)
return new Promise(executor)
})
var p3 = p1.then((value) =&gt; {
console.log(&quot;succeed-2&quot;)
return new Promise(executor)
})
var p4 = p3.then((value) =&gt; {
console.log(&quot;succeed-3&quot;)
return new Promise(executor)
})
p4.catch((error) =&gt; {
console.log(&quot;error&quot;)
})
console.log(2)
```
这段代码有四个Promise对象p0p4。无论哪个对象里面抛出异常都可以通过最后一个对象p4.catch来捕获异常通过这种方式可以将所有Promise对象的错误合并到一个函数来处理这样就解决了每个任务都需要单独处理异常的问题。
之所以可以使用最后一个对象来捕获所有异常是因为Promise对象的错误具有“冒泡”性质会一直向后传递直到被onReject函数处理或catch语句捕获为止。具备了这样“冒泡”的特性后就不需要在每个Promise对象中单独捕获异常了。至于Promise错误的“冒泡”性质是怎么实现的就留给你课后思考了。
通过这种方式,我们就消灭了嵌套调用和频繁的错误处理,这样使得我们写出来的代码更加优雅,更加符合人的线性思维。
## Promise与微任务
讲了这么多我们似乎还没有将微任务和Promise关联起来那么Promise和微任务的关系到底体现哪里呢
我们可以结合下面这个简单的Promise代码来回答这个问题
```
function executor(resolve, reject) {
resolve(100)
}
let demo = new Promise(executor)
function onResolve(value){
console.log(value)
}
demo.then(onResolve)
```
对于上面这段代码,我们需要重点关注下它的执行顺序。
首先执行new Promise时Promise的构造函数会被执行不过由于Promise是V8引擎提供的所以暂时看不到Promise构造函数的细节。
接下来Promise的构造函数会调用Promise的参数executor函数。然后在executor中执行了resolveresolve函数也是在V8内部实现的那么resolve函数到底做了什么呢我们知道执行resolve函数会触发demo.then设置的回调函数onResolve所以可以推测resolve函数内部调用了通过demo.then设置的onResolve函数。
不过这里需要注意一下由于Promise采用了回调函数延迟绑定技术所以在执行resolve函数的时候回调函数还没有绑定那么只能推迟回调函数的执行。
这样按顺序陈述可能把你绕晕了下面来模拟实现一个Promise我们会实现它的构造函数、resolve方法以及then方法以方便你能看清楚Promise的背后都发生了什么。这里我们就把这个对象称为Bromise下面就是Bromise的实现代码
```
function Bromise(executor) {
var onResolve_ = null
var onReject_ = null
//模拟实现resolve和then暂不支持rejcet
this.then = function (onResolve, onReject) {
onResolve_ = onResolve
};
function resolve(value) {
//setTimeout(()=&gt;{
onResolve_(value)
// },0)
}
executor(resolve, null);
}
```
观察上面这段代码我们实现了自己的构造函数、resolve、then方法。接下来我们使用Bromise来实现我们的业务代码实现后的代码如下所示
```
function executor(resolve, reject) {
resolve(100)
}
//将Promise改成我们自己的Bromsie
let demo = new Bromise(executor)
function onResolve(value){
console.log(value)
}
demo.then(onResolve)
```
执行这段代码,我们发现执行出错,输出的内容是:
```
Uncaught TypeError: onResolve_ is not a function
at resolve (&lt;anonymous&gt;:10:13)
at executor (&lt;anonymous&gt;:17:5)
at new Bromise (&lt;anonymous&gt;:13:5)
at &lt;anonymous&gt;:19:12
```
之所以出现这个错误是由于Bromise的延迟绑定导致的在调用到onResolve_函数的时候Bromise.then还没有执行所以执行上述代码的时候当然会报“onResolve_ is not a function“的错误了。
也正是因为此我们要改造Bromise中的resolve方法让resolve延迟调用onResolve_。
要让resolve中的onResolve_函数延后执行可以在resolve函数里面加上一个定时器让其延时执行onResolve_函数你可以参考下面改造后的代码
```
function resolve(value) {
setTimeout(()=&gt;{
onResolve_(value)
},0)
}
```
上面采用了定时器来推迟onResolve的执行不过使用定时器的效率并不是太高好在我们有微任务所以Promise又把这个定时器改造成了微任务了这样既可以让onResolve_延时被调用又提升了代码的执行效率。这就是Promise中使用微任务的原由了。
## 总结
好了,今天我们就聊到这里,下面我来总结下今天所讲的内容。
首先我们回顾了Web页面是单线程架构模型这种模型决定了我们编写代码的形式——异步编程。基于异步编程模型写出来的代码会把一些关键的逻辑点打乱所以这种风格的代码不符合人的线性思维方式。接下来我们试着把一些不必要的回调接口封装起来简单封装取得了一定的效果不过在稍微复制点的场景下依然存在着回调地狱的问题。然后我们分析了产生回调地狱的原因
1. 多层嵌套的问题;
1. 每种任务的处理结果存在两种可能性(成功或失败),那么需要在每种任务执行结束后分别处理这两种可能性。
Promise通过回调函数延迟绑定、回调函数返回值穿透和错误“冒泡”技术解决了上面的两个问题。
最后我们还分析了Promise之所以要使用微任务是由Promise回调函数延迟绑定技术导致的。
## 思考时间
终于把Promise讲完了这一篇文章非常有难度所以需要你课后慢慢消消化再次提醒Promise非常重要。那么今天我给你留三个思考题
1. Promise中为什么要引入微任务
1. Promise中是如何实现回调函数返回值穿透的
1. Promise出错后是怎么通过“冒泡”传递给最后那个捕获异常的函数
这三个问题你不用急着完成可以先花一段时间查阅材料然后再来一道一道解释。搞清楚了这三道题目你也就搞清楚了Promise。
欢迎在留言区与我分享你的想法,也欢迎你在留言区记录你的思考过程。感谢阅读,如果你觉得这篇文章对你有帮助的话,也欢迎把它分享给更多的朋友。

View File

@@ -0,0 +1,296 @@
<audio id="audio" title="20 | async/await使用同步的方式去写异步代码" controls="" preload="none"><source id="mp3" src="https://static001.geekbang.org/resource/audio/dd/77/dd83216c820b30c256d4156d85f36677.mp3"></audio>
在[上篇文章](https://time.geekbang.org/column/article/136895)中我们介绍了怎么使用Promise来实现回调操作使用Promise能很好地解决回调地狱的问题但是这种方式充满了Promise的then()方法如果处理流程比较复杂的话那么整段代码将充斥着then语义化不明显代码不能很好地表示执行流程。
比如下面这样一个实际的使用场景我先请求极客邦的内容等返回信息之后我再请求极客邦的另外一个资源。下面代码展示的是使用fetch来实现这样的需求fetch被定义在window对象中可以用它来发起对远程资源的请求该方法返回的是一个Promise对象这和我们上篇文章中讲的XFetch很像只不过fetch是浏览器原生支持的并有没利用XMLHttpRequest来封装。
```
fetch('https://www.geekbang.org')
.then((response) =&gt; {
console.log(response)
return fetch('https://www.geekbang.org/test')
}).then((response) =&gt; {
console.log(response)
}).catch((error) =&gt; {
console.log(error)
})
```
从这段Promise代码可以看出来使用promise.then也是相当复杂虽然整个请求流程已经线性化了但是代码里面包含了大量的then函数使得代码依然不是太容易阅读。**基于这个原因ES7 引入了async/await这是JavaScript异步编程的一个重大改进提供了在不阻塞主线程的情况下使用同步代码实现异步访问资源的能力并且使得代码逻辑更加清晰**。你可以参考下面这段代码:
```
async function foo(){
try{
let response1 = await fetch('https://www.geekbang.org')
console.log('response1')
console.log(response1)
let response2 = await fetch('https://www.geekbang.org/test')
console.log('response2')
console.log(response2)
}catch(err) {
console.error(err)
}
}
foo()
```
通过上面代码你会发现整个异步处理的逻辑都是使用同步代码的方式来实现的而且还支持try catch来捕获异常这就是完全在写同步代码所以是非常符合人的线性思维的。但是很多人都习惯了异步回调的编程思维对于这种采用同步代码实现异步逻辑的方式还需要一个转换的过程因为这中间隐藏了一些容易让人迷惑的细节。
那么本篇文章我们继续深入看看JavaScript引擎是如何实现async/await的。如果上来直接介绍async/await的使用方式的话那么你可能会有点懵所以我们就从其最底层的技术点一步步往上讲解从而带你彻底弄清楚async和await到底是怎么工作的。
本文我们首先介绍生成器Generator是如何工作的接着讲解Generator的底层实现机制——协程Coroutine又因为async/await使用了Generator和Promise两种技术所以紧接着我们就通过Generator和Promise来分析async/await到底是如何以同步的方式来编写异步代码的。
## 生成器 VS 协程
我们先来看看什么是生成器函数?
**生成器函数是一个带星号函数,而且是可以暂停执行和恢复执行的**。我们可以看下面这段代码:
```
function* genDemo() {
console.log(&quot;开始执行第一段&quot;)
yield 'generator 2'
console.log(&quot;开始执行第二段&quot;)
yield 'generator 2'
console.log(&quot;开始执行第三段&quot;)
yield 'generator 2'
console.log(&quot;执行结束&quot;)
return 'generator 2'
}
console.log('main 0')
let gen = genDemo()
console.log(gen.next().value)
console.log('main 1')
console.log(gen.next().value)
console.log('main 2')
console.log(gen.next().value)
console.log('main 3')
console.log(gen.next().value)
console.log('main 4')
```
执行上面这段代码观察输出结果你会发现函数genDemo并不是一次执行完的全局代码和genDemo函数交替执行。其实这就是生成器函数的特性可以暂停执行也可以恢复执行。下面我们就来看看生成器函数的具体使用方式
1. 在生成器函数内部执行一段代码如果遇到yield关键字那么JavaScript引擎将返回关键字后面的内容给外部并暂停该函数的执行。
1. 外部函数可以通过next方法恢复函数的执行。
关于函数的暂停和恢复相信你一定很好奇这其中的原理那么接下来我们就来简单介绍下JavaScript引擎V8是如何实现一个函数的暂停和恢复的这也会有助于你理解后面要介绍的async/await。
要搞懂函数为何能暂停和恢复,那你首先要了解协程的概念。**协程是一种比线程更加轻量级的存在**。你可以把协程看成是跑在线程上的任务一个线程上可以存在多个协程但是在线程上同时只能执行一个协程比如当前执行的是A协程要启动B协程那么A协程就需要将主线程的控制权交给B协程这就体现在A协程暂停执行B协程恢复执行同样也可以从B协程中启动A协程。通常**如果从A协程启动B协程我们就把A协程称为B协程的父协程**。
正如一个进程可以拥有多个线程一样,一个线程也可以拥有多个协程。最重要的是,协程不是被操作系统内核所管理,而完全是由程序所控制(也就是在用户态执行)。这样带来的好处就是性能得到了很大的提升,不会像线程切换那样消耗资源。
为了让你更好地理解协程是怎么执行的,我结合上面那段代码的执行过程,画出了下面的“协程执行流程图”,你可以对照着代码来分析:
<img src="https://static001.geekbang.org/resource/image/5e/37/5ef98bd693bcd5645e83418b0856e437.png" alt="">
从图中可以看出来协程的四点规则:
1. 通过调用生成器函数genDemo来创建一个协程gen创建之后gen协程并没有立即执行。
1. 要让gen协程执行需要通过调用gen.next。
1. 当协程正在执行的时候可以通过yield关键字来暂停gen协程的执行并返回主要信息给父协程。
1. 如果协程在执行期间遇到了return关键字那么JavaScript引擎会结束当前协程并将return后面的内容返回给父协程。
不过对于上面这段代码你可能又有这样疑问父协程有自己的调用栈gen协程时也有自己的调用栈当gen协程通过yield把控制权交给父协程时V8是如何切换到父协程的调用栈当父协程通过gen.next恢复gen协程时又是如何切换gen协程的调用栈
要搞清楚上面的问题,你需要关注以下两点内容。
第一点gen协程和父协程是在主线程上交互执行的并不是并发执行的它们之前的切换是通过yield和gen.next来配合完成的。
第二点当在gen协程中调用了yield方法时JavaScript引擎会保存gen协程当前的调用栈信息并恢复父协程的调用栈信息。同样当在父协程中执行gen.next时JavaScript引擎会保存父协程的调用栈信息并恢复gen协程的调用栈信息。
为了直观理解父协程和gen协程是如何切换调用栈的你可以参考下图
<img src="https://static001.geekbang.org/resource/image/92/40/925f4a9a1c85374352ee93c5e3c41440.png" alt="">
到这里相信你已经弄清楚了协程是怎么工作的其实在JavaScript中生成器就是协程的一种实现方式这样相信你也就理解什么是生成器了。那么接下来我们使用生成器和Promise来改造开头的那段Promise代码。改造后的代码如下所示
```
//foo函数
function* foo() {
let response1 = yield fetch('https://www.geekbang.org')
console.log('response1')
console.log(response1)
let response2 = yield fetch('https://www.geekbang.org/test')
console.log('response2')
console.log(response2)
}
//执行foo函数的代码
let gen = foo()
function getGenPromise(gen) {
return gen.next().value
}
getGenPromise(gen).then((response) =&gt; {
console.log('response1')
console.log(response)
return getGenPromise(gen)
}).then((response) =&gt; {
console.log('response2')
console.log(response)
})
```
从图中可以看到foo函数是一个生成器函数在foo函数里面实现了用同步代码形式来实现异步操作但是在foo函数外部我们还需要写一段执行foo函数的代码如上述代码的后半部分所示那下面我们就来分析下这段代码是如何工作的。
- 首先执行的是`let gen = foo()`创建了gen协程。
- 然后在父协程中通过执行gen.next把主线程的控制权交给gen协程。
- gen协程获取到主线程的控制权后就调用fetch函数创建了一个Promise对象response1然后通过yield暂停gen协程的执行并将response1返回给父协程。
- 父协程恢复执行后调用response1.then方法等待请求结果。
- 等通过fetch发起的请求完成之后会调用then中的回调函数then中的回调函数拿到结果之后通过调用gen.next放弃主线程的控制权将控制权交gen协程继续执行下个请求。
以上就是协程和Promise相互配合执行的一个大致流程。不过通常我们把执行生成器的代码封装成一个函数并把这个执行生成器代码的函数称为**执行器**可参考著名的co框架如下面这种方式
```
function* foo() {
let response1 = yield fetch('https://www.geekbang.org')
console.log('response1')
console.log(response1)
let response2 = yield fetch('https://www.geekbang.org/test')
console.log('response2')
console.log(response2)
}
co(foo());
```
通过使用生成器配合执行器,就能实现使用同步的方式写出异步代码了,这样也大大加强了代码的可读性。
## async/await
虽然生成器已经能很好地满足我们的需求了但是程序员的追求是无止境的这不又在ES7中引入了async/await这种方式能够彻底告别执行器和生成器实现更加直观简洁的代码。其实async/await技术背后的秘密就是Promise和生成器应用往低层说就是微任务和协程应用。要搞清楚async和await的工作原理我们就得对async和await分开分析。
### 1. async
我们先来看看async到底是什么根据MDN定义async是一个通过**异步执行**并**隐式返回 Promise** 作为结果的函数。
对async函数的理解这里需要重点关注两个词**异步执行**和**隐式返回 Promise**。
关于异步执行的原因我们一会儿再分析。这里我们先来看看是如何隐式返回Promise的你可以参考下面的代码
```
async function foo() {
return 2
}
console.log(foo()) // Promise {&lt;resolved&gt;: 2}
```
执行这段代码我们可以看到调用async声明的foo函数返回了一个Promise对象状态是resolved返回结果如下所示
```
Promise {&lt;resolved&gt;: 2}
```
### 2. await
我们知道了async函数返回的是一个Promise对象那下面我们再结合文中这段代码来看看await到底是什么。
```
async function foo() {
console.log(1)
let a = await 100
console.log(a)
console.log(2)
}
console.log(0)
foo()
console.log(3)
```
观察上面这段代码你能判断出打印出来的内容是什么吗这得先来分析async结合await到底会发生什么。在详细介绍之前我们先站在协程的视角来看看这段代码的整体执行流程图
<img src="https://static001.geekbang.org/resource/image/8d/94/8dcd8cfa77d43d1fb928d8b001229b94.png" alt="">
结合上图我们来一起分析下async/await的执行流程。
首先,执行`console.log(0)`这个语句打印出来0。
紧接着就是执行foo函数由于foo函数是被async标记过的所以当进入该函数的时候JavaScript引擎会保存当前的调用栈等信息然后执行foo函数中的`console.log(1)`语句并打印出1。
接下来就执行到foo函数中的`await 100`这个语句了,这里是我们分析的重点,因为在执行`await 100`这个语句时JavaScript引擎在背后为我们默默做了太多的事情那么下面我们就把这个语句拆开来看看JavaScript到底都做了哪些事情。
当执行到`await 100`会默认创建一个Promise对象代码如下所示
```
let promise_ = new Promise((resolve,reject){
resolve(100)
})
```
在这个promise_对象创建的过程中我们可以看到在executor函数中调用了resolve函数JavaScript引擎会将该任务提交给微任务队列[上一篇文章](https://time.geekbang.org/column/article/136895)中我们讲解过)。
然后JavaScript引擎会暂停当前协程的执行将主线程的控制权转交给父协程执行同时会将promise_对象返回给父协程。
主线程的控制权已经交给父协程了这时候父协程要做的一件事是调用promise_.then来监控promise状态的改变。
接下来继续执行父协程的流程,这里我们执行`console.log(3)`并打印出来3。随后父协程将执行结束在结束之前会进入微任务的检查点然后执行微任务队列微任务队列中有`resolve(100)`的任务等待执行执行到这里的时候会触发promise_.then中的回调函数如下所示
```
promise_.then((value)=&gt;{
//回调函数被激活后
//将主线程控制权交给foo协程并将vaule值传给协程
})
```
该回调函数被激活以后会将主线程的控制权交给foo函数的协程并同时将value值传给该协程。
foo协程激活之后会把刚才的value值赋给了变量a然后foo协程继续执行后续语句执行完成之后将控制权归还给父协程。
以上就是await/async的执行流程。正是因为async和await在背后为我们做了大量的工作所以我们才能用同步的方式写出异步代码来。
## 总结
好了,今天就介绍到这里,下面我来总结下今天的主要内容。
Promise的编程模型依然充斥着大量的then方法虽然解决了回调地狱的问题但是在语义方面依然存在缺陷代码中充斥着大量的then函数这就是async/await出现的原因。
使用async/await可以实现用同步代码的风格来编写异步代码这是因为async/await的基础技术使用了生成器和Promise生成器是协程的实现利用生成器能实现生成器函数的暂停和恢复。
另外V8引擎还为async/await做了大量的语法层面包装所以了解隐藏在背后的代码有助于加深你对async/await的理解。
async/await无疑是异步编程领域非常大的一个革新也是未来的一个主流的编程风格。其实除了JavaScriptPython、Dart、C#等语言也都引入了async/await使用它不仅能让代码更加整洁美观而且还能确保该函数始终都能返回Promise。
## 思考时间
下面这段代码整合了定时器、Promise和async/await你能分析出来这段代码执行后输出的内容吗
```
async function foo() {
console.log('foo')
}
async function bar() {
console.log('bar start')
await foo()
console.log('bar end')
}
console.log('script start')
setTimeout(function () {
console.log('setTimeout')
}, 0)
bar();
new Promise(function (resolve) {
console.log('promise executor')
resolve();
}).then(function () {
console.log('promise then')
})
console.log('script end')
```
欢迎在留言区与我分享你的想法,也欢迎你在留言区记录你的思考过程。感谢阅读,如果你觉得这篇文章对你有帮助的话,也欢迎把它分享给更多的朋友。