Files
CategoryResourceRepost/极客时间专栏/JavaScript核心原理解析/从粗通到精通的进阶之路:唯一不变的是变化本身/20 | (0, eval)("x = 100") :一行让严格模式形同虚设的破坏性设计(上).md
louzefeng d3828a7aee mod
2024-07-11 05:50:32 +00:00

21 KiB
Raw Blame History

<audio id="audio" title="20 | (0, eval)("x = 100") :一行让严格模式形同虚设的破坏性设计(上)" controls="" preload="none">

你好,我是周爱民。

今天我们讨论动态执行。与最初的预告不同 我在这一讲里把原来的第20讲合并掉了变成了20~21的两讲合讲但也分成了上、下两节。所以其实只是课程的标题少了一个内容却没有变。

动态执行是JavaScript最早实现的特性之一eval()这个函数是从JavaScript 1.0就开始内置了的。并且最早的setTimeout()和setInterval()也内置了动态执行的特性它们的第1个参数只允许传入一个字符串这个字符串将作为代码体动态地定时执行。

NOTEsetTimeout/setInterval执行字符串的特性如今仍然保留在大多数浏览器环境中例如Safari或Mozilla但这在Node.js/Chrome环境中并不被允许。需要留意的是setTimeout/setInterval并不是ECMAScript规范的一部分。

关于这一点并不难理解因为JavaScript本来就是脚本语言它最早也是被作为脚本语言设计出来的。因此把“装载脚本+执行”这样的核心过程,通过一个函数暴露出来成为基础特性既是举手之劳,也是必然之举。

然而这个特性从最开始就过度灵活以至于后来许多新特性在设计中颇为掣肘所以在ECMAScript 5的严格模式出现之后它的特性受到了很多的限制。

接下来我将帮助你揭开重重迷雾让你得见最真实的“eval()”。

eval执行什么

最基本的、也是最重要的问题是eval究竟是在执行什么

在代码eval(x)中,x必须是一个字符串不能是其他任何类型的值也不能是一个字符串对象。如果尝试在x中传入其他的值那么eval()将直接以该值为返回值,例如:

# 值1
&gt; eval(null)
null

# 值2
&gt; eval(false)
false

# 字符串对象
&gt; eval(Object('1234'))
[String: '1234']

# 字符串值
&gt; eval(Object('1234').toString())
1234

这里eval()会按照JavaScript语法规则来尝试解析字符串x包括对一些特殊字面量例如8进制的语法解析。这样的解析会与parseInt()或Number()函数实现的类型转换有所不同例如对8进制的解析在eval()的代码中就可以使用012来表示十进制的10。而使用parseInt()或Number()函数就不支持8进制会忽略前缀字符0得到十进制的12。

# JavaScript在源代码层面支持8进制
&gt; eval('012')
10

# 但parseInt()不支持8进制除非显式指定radix参数
&gt; parseInt('012')
12

# Number()也不支持8进制
&gt; Number('012')
12

另外eval()会将参数x强制理解为语句行,这样一来,当按照“语句->表达式”的顺序解析时,“{ }”将被优先理解为语句中的大括号。于是下面的代码就成了JavaScript初学者的经典噩梦也就是“尝试将一个对象字面量的字符串作为代码文本执行”所导致的问题。

# 试图返回一个对象
&gt; eval('{abc: 1}')
1

在这种情况下由于第一个字符被理解为块语句那么“abc:”就将被解析成标签语句;接下来,"1"会成为一个“单值表达式语句”。所以结果是返回了这个表达式的值也就是1而不是一个字面量声明的对象。

NOTE这一个示例就是原来用作第20讲的标题的一行代码。只不过在实际写的时候发现能展开讲的内容太少所以做了一下合并。)

eval在哪儿执行

eval总是将代码执行在当前上下文的“当前位置”。这里的所谓的“当前上下文”并不是它字面意思中的“代码文本上下文”而是指“与执行环境相关的执行上下文”。

我在之前的文章中给你提到过与JavaScript的执行系统相关的两个组件环境和上下文。但我一直在尽力避免详细地讨论它们甚至在一些场合中将它们混为一谈。

然而在讨论eval()“执行的位置”的时候,这两个东西却必须厘清,因为严格地来讲,环境是JavaScript在语言系统中的静态组件上下文是它在执行系统中的动态组件。

环境

怎么说呢?

JavaScript中环境可以细分为四种并由两个类别的基础环境组件构成。这四种环境是全局Global、函数Function、模块Module和Eval环境两个基础组件的类别分别是声明环境Declarative Environment和对象环境Object Environment

你也许会问:不对啊?我们常说的词法环境到哪里去了呢?不要着急,我们马上就会讲到它的。这里先继续说清楚上面的六个东西。

首先是两个类别,它们是所有其他环境的基础,是两种抽象级别最低的、基础的环境组件。声明环境就是名字表,可以是引擎内核用任何方式来实现的一个“名字->数据”的对照表;对象环境是JavaScript的一个对象用来“模拟/映射”成上述的对照表的一个结果,你也可以把它看成一个具体的实现。所以,

  • 概念:所有的“环境”本质上只有一个功能,就是用来管理“名字->数据”的对照表;
  • 应用“对象环境”只为全局环境的global对象with (obj)...语句中的对象obj创建,其他情况下创建的环境,都必然是“声明环境”。

所以所谓四种环境其实是上述的两种基础组件进一步应用的结果。其中全局Global环境是一个复合环境它由一对“对象环境 + 声明环境”组成其他3种环境都是一个单独的声明环境。

你需要关注到的一个事实是:所有的四种环境都与执行相关——看起来它们“像是”为每种可执行的东西都创建了一个环境,但是它们事实上都不是可以执行的东西,也不是执行系统(执行引擎)所理解的东西。更加准确地说:

上述四种环境本质上只是为JavaScript中的每一个“可以执行的语法块”创建了一个名字表的影射而已。

执行上下文

JavaScript的执行系统由一个执行栈和一个执行队列构成这在之前也讲过。关于它们的应用原理你可以回顾一下第6讲x: break x),以及第10讲x = yield x)中的内容。

在执行队列中保存的是待执行的任务称为Job。这是一个抽象概念它指明在“创建”这个执行任务时的一些关联信息以便正式“执行”时可以参考它而“正式的执行”发生在将一个新的上下文被“推入push”执行栈的时候。

所以,上下文是一个任务“执行/不执行”的关键。如果一个任务只是任务并没有执行那么也就没有它的上下文如果一个上下文从栈中撤出那么就必须有地方能够保存这个上下文否则可执行的信息就丢失了这种情况并不常见如果一个新上下文被“推入push”栈那么旧的上下文就被挂起并压向栈底如果当前活动上下文被“弹出pop”栈那么处在栈底的旧上下文就被恢复了。

NOTE很少需要在用户代码在它的执行过程中撤出和保存上下文的过程但这的确存在。比如生成器GeneratorContext或者异步调用AsyncContext

而每一个上下文只关心两个高度抽象的信息:其一是执行点(包括状态和位置),其二是执行时的参考,也就是前面一再说到的“名字的对照表”。

所以重要的是每一个执行上下文都需要关联到一个对照表。这个对照表就称为“词法环境Lexical Environment”。显然它可以是上述四种环境之任一并且更加重要的也可是两种基础组件之任一

如上是一般性质的执行引擎逻辑,对于大多数“通用的”执行环境来说,这是足够的。

但对于JavaScript来说这还不够因为JavaScript的早期有一个“能够超越词法环境”的东西存在就是“var变量”。所谓词法环境就是一个能够表示标识符在源代码词法中的位置的环境由于源代码分块所以词法环境就可以用“链式访问”来映射“块之间的层级关系”。但是“var变量”突破了这个设计限制例如我们常常说到的变量提升也就是在一个变量赋值前就能访问它又例如所有在同一个全局或函数内部的var x其实都是同一个,而无论它隔了多少层的块级作用域。于是你可以写出这样一个示例来:

var x = 1;
if (true) {
  var x = 2;

  with (new Object) {
    var x = 3;
  }
}

这个示例中,无论你把var x声明在if语句后面的块中还是with语句后面的块中“1、2、3”所在的“var变量”x,都突破了它们所在的词法作用域(或对应的词法环境),而指向全局的x

于是自ECMAScript 5开始约定ECMAScript的执行上下文将有两个环境一个称为词法环境另一个就称为变量环境Variable Environment所有传统风格的“var声明和函数声明”将通过“变量环境”来管理。

这个管理只是“概念层面”的,实际用起来,并不是这么回事。

管理

为什么呢?

如果你仔细读了ECMAScript你会发现所谓的全局上下文例如Global Context中的两个环境其实都指向同一个也就是

#(如下示例不可执行)
&gt; globalCtx.LexicalEnvironment === global
true

&gt; globalCtx.VariableEnvironment === global
true

这就是在实现中的取巧之处了。

对于JavaScript来说由于全局的特性就是“var变量”和“词法变量”共用一个名字表因此你声明了“var变量”那么就不能声明“同名的let/const变量”。例如

&gt; var x = 100
&gt; let x = 200
SyntaxError: Identifier 'x' has already been declared

所以,事实上它们“的确就是”同一个环境。

而具体到“var变量”本身在传统中JavaScript中只有函数和全局能够“保存var声明的变量”而在ECMAScript 6之后模块全局也是可以保存“var声明的变量”的。因此事实上也就只有它们的“变量环境VariableEnvironment”是有意义的然而即使如此也就是说即使从原理上来说它们都是“有用的”它们仍然是指向同一个环境组件的。也就是说之前的逻辑仍然是成立的

#(如下示例不可执行)
&gt; functionCtx.LexicalEnvironment === functionCtx.VariableEnvironment
true

&gt; moduleCtx.LexicalEnvironment === moduleCtx.VariableEnvironment
true

那么非得要“分别地”声明这两个组件又有什么用呢答案是对于eval()来说,它的“词法环境”与“变量环境”存在着其他的可能性!

不用于执行的环境

环境在本质上是“作用域的映射”。作用域如果不需要被上下文管理,那么它(所对应的环境)也就不需要关联到上下文。

在早期的JavaScript中作用域与执行环境是一对一的所以也就常常混用而到了ECMAScript 5之后有一些作用域并没有对应用执行环境所有就分开了。在ECMAScript 5之后ECMAScript规范中就很少使用“作用域Scope”这个名词转而使用“环境”这个概念来替代它。

哪些东西的作用域不需要关联到上下文呢?其实,一般的块级作用域都是这样的。例如一般的块级作用域:

// 对象闭包
with (x) ...

很显然的,这里的with语句为对象x创建了一个对象闭包,就是对象作用域,也是我们在上面讨论过的“对象环境”。然而,由于这个语句其实只需要执行在当前的上下文环境(函数/模块/全局因此它不需要“被关联到”一个执行上下文也不需要作为一个独立的可执行组件“推入push”到执行栈。所以这时创建出来的环境就是一个不用于执行的环境。

只有前面所说过的四种环境是用于执行的环境,而其他的所有环境(以及反过来对应的作用域)都是不用于执行的,它们与上下文无关。并且,既然与上下文没有关联,那么也就不存在“词法环境”和“变量环境”了。

从语法上在代码文本中你可以找到除了上述四种环境之外的其他任何一种块级作用域事实上它们每个作用域都有一个对应的环境with语句的环境用“对象环境”创建出来而其他的例如for语句的迭代环境又例如swith/try语句的块是用“声明环境”创建出来的。

对于这些用于执行的环境中的其中三个ECMAScript直接约定了它们也就是Global/Module/Function的创建过程。例如全局环境就称为NewGlobalEnvironment()。因为它们都可以在代码解析Parser的阶段得到并且在代码运行之前由引擎创建出来。

而唯有一个环境是没有独立创建过程并且在程序运行过程中动态创建的这就是“Eval环境”。

所以Eval环境是主要用于应对“动态执行”的环境。

eval()的环境

上面我们说到所谓“Eval环境”是主要用于应对“动态执行”的并且它的词法环境与变量环境“可能会不一样”。这二者其实是相关的,并且,这还与“严格模式”这一特殊机制存在紧密的关系。

当在eval(x)用一般的方式执行代码时,如果x字符串中存在着var变量声明那么会发生什么事情呢按照传统JavaScript的设计这意味着在它所在的函数作用域或者全局作用域会有一个新的变量被创建出来。这也就是JavaScript的“动态声明函数和var变量”和“动态作用域”的效果例如

var x = 'outer';
function foo() {
  console.log(x); // 'outer'
  eval('var x = 100;');
  console.log(x); // '100'
}
foo();

如果按照传统的设计与实现这就会要求eval()在执行时能够“引用”它所在的函数或全局的“变量作用域”。并且进一步地这也就要求eval有能力“总是动态地”查找这个作用域并且JavaScript执行引擎还需要理解“用户代码中的eval”这一特殊概念。正是为了避免这些行为所以ECMAScript约定在执行上下文中加上“变量环境Variable Environment”这个东西以便在执行过程中仅仅只需要查找“当前上下文”就可以找到这个能用来登记变量的名字表。

也就是说“变量环境VariableEnvironment”存在的意义就是动态地登记“var变量”。

因此它也仅仅只用在“Eval环境”的创建过程中。“Eval环境”是唯一一个将“变量环境”指向了与它自有的“词法环境”不同位置的环境。

NOTE: 其实函数中也存在一个类似的例外。但这个处理过程是在函数的环境创建之后在函数声明实例化阶段来完成的因此与这里的处理略有区别。由于是函数声明的实例化FunctionDeclaration Instantiation阶段来处理因此这也意味着每次实例化亦即是每次调用函数并导致闭包创建时都会重复一次这个过程在执行上下文的内部重新初始化一次变量环境与词法环境并根据严格模式的状态来确定词法环境与变量环境是否是同一个。

这里既然提到了“Eval自有的词法环境”那么也稍微解释一下它的作用。

对于Eval环境来说它也需要一个自己的、独立的作用域用来确保在“eval(x)”的代码x中存在的那些const/let声明有自己的名字表而不影响当前环境。这与使用一对大括号来表示的一个块级作用域是完全一致的并且也使用相同的基础组件即声明环境、Declarative Environment来创建得到。这就是在eval()中使用const/let不影响它所在函数或其他块级作用域的原因例如

function foo() {
  var x = 100;
  eval('let x = 200; console.log(x);'); // 200
  console.log(x); // 100
}
foo();

而同样的示例由于“变量环境”指向它在“当前上下文也就是foo函数的函数执行上下文”的变量环境也就是

#(如下示例不可执行)
&gt; evalCtx.VariableEnvironment === fooCtx.VariableEnvironment
true

&gt; fooCtx.VariableEnvironment === fooCtx.LexicalEnvironment
true

&gt; evalCtx.VariableEnvironment = evalCtx.LexicalEnvironment
false

所以当eval中执行代码“var x = …”时,就可以通过evalCtx.VariableEnvironment来访问到fooCtx.VariableEnvironment了。例如:

function foo() {
  var x = 100;
  eval('var x = 200; console.log(x);'); // 200, x指向foo()中的变量x
  console.log(x); // 200
}
foo();

也许你正在思考为什么eval()在严格模式中就不能覆盖/重复声明函数、全局等环境中的同名“var变量”呢

答案很简单只是一个小小的技术技巧在“严格模式的Eval环境”对应的上下文中变量环境与词法环境都指向它们自有的那个词法环境。于是这样一来在严格模式中使用eval("var x...")eval("let x...")的名字都创建在同一个环境中,它们也就自然不能重名了;并且由于没有引用它所在的(全局或函数的)环境,所以也就不能改写这些环境中的名字了。

那么一个eval()函数所需要的“Eval环境”究竟是严格模式还是非严格模式呢

你还记得“严格模式”的使用原则么eval(x)的严格模式要么继承自当前的环境,要么就是代码x的第一个指令是字符串“use strict”。对于后一种情况由于eval()是动态parser代码x所以它只需要检查一下parser之后的AST抽象语法树的第一个节点是不是字符串“use strict”就可以了。

这也是为什么“切换严格模式”的指示指令被设计成这个奇怪模样的原因了。

NOTE按照ECMAScript 6之后的约定模块默认工作在严格模式下并且不能切换回非严格模式所以它其中的eval()也就必然处于严格模式。这种情况下即严格模式下eval()的“变量环境”与它的词法环境是同一个并且是自有的。因此模块环境中的变量环境moduleCtx.VariableEnvironment将永远不会被引用到并且用户代码也无法在其中创建新的“var变量”。

最后一种情况

标题中的eval()的代码文本,说的却是最后一种情况。在这种情况下,代码文本将指向一个“未创建即赋值”的变量x我们知道按照ECMAScript的约定在非严格模式中向这样的变量赋值就意味着在全局环境中创建新的变量x;而在严格模式中,这将不被允许,并因此而抛出异常。

由于Eval环境通过“词法环境与变量环境分离”来隔离了“严格模式”对它的影响因此上述约定在两种模式下实现起来其实都比较简单。

对于非严格模式来说代码可以通过词法环境的链表逆向查找直到global并且因为无法找到x而产生一个“未发现的引用”。我们之前讲过在非严格模式中对“未发现的引用”的置值将实现为向全局对象“global”添加一个属性于是间接地、动态地就实现了添加变量x。对于严格模式呢,向“未发现的引用”的置值触发一个异常就可以了。

这些逻辑都非常简单,而且易于理解。并且,最关键和最重要的是,这些机制与我今天所讲的内容——也就是变量环境和词法环境——完全无关。

然而,接下来你需要动态尝试一下:

  • 如果你按标题中的代码去尝试写eval()那么无论如何——无论你处于严格模式还是非严格模式你都将创建出一个变量x来。

标题中的代码突破了“严格模式”的全部限制!这就是我下一讲要为你讲述的内容了。

今天没有设置知识回顾,也没有作业。但我建议你尝试一下标题中的代码,也可以回顾一下本节课中提到的诸多概念与名词。

我相信它与你平常使用的和理解的有许多不一致的地方甚至有矛盾之处。但是相信我这就是这个专栏最独特的地方它讲述JavaScript的核心原理而不是重复那些你可能已经知道的知识。

欢迎你在进行深入思考后,与其他同学分享自己的想法,也让我有机会能听听你的收获。