CategoryResourceRepost/极客时间专栏/JavaScript核心原理解析/从粗通到精通的进阶之路:唯一不变的是变化本身/21 | (0, eval)("x = 100") :一行让严格模式形同虚设的破坏性设计(下).md
louzefeng d3828a7aee mod
2024-07-11 05:50:32 +00:00

399 lines
22 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

<audio id="audio" title="21 | (0, eval)("x = 100") 一行让严格模式形同虚设的破坏性设计" controls="" preload="none"><source id="mp3" src="https://static001.geekbang.org/resource/audio/54/af/543b545017e1234aeecc0291d7d910af.mp3"></audio>
你好,我是周爱民。欢迎回到我的专栏。书接上回,这一讲我们仍然讲动态执行。
之前我说到过setTimeout和setInterval的第一个参数可以使用字符串那么如果这个参数使用字符串的话代码将会在哪里执行呢毕竟当定时器被触发的时候程序的执行流程“很可能”已经离开了当前的上下文环境而切换到未知的地方去了。
所以的确如你所猜测的那样如果采用这种方式来执行代码那么代码片断将在全局环境中执行。并且这也是后来这一功能被部分限制了的原因例如你在某些版本的Firefox中这样做那么你可能会得到如下的错误提示
```
&gt; setTimeout('alert(&quot;HI&quot;)', 1000)
Content Security Policy: The pages settings blocked the loading of a resource at eval (“script-src”).
```
在全局环境中执行代码所带来的问题远远不止于此,接下来,我们就从这个问题开始谈起。
## 在全局环境中的eval
早期的JavaScript是应用于浏览器环境中的因此当网页中使用`&lt;SCRIPT&gt;`标签加载.js文件时候代码就会在浏览器的全局环境中执行。但这个过程是同步的将BLOCK掉整个网页的装载进度因此有了`defer`这个属性来指示代码异步加载将这个加载过程延迟到网页初始化结束之后。不过即使如此JavaScript代码仍然是执行在全局环境中的。
在那个时代,`&lt;SCRIPT&gt;`标签还支持`for`和`event`属性用于指定将JavaScript代码绑定给指定的HTML元素或事件响应。当采用这种方式的时候代码还是在全局环境中执行只不过可能初始化为一个函数的回调并且`this`指向元素或事件。很不幸,有许多浏览器并不实现这些特性,尤其是`for`属性它也许在IE中还存在这一特性与ActiveXObject的集成有关。
关于脚本的动态执行你能想象的绝大多数能在浏览器中玩的花样大概都在这里了。当然你还可以在DOM中动态地插入一个`SCRIPT`标签来装载脚本这在Ajax还没有那么流行的时候是唯二之选。另一种选择是在Document初始化结束之前使用`document.write()`。
总而言之为了动态执行一点什么古典时代的WEB程序员是绞尽脑汁。
那么为什么不用`eval()`呢?
按照JavaScript脚本的执行机制所有的.js文件加载之后它的全局代码只会执行一次。无论是在浏览器还是在Node.js环境中以及它们的模块加载环境中都是如此。这意味着放在这些全局代码中的`eval()`事实上也就只在初始化阶段执行一次而已。而`eval()`又有一个特别的性质,那就是它“总是在”当前上下文中执行代码。因此,所有其他的、放在函数中的`eval()`代码都只会影响函数内的、局部的上下文,而无法影响全局。
也就是说,除了初始化,`eval()`无法在全局执行。
不同的浏览器都有各自的内置机制来解决这个问题。IE会允许用户代码调用`window.execScript()`,实现那些希望`eval()`执行在全局的需求。而Firefox采用了另外的一条道路称为`window.eval()`。这个从字面上就很好理解,就是“让`eval()`代码执行在window环境中”。而`window`就是浏览器中的全局对象global也就是说window.eval与global.eval是等义的。
这带来了另外一个著名的、在Firefox早期实现的JavaScript特性称为“对象的eval”。
如果你试图执行`obj.eval(x)`,那么就是将代码文本`x`执行在`obj`的对象闭包中(类似于`with (obj) eval(x)`。因为全局环境就是使用global来创建的“对象环境对象闭包所以这是在实现“全局eval()”的时候“顺手”就实现了的特性。
但这意味着用户代码可以将`eval`函数作为一个方法赋给任何一个JavaScript对象以及任何一个属性名字。例如
```
var obj = { do: eval };
obj.do('alert(&quot;HI&quot;)');
```
## 名字之争
现在“名字”成了一个问题在任何地方、任何位置任何对象以及任何函数的上下文中都能“以不同的名字”来eval()一段代码文本。
这太不友好了!这意味着我们永远无法有效地判断、检测和优化用户代码。一方面,这对于程序员来说是灾难,另一方面,对引擎的实现者来说也非常绝望。
于是从ECMAScript 6开始ECMAScript规定了“标准而规范地使用eval()”的方法你仅仅只能直接使用一个字面文本为“eval”字符串的函数名字并且作为普通函数调用的形式来调用`eval()`,这样才算是“**直接调用的eval()**”。
这个约定是非常非常罕见的。JavaScript历史上几乎从未有过在规范中如此强调一个名字“在字面文本上的规范性”。在ECMAScript 5之后一共也只出现了两个这里的"eval"是一个,而另一个是严格模式(这个稍晚一点我们也会详细讲到)。
根据ECMAScript的约定下面的这些都不是“直接调用的eval()”:
```
// 对象属性
obj = { eval }
obj.eval(x)
// 更名的属性名或变量名(包括全局的或函数内局部的)
e = eval
var e = eval
e(x)
// super引用中的父类属性包括原型方法和静态方法
class MyClass { eval() { } }
MyClass.eval = eval;
class MyClassEx extends MyClass {
foo() { super.eval(x) }
static foo() { super.eval(x) }
}
// 作为函数(或其他大多数表达式)的返回
function foo() { return eval }
foo()(x)
// (或)
(_=&gt;eval)()(x)
```
总之你所有能想到的一切——换个名字或者作为对象属性的方式来调用eval都不再作为“直接调用的eval()”来处理了。
那么你可能会想要知道怎样才算是“直接调用的eval()”,以及它有什么效果呢?
很简单的,在全局、模块、函数的任意位置,以及一个运行中的`eval(...)`的代码文本的任意位置上,你使用的
>
`eval(x)`
这样的代码都被称为“直接调用”。直接调用eval()意味着:
- 在代码所在位置上临时地创建一个“Eval环境”并在该环境中执行代码`x`。
而反过来,其他任何将`eval()`调用起来,或者执行到`eval()`函数的方式,都称为“间接调用”。
而这两讲的标题中的写法就是一个经典的“间接调用eval”的写法
```
(0, eval)(x)
```
晚一点,我们会再来详细讲述这个“间接调用”,接下来我们先说说与它相关的一点基础知识,也就是“严格模式”。
>
NOTE之所以称为“经典的”写法是因为在ECMAScript规范的测试项目test262中所有间接调用相关的示例都是采用这种写法的。
## 严格模式是执行限制而不是环境属性
ECMAScript 5中推出的严格模式是一项重大的革新之举它静默无声地拉开了ECMAScript 6~ECMAScript 10这轰轰烈烈的时代序幕。
之所以说它是“静默无声的”是因为这项特性刚出来的时候大多数人并不知道它有什么用有什么益处以及为什么要设计成这个样子。所以它几乎算是一个被“强迫使用”的特性对你的团队来说是这样对整个的JavaScript生态来说也是如此。
但是“严格模式”确实是一个好东西,没有它,后来的众多新特征就无法形成定论,它奠定了一个稳定的、有效的、多方一致的语言特性基础,几乎被所有的引擎开发厂商欢迎、接受和实现。
所以我们如今大多数新写的JavaScript代码其实都是在严格模式环境中运行的。
对吗?
不太对。上面这个结论对于大多数开发者来说是适用的并能理解和接受。但是要是你在ECMAScript规范层面或者在JavaScript引擎层面来看这句话你会发现“严格模式环境”是什么鬼我们从来没见过这个东西
是的所谓“严格模式”其实从来都不是一种环境模式或者说没有一个环境是具有“严格模式”这样的属性的。所有的执行环境——所有在执行引擎层面使用的“执行上下文ExecuteContext以及它们所引用的“环境Environment都没有“严格模式”这样的模式也没有这样的性质。
我们所有的代码都工作在非严格模式中,而“严格模式”不过是代码执行过程中的一个限制。更确切地说,即使你用如下命令行:
```
&gt; node --use-strict
```
来启动Node.js也仍然是运行在一个JavaScript的“非严格模式”环境中的是的是的我知道你可以立即写出来一行代码来反驳上述观点
```
# 在上例启动的Node.js环境中测试
&gt; arguments = 1
SyntaxError: Unexpected eval or arguments in strict mode
```
但是请相信我:上面的示例只是一个执行限制,你绝对是运行在一个“非严格模式”环境中的!
因为所有的四种执行环境包括Eval环境在它们创建和初始化时都并没有“严格模式”这样的性质。并且在全局环境初始化之前在宿主环境中初始化引擎时引擎也根本不知道所谓“严格模式”的存在。严格模式这个特性是在环境创建完之后在执行代码之前从源代码文本中获取的性质例如
```
// (JavaScript引擎的初始化过程
// 初始化全局in InitializeHostDefinedRealm()
CALL SetRealmGlobalObject(realm, global, thisValue)
-&gt; CALL NewGlobalEnvironment(globalObj, thisValue)
// 执行全局任务含解析源代码文本等in ScriptEvaluationJob()
s = ParseScript(sourceText, realm, hostDefined)
CALL ScriptEvaluation(s)
// 执行全局代码in ScriptEvaluation(s)
result = GlobalDeclarationInstantiation(scriptBody, globalEnv)
if (result.[[Type]] === normal) {
result = ENGING_EVALUATING(scriptBody)
...
```
在这整个过程中ParseScript()解析源代码文本时如果发现“严格模式的指示字符串”那么就会将解析结果例如抽象语法树ast的属性ast.IsStrict置为true。但这个标记仅仅只作用于抽象语法树层面而环境中并没有相关的标识——在模块中这个过程是类似的只是缺省就置为true而已。
而另一方面,例如函数,它的“严格模式的指示字符串”也是在**语法解析阶段**得到的,并作为函数对象的一个内部标记。但是函数环境创建时却并不使用它,因此也不能在环境中检测到它。
我列举所有这些事实,是试图说明:“严格模式”是它们相关的可执行对象的一个属性,但并不是与之对应的执行环境的属性。因此,当“执行引擎”通过“词法环境或变量环境”来查找时,是看不到这些属性的,也就是说,执行引擎所知道的环境并没有“严格/不严格”的区别。
那么严格模式是怎么被实现的呢?
答案是绝大多数严格模式特性都是在“相关的可执行对象”创建或初始化阶段就被处理掉的。例如严格模式约定“没有arguments.caller和arguments.callee”那么就在初始化这个对象的时候不创建这两个属性就好了。
另外一部分特性是在**语法分析阶段**识别和处理的。例如“禁止掉8进制字面量”由于“严格模式的指示字符串use strict”总是在第一行代码所以在其他代码parser之前解析器就已经根据指示字符串配置好了解析逻辑对“8进制字面量”可以直接抛出异常了。
从等等类似于此的情况,你能看到“严格模式”的所有限制特性,其实都并不需要执行引擎参与。进一步地来说,引擎设计者也并不愿意掺合这件事,因为这种模式识别将大幅度地降低引擎的执行效能,以及使引擎优化的逻辑复杂化。
但是现在来到了“eval()”调用,怎么处理它的严格模式问题呢?
## 直接调用VS间接调用
绝大多数严格模式的特性都与语法分析结束后在指定对象上置的“IsStrict”这样的标记有关它们可以指导引擎如何创建、装配和调用代码。但是到了执行器内部由于不可能从执行上下文开始反向查找环境并进一步检测严格模式标识所以`eval()`在原则上也不能知道“当前的”严格模式状态。
这有例外因为“直接调用eval()”是比较容易处理的,因为在使用`eval()`的时候,调用者——注意不是执行引擎——可以在当前自己的状态中得到严格模式的值,并将该值传入`eval()`的处理过程。这在ECMAScript中是如下的一段规范
```
...
- If strictCaller is true, let strictEval be true.
- Else, let strictEval be IsStrict of script.
...
```
也就是说如果caller的严格模式是true那么`eval(x)`就继承这个模式,否则就从`x`也就是script的语法解析结果中检查IsStrict标记。
那么间接调用呢?
所谓间接调用是JavaScript为了避免代码侵入而对所有非词法方式的即直接书写在代码文本中的`eval()`调用所做的定义。并且ECMAScript约定
- 约定1所有的“间接调用”的代码总是执行在“全局环境”中。
这样一来,你就没有办法向函数内传入一个对象,并用该对象来“在函数内部”执行一堆侵入代码了。
但是回到前面的问题:如果是间接调用,那么这里的`strictCaller`是谁呢?又处于哪种“严格模式”状态中呢?
答案是:不知道。因为当这样来引用全局的时候,上下文/环境中并没有全局的严格模式性质反向查找源代码文本或解析过的ast树呢既不经济也不可靠。所以就有另外一个约定
- 约定2所有的“间接调用”的代码将默认执行在“非严格模式”中。
也就是说,间接调用将突破引擎对严格模式的任何设置,你总是拥有一个“全局的非严格模式”并在其中执行代码。例如:
```
# (控制台)
&gt; node --use-strict
# Node.js环境, 严格模式的全局环境)
&gt; arguments = 1
SyntaxError: Unexpected eval or arguments in strict mode
&gt; 012
SyntaxError: Octal literals are not allowed in strict mode.
# 间接调用例1
&gt; (0, eval)('arguments = 1') // accept!
&gt; arguments
1
# 间接调用例2
&gt; (0, eval)('012') // accept!
10
# 间接调用例3本讲的标题代码将创建变量x
&gt; (0, eval)('x = 100') // accept!
&gt; x
100
```
## 为什么标题中的代码是严格模式
最后一个疑问,就是为什么“标题中的这种写法”会是一种间接调用。并且,更有对比性地来看,如果是下面这种写法,为什么就“不再是”间接调用了呢?例如
```
# 直接调用
&gt; (eval)('x = 100')
ReferenceError: x is not defined
at eval (eval at ...)
# 间接调用
&gt; (0, eval)('x = 100')
100
```
在JavaScript中表达式的返回结果Result可能是值也可能是“引用规范类型”。在“引用”的情况中有两个例子是比较常见、却又常常被忽略的包括
```
# 属性存取返回的是引用
&gt; obj.x
# 变量的标识符(作为单值表达式)是引用
&gt; x
```
我们之前的课程中说过所有这种“引用规范类型”类型的结果Result在作为左手端的时候它是引用而作为右手端的时候它是值。所以才会有“x = x”这一个表达式的完整语义
- 将右手端x的值赋给左手端的x的引用。
好了然而还存在一个运算符它可以“原样返回”之前运算的结果Result这就是“分组运算符()”。因为这个运算符有这样的特性所以当它作用于属性存取和一般标识符时分组运算返回的也仍然是后者的“运算结果Result”。例如
```
# “结果Result”是`100`的值
&gt; (100)
# “结果Result”是`{}`对象字面量(值)
&gt; ({})
# “结果Result”是`x`的引用
&gt; (x)
# “结果Result”是`obj.x`的引用
&gt; (obj.x)
```
所以,从“引用”的角度上来看,`(eval)`和`eval`的效果也就完全一致,它们都是`global.eval`在“当前上下文环境”中的一个引用。但是我们接下来看,我们在这一讲的标题中写的这个分组表达式是这样的:
```
(0, eval)
```
这意味着在分组表达式内部还有一个运算称为“连续运算逗号运算符”。连续运算的效果是“计算每一个表达式并返回最后一个表达式的值Value”。注意这里不是“结果Result”。所以它相当于执行了
```
(GetValue(0), GetValue(eval))
```
因此最后一个运算将使结果从“Result-&gt;Value”于是“引用的信息”丢失了。在它外层也就是其后的分组运算得到的、并继续返回的结果就是“GetValue(eval)”了。这样一来,在用户代码中的`(eval)(x)`还是直接调用“eval的引用”而`(0, eval)(x)`就已经变成间接调用“eval的值”了。
讲到这里,你可能已经意识到:关键在于`eval`是一个引用还是一个值是的的确如此不过在ECMAScript规范中一个“eval的直接调用”除了必须是一个“引用”之外还有一个附加条件它还必须是一个环境引用
也就是说,属性引用的`eval`仍然是算着间接调用的。例如:
```
# (控制台,直接进入全局的严格模式)
&gt; node --use-strict
# 测试用的代码in Node.js
&gt; var x = 'arguments = 1'; // try source-text
# 作为对象属性
&gt; var obj = {eval};
# 间接调用:这里的确是一个引用,并且名字是字符串文本&quot;eval&quot;,但它是属性引用
&gt; (obj.eval)(x)
1
# 直接调用eval是当前环境中的一个名字引用标识符
&gt; eval(x)
SyntaxError: Unexpected eval or arguments in strict mode
# 直接调用:同上(分组运算符保留了引用的性质)
&gt; (eval)(x)
SyntaxError: Unexpected eval or arguments in strict mode
```
所以无论如何只要这个函数的名字是“eval”并且是“global.eval这个函数在当前环境中的引用”那么它就可以得到豁免成为传统意义上的“直接调用”。例如
```
// (一些豁免的案例,如下是直接调用)
// with中的对象属性对象环境
with ({ eval }) eval(x)
// 直接名字访问(作为缺省参数引用)
function foo(x, eval=eval) {
return eval(x)
}
// 不更改名字的变量名(位于函数环境内部的词法/变量环境中)
function foo(x) {
var eval = global.eval; // 引用自全局对象
return eval(x)
}
```
## eval怎么返回结果
那么最后一个问题是“eval怎么返回结果呢”
这个问题的答案反倒非常简单。由于`eval(x)`是将代码文本`x`作为语句执行,所以它将返回语句执行的结果。所有语句执行都只返回值,而不返回引用。所以, 即使代码`x`的运算结果Result是一个“引用规范类型那么`eval()`也只返回它的值即“GetValue(Result)”。例如:
```
# 在代码文本中直接创建了一个`eval`函数的“引用(规范类型)”
&gt; obj = { foo() { return this === obj } }
# this.foo调用中未丢失`this`这个引用
&gt; obj.foo()
true
# 同上,分组表达式传回引用,所以`this`未丢失
&gt; (obj.foo)()
true
# eval将返回值所以`this`引用丢失了
&gt; eval('obj.foo')()
false
```
## 结语
今天这一讲结束了对标题中代码的全部分析。由于标题中的代码是一个“间接调用的eval”因此它总是运行在一个非严格模式的全局中于是变量`x`也就总是可以被创建或重写。
“间接调用IndriectCall”是JavaScript非常非常少见的一种函数调用性质它与“SuperCall”可以合并起来视为JavaScript中执行系统中的“两大顶级疑难”。对间接调用的详细分析涉及执行引擎的工作原理、环境和环境组件的使用、严格模式、引用规范类型的特殊性以及最为特殊的“eval是作为特殊名字来识别的”等等多个方面的基础特性。
间接调用对“严格模式”并非是一种传统意义上的“破坏”只是它的工作机制正正好地绕过了严格模式。因为严格模式并不是环境的性质而是代码文本层面的执行限制所以当eval的间接调用需要使用全局时无法“得到并进入”这种模式而已。
最后间接调用其实是对传统的window.execScript或window.eval的一个保留。它有着在兼容性方面的实用意义但对系统的性能、安全性和可靠性都存在威胁。无论如何你应该限制它在代码中的使用。不过它的的确确是ECMAScript规范中严格声明和定义过的特性并且可称得上是“黑科技Hack skill”了。
## 思考题
今天有一个作业留给你思考,问题很简单:
- 请你尝试再找出一例豁免案例也就是直接调用eval()的写法。
欢迎你在进行深入思考后,与其他同学分享自己的想法,也让我有机会能听听你的收获。
今天的课程就到这里。下一讲,我们将讨论“动态函数”,这既是“动态语言”部分的最后一小节,也将是专栏的最后一讲。