改进代码缓存

发布时间 · 标签: internals

在 V8 中,当某些脚本经常使用时,V8 会把这些脚本生产的代码缓存起来。从 Chrome 66 开始,当引擎在顶层执行后,我们会把生成的更多代码缓存起来。这会导致初始加载时分析和编译时间缩短 20-40%。

背景 #

V8 使用两种代码缓存策略来缓存生成的代码,以便以后重用。首先是存在于每个 V8 实例中的内存缓存(in-memory cache)。初始编译后生成的代码存储在此缓存中,以源字符串作为 key。这可以在 V8 的相同实例中重复使用。另一种代码缓存序列化生成的代码并将其存储在磁盘上供将来使用。该缓存并不只属于 V8 的特定实例,可以在 V8 的不同实例中使用。这篇博文主要关注 Chrome 中使用的第二种代码缓存。(其他嵌入程序也使用这种代码缓存;它不仅限于 Chrome,但本博文仅关注 Chrome 中的使用情况。)

Chrome 将序列化的生成代码(generated code)存储到磁盘缓存中,并使用脚本资源的 URL 作为 key。加载脚本时,Chrome 会检查磁盘缓存。如果脚本已被缓存,则 Chrome 会将序列化的数据作为编译请求的一部分传递给 V8。然后 V8 反序列化这些数据,而不是解析和编译脚本。还有额外的检查来确保代码仍然可用(例如:版本不匹配导致缓存的数据无法使用)。

真实世界的数据显示,代码缓存命中率(对于可以缓存的脚本)很高(~86%)。虽然这些脚本的缓存命中率很高,但是我们每个脚本缓存的代码量并不是很高。我们的分析表明,增加缓存的代码量可以使 JavaScript 代码的解析和编译减少大约 40% 的时间。

增加缓存的代码量 #

在以前的方法中,代码缓存与脚本的编译请求相结合。

嵌入者可以请求 V8 序列化它在顶级编译新的 JavaScript 源文件时生成的代码。编译脚本后,V8 返回序列化代码。当 Chrome 再次请求相同的脚本时,V8 会从缓存中获取序列化的代码并对其进行反序列化。V8 完全避免了重新编译已经在缓存中的函数。下图显示了这些场景:

V8 仅编译在顶层编译期间的立即执行的函数(IIFE),并标记用于延迟编译的其他函数。这样可以避免编译不需要的函数,从而提高页面加载时间,但这也意味着序列化数据仅包含需要迫切编译的函数的代码。

在 Chrome 59 之前,我们必须在代码开始执行之前生成代码缓存。较早的 V8 基本编译器(Full-codegen)为执行上下文生成专用代码。Full-codegen 将代码补丁用于特定执行上下文的快速路径(fast-path)操作。当在其他执行上下文中使用的,需要删除特定于某个上下文的数据,此类代码不能被轻易地序列化。

随着在 Chrome 59 中启用 Ignition,这一限制不再是必要的。Ignition 使用数据驱动的内嵌缓存来执行当前执行上下文中的快速路径操作。上下文相关数据存储在反馈向量(feedback vector)中并与生成的代码分开。通过这种方式也就使得“执行脚本之后也能生成代码缓存”称为可能。在我们执行脚本时,会编译更多的函数(标记为惰性编译的函数),从而允许我们缓存更多的代码。

V8 公开了一个新 API,ScriptCompiler::CreateCodeCache,可以让代码缓存请求不再依赖于编译请求。在编译请求的过程中请求代码缓存已被弃用,并且不适用于 V8 v6.6 及更高版本。从版本 66 开始,Chrome 使用此 API 在顶层执行后请求代码缓存。下图显示了请求代码缓存的新场景。代码缓存在顶层执行之后被请求,并因此包含在脚本执行期间稍后被编译的函数的代码。在后面的运行中(在下图中显示为热运行),它避免了在顶层执行期间编译函数。

结果 #

使用我们内部的 real-world benchmarks 测试此功能的性能。下图显示了早期高速缓存方案中分析和编译时间的缩短。在大多数页面上,解析和编译时间都会减少 20-40% 左右。

来自其它数据也显示了和我们相似的结果,在桌面和移动设备上编译 JavaScript 代码的时间减少了 20-40%。在 Android 上,这种优化还可以转化为顶级页面加载指标减少 1-2%,例如网页可以被用户操作时所需的时间。我们还监测了 Chrome 的内存和磁盘使用情况,但没有看到任何明显的回归。