浏览器的工作原理与v8引擎

浏览器的工作原理与v8引擎

**JavaScript是一门高级的编程语言。**那么有高级编程语言,就有低级编程语言,从编程语言发展历史来说,可以划分为三个阶段:

  • 机器语言:1000100111011000,一些机器指令;
  • 汇编语言:mov ax,bx,一些汇编指令;
  • 高级语言:C、C++、Java、JavaScript、Python;

但是计算机它本身是不认识这些高级语言的,所以我们的代码最终还是需要被转换成机器指令:

浏览器的工作原理

那么javaScript代码在浏览器中是如何被执行的?

首先当我们输入一个url,这时候我们向服务器发送http请求,服务器收到请求,会把我们请求的数据返回给我们,这个时候我们就接受到了服务器返回给我们的html页面,浏览器会把相应的css文件和js文件下载下来,这个时候浏览器内核开始对html页面进行解析,解析什么?解析的过程是什么?

  • 首先会对页面中的所有标签进行解析,会生成一颗DOM树,将标签转换成DOM树中的DOM节点,我们叫内容树
  • 接下来构建渲染树,会解析页面中的css样式文件,那么这些样式文件和对应的DOM节点就会形成渲染树,继续接下来的操作。
  • 有了这些还不够,因为我们要知道相应的DOM节点在页面中的位置,因此我们要生成布局渲染树,浏览器会根据浏览器窗口的大小,计算每一个元素的大小,位置,给出在页面上的精确坐标。
  • 接下来就是绘制渲染树,遍历渲染树,在页面上呈现。
  • 正如下面这张图所示,一个url从请求到显示页面的过程。
  • 但是我们还没有解析js文件,所以当我们解析html过程中如果遇到js文件,这个时候就会终止html页面的解析,去解析js文件来操作DOM,那么怎么解析javaScript代码?下面来介绍…

浏览器的工作原理与v8引擎

认识浏览器内核

我们经常会说:不同的浏览器有不同的内核组成

  • Gecko:早期被Netscape和Mozilla Firefox浏览器浏览器使用;
  • Trident:微软开发,被IE4~IE11浏览器使用,但是Edge浏览器已经转向Blink;
  • Webkit:苹果基于KHTML开发、开源的,用于Safari,Google Chrome之前也在使用;
  • Blink:是Webkit的一个分支,Google开发,目前应用于Google Chrome、Edge、Opera等;

等等…

事实上,我们经常说的浏览器内核指的是浏览器的排版引擎:

排版引擎(layout engine),也称为浏览器引擎(browser engine)、页面渲染引擎(rendering engine)

样版引擎

认识JavaScript引擎

为什么需要JavaScript引擎呢?

我们前面说过,高级的编程语言都是需要转成最终的机器指令来执行的;

事实上我们编写的JavaScript无论你交给浏览器或者Node执行,最后都是需要被CPU执行的;

但是CPU只认识自己的指令集,实际上是机器语言才能被CPU所执行

所以我们需要JavaScript引擎帮助我们将JavaScript代码翻译成CPU指令来执行

比较常见的JavaScript引擎有哪些呢?

SpiderMonkey:第一款JavaScript引擎,由Brendan Eich开发(也就是JavaScript作者);

Chakra:微软开发,用于IE浏览器;

JavaScriptCore:WebKit中的JavaScript引擎,Apple公司开发;

V8:Google开发的强大JavaScript引擎,也帮助Chrome从众多浏览器中脱颖而出;

浏览器内核和JS引擎的关系

这里我们先以WebKit为例,WebKit事实上由两部分组成的:

**WebCore:**负责HTML解析、布局、渲染等等相关的工作;

**JavaScriptCore:**解析、执行JavaScript代码;

看到这里,学过小程序的同学有没有感觉非常的熟悉呢?

在小程序中编写的JavaScript代码就是被JSCore执行的;

另外一个强大的JavaScript引擎就是V8引擎。

​ V8是用C ++编写的Google开源高性能JavaScript和WebAssembly引擎,它用于Chrome和Node.js等。它实现ECMAScript和WebAssembly,并在Windows 7或更高版本,macOS 10.12+和使用x64,IA-32, ARM或MIPS处理器的Linux系统上运行。V8可以独立运行,也可以嵌入到任何C ++应用程序中。

v8引擎的原理

浏览器的工作原理与v8引擎

​ 首先浏览器把js代码下载下来,这时候v8引擎的Parse模块会对js代码进行词法解析和语法解析,词法解析会生成一个tokens(是一个数组,里面是一个个json对象),接下来tokens会被转化成AST(抽象语法树),这个时候在经过v8引擎的Ignition模块,会把AST转化字节码,字节码在转话成汇编语言,最后转化成CPU能够识别的机器语言(0,1),之后就是代码的执行过程。

​ 之所以要转化成字节码,是因为在不同的执行环境中(Mac系统,windows系统),CPU能够执行的机器语言是不同的,但是字节码能够跨平台使用。

V8引擎架构

V8引擎本身的源码非常复杂,大概有超过100w行C++代码,通过了解它的架构,我们可以知道它是如何对JavaScript执行的:

  • Parse模块会将JavaScript代码转换成AST(抽象语法树),这是因为解释器并不直接认识JavaScript代码;如果函数没有被调用,那么是不会被转换成AST的;

    • Parse的V8官方文档:https://v8.dev/blog/scanner
  • Ignition是一个解释器,会将AST转换成ByteCode(字节码),同时会收集TurboFan优化所需要的信息(比如函数参数的类型信息,有了类型才能进行真实的运算);如果函数只调用一次,Ignition会执行解释执行ByteCode;

    • Ignition的V8官方文档:https://v8.dev/blog/ignition-interpreter
  • TurboFan是一个编译器,可以将字节码编译为CPU可以直接执行的机器码;如果一个函数被多次调用,那么就会被标记为热点函数,那么就会经过TurboFan转换成优化的机器码,提高代码的执行性能; 但是,机器码实际上也会被还原为ByteCode,这是因为如果后续执行函数的过程中,类型发生了变化(比如sum函数原来执行的是number类型,后来执行变成了string类型),之前优化的机器码并不能正确的处理运算,就会逆向的转换成字节码;

    • TurboFan的V8官方文档:https://v8.dev/blog/turbofan-jit

v8引擎官方图

浏览器的工作原理与v8引擎

V8执行的细节

那么我们的JavaScript源码是如何被解析(Parse过程)的呢?

  • Blink将源码交给V8引擎,Stream获取到源码并且进行编码转换;

  • Scanner会进行词法分析(lexical analysis),词法分析会将代码转换成tokens;

  • 接下来tokens会被转换成AST树,经过Parser和PreParser:

    • Parser就是直接将tokens转成AST树架构;
    • PreParser称之为预解析,为什么需要预解析呢?
      • 这是因为并不是所有的JavaScript代码,在一开始时就会被执行。那么对所有的JavaScript代码进行解析,必然会影响网页的运行效率;
      • 所以V8引擎就实现了Lazy Parsing(延迟解析)的方案,它的作用是将不必要的函数进行预解析,也就是只解析暂时需要的内容,而对函数的全量解析是在函数被调用时才会进行;
      • 比如我们在一个函数outer内部定义了另外一个函数inner,那么inner函数就会进行预解析;
  • 生成AST树后,会被Ignition转成字节码(bytecode),之后的过程就是代码的执行过程(后续会详细分析)

JavaScript的执行过程

假如我们有下面一段代码,它在JavaScript中是如何被执行的呢?

浏览器的工作原理与v8引擎

初始化全局对象

js引擎会在执行代码之前,会在堆内存中创建一个全局对象:Global Object(GO)

  • 该对象 所有的作用域(scope)都可以访问;
  • 里面会包含Date、Array、String、Number、setTimeout、setInterval等等;
  • 其中还有一个window属性指向自己;

执行上下文栈(调用栈)

js引擎内部有一个执行上下文栈(Execution Context Stack,简称ECS),它是用于执行代码的调用栈

那么现在它要执行谁呢?执行的是全局的代码块

全局的代码块为了执行会构建一个 Global Execution Context(GEC)全局执行栈

GEC会 被放入到ECS中 执行;

GEC被放入到ECS中里面包含两部分内容:

  • **第一部分:**在代码执行前,在parser转成AST的过程中,会将全局定义的变量、函数等加入到GlobalObject中,
    • 但是并不会赋值;
    • 这个过程也称之为变量的作用域提升(hoisting)
  • **第二部分:**在代码执行中,对变量赋值,或者执行其他的函数;

GEC被放入到ECS中

浏览器的工作原理与v8引擎

GEC开始执行代码

浏览器的工作原理与v8引擎

遇到函数如何执行?

在执行的过程中执行到一个函数时,就会根据函数体创建一个函数执行上下文(Functional Execution Context–简称FEC),并且压入到EC Stack中。

FEC中包含三部分内容:

  • 第一部分:在解析函数成为AST树结构时,会创建一个Activation Object(AO):
    • AO中包含形参、arguments、函数定义和指向函数对象、定义的变量;
  • 第二部分:作用域链:由VO(在函数中就是AO对象)和父级VO组成,查找时会一层层查找;
  • 第三部分:this绑定的值:这个我们后续会详细解析;

FEC开始执行代码

AO对象)和父级VO组成,查找时会一层层查找;

  • 第三部分:this绑定的值:这个我们后续会详细解析;

FEC被放入到ECS中

浏览器的工作原理与v8引擎

FEC开始执行代码

浏览器的工作原理与v8引擎

上一篇:JavaScript高级---浏览器原理-V8引擎-js执行原理


下一篇:V8、JSCore、Hermes、QuickJS,hybrid开发JS引擎怎么选