go语言变量逃逸分析

2023-12-02 11:14:52

什么是栈

栈的概念

栈是一种特殊规则的线性表的数据结构
特点是先进后出
往栈中放入元素的过程叫做入栈。入栈会增加栈的元素数量，最后放入的元素总是位于栈的顶部，最先放入的元素总是位于栈的底部
从栈中取出元素时，只能从栈顶部取出。取出元素后，栈的元素数量会变少。最先放入的元素总是最后被取出，最后放入的元素总是最先被取出。不允许从栈底获取数据，也不允许对栈成员（除了栈顶部的成员）进行任何查看和修改操作

栈跟变量的关系

栈可用于内存分配，栈的分配和回收速度非常快
下面的代码展示了栈在内存分配上的作用

func calc(a, b int) int {
    var c int
    c = a * b
    var x int
    x = c * 10
    return x
}

代码说明如下：

第 1 行，传入 a、b 两个整型参数
第 2 行，声明整型变量c，运行时，c会分配一段内存用以存储c的数值
第 3 行，将 a 和 b 相乘后赋值给 c
第 4 行，声明整型变量 x，x 也会被分配一段内存
第 6 行，让 c 乘以 10 后赋值给变量 x

上面的代码在没有任何优化的情况下，会进行变量 c 和 x 的分配过程。Go语言默认情况下会将 c 和 x 分配在栈上，这两个变量在 calc() 函数退出时就不再使用，函数结束时，保存 c 和 x 的栈内存再出栈释放内存，整个分配内存的过程通过栈的分配和回收都会非常迅速

什么是堆

堆在内存分配中类似于往一个房间里摆放各种家具，家具的尺寸有大有小，分配内存时，需要找一块足够装下家具的空间再摆放家具。经过反复摆放和腾空家具后，房间里的空间会变得乱七八糟，此时再往这个空间里摆放家具会发现虽然有足够的空间，但各个空间分布在不同的区域，没有一段连续的空间来摆放家具。此时，内存分配器就需要对这些空间进行调整优化

堆分配内存和栈分配内存相比，堆适合不可预知大小的内存分配。但是为此付出的代价是分配速度较慢，而且会形成内存碎片

变量逃逸——自动决定变量分配方式，提高运行效率

堆和栈各有优缺点，该怎么在编程中处理这个问题呢？在 C/C++ 语言中，需要开发者自己学习如何进行内存分配，选用怎样的内存分配方式来适应不同的算法需求。比如，函数局部变量尽量使用栈，全局变量、结构体成员使用堆分配等。程序员不得不花费很长的时间在不同的项目中学习、记忆这些概念并加以实践和使用

Go语言将这个过程整合到了编译器中，命名为“变量逃逸分析”。通过编译器分析代码的特征和代码的生命周期，决定应该使用堆还是栈来进行内存分配

逃逸分析

通过下面的代码来展现Go语言如何使用命令行来分析变量逃逸，代码如下：

package main
import "fmt"
// 本函数测试入口参数和返回值情况
func dummy(b int) int {
    // 声明一个变量c并赋值
    var c int
    c = b
    return c
}
// 空函数, 什么也不做
func void() {
}
func main() {
    // 声明a变量并打印
    var a int
    // 调用void()函数
    void()
    // 打印a变量的值和dummy()函数返回
    fmt.Println(a, dummy(0))
}

代码说明：

第4行，dummy() 函数拥有一个参数，返回一个整型值，用来测试函数参数和返回值分析情况
第6行，声明变量 c，用于演示函数临时变量通过函数返回值返回后的情况
第11行，这是一个空函数，测试没有任何参数函数的分析情况
第15行，在 main() 中声明变量 a，测试 main() 中变量的分析情况
第17行，调用 void() 函数，没有返回值，测试 void() 调用后的分析情况
第19行，打印 a 和 dummy(0) 的返回值，测试函数返回值没有变量接收时的分析情况

运行上面代码：

go run -gcflags "-m -l" main.go

使用 go run 运行程序时，-gcflags 参数是编译参数。其中 -m 表示进行内存分配分析，-l 表示避免程序内联，也就是避免进行程序优化。

运行结果如下：

# command-line-arguments
./main.go:22:13: ... argument does not escape
./main.go:22:13: a escapes to heap
./main.go:22:22: dummy(0) escapes to heap
0 0

上面例子中变量 c 是整型，其值通过 dummy() 的返回值“逃出”了 dummy() 函数。变量 c 的值被复制并作为 dummy() 函数的返回值返回，即使变量 c 在 dummy() 函数中分配的内存被释放，也不会影响 main() 中使用 dummy() 返回的值。变量 c 使用栈分配不会影响结果

取地址发生逃逸

下面的例子使用结构体做数据，来了解结构体在堆上的分配情况，代码如下：

package main
import "fmt"
// 声明空结构体测试结构体逃逸情况
type Data struct {
}
func dummy() *Data {
    // 实例化c为Data类型
    var c Data
    //返回函数局部变量地址
    return &c
}
func main() {
    fmt.Println(dummy())
}

代码说明如下：

第4行，声明一个空的结构体做结构体逃逸分析
第6行，将 dummy() 函数的返回值修改为 *Data 指针类型
第10行，取函数局部变量 c 的地址并返回

运行代码，做逃逸分析

//执行命令
go run -gcflags "-m -l" main.go
//结果分析
# command-line-arguments
./main.go:11:6: moved to heap: c
./main.go:16:13: ... argument does not escape
&{}

注意第 4 行出现了新的提示：将 c 移到堆中，这句话表示，Go 编译器已经确认如果将变量 c 分配在栈上是无法保证程序最终结果的，如果这样做，dummy() 函数的返回值将是一个不可预知的内存地址

这种情况一般是 C/C++ 语言中容易犯错的地方，引用了一个函数局部变量的地址，Go语言最终选择将 c 的 Data 结构分配在堆上。然后由垃圾回收器去回收 c 的内存

内存逃逸原则

在使用Go语言进行编程时，Go语言的设计者不希望开发者将精力放在内存应该分配在栈还是堆的问题上，编译器会自动帮助开发者完成这个纠结的选择，但变量逃逸分析也是需要了解的一个编译器技术，这个技术不仅用于Go语言，在 Java 等语言的编译器优化上也使用了类似的技术

编译器的分配堆栈原则是：

变量是否被取地址
变量是否发生逃逸

码农公寓