Go 语言闭包详解

2019/03/09 8 min read

什么是闭包？闭包是由函数和与其相关的引用环境组合而成的实体。

下面就来通过几个例子来说明 Go 语言中的闭包以及由闭包引用产生的问题。

函数变量（函数值）

在说明闭包之前，先来了解一下什么是函数变量。

在 Go 语言中，函数被看作是第一类值，这意味着函数像变量一样，有类型、有值，其他普通变量能做的事它也可以。

func square(x int) {
	println(x * x)
}

直接调用：square(1)
把函数当成变量一样赋值：s := square；接着可以调用这个函数变量：s(1)。 注意：这里 square 后面没有圆括号，调用才有。

调用 nil 的函数变量会导致 panic。
函数变量的零值是 nil，这意味着它可以跟 nil 比较，但两个函数变量之间不能比较。

闭包

现在开始通过例子来说明闭包：

func incr() func() int {
	var x int
	return func() int {
		x++
		return x
	}
}

调用这个函数会返回一个函数变量。

i := incr()：通过把这个函数变量赋值给 i，i 就成为了一个闭包。

所以 i 保存着对 x 的引用，可以想象 i 中有着一个指针指向 x 或 i 中有 x 的地址。

由于 i 有着指向 x 的指针，所以可以修改 x，且保持着状态：

println(i()) // 1
println(i()) // 2
println(i()) // 3

也就是说，x 逃逸了，它的生命周期没有随着它的作用域结束而结束。

但是这段代码却不会递增：

println(incr()()) // 1
println(incr()()) // 1
println(incr()()) // 1

这是因为这里调用了三次 incr()，返回了三个闭包，这三个闭包引用着三个不同的 x，它们的状态是各自独立的。

闭包引用

现在开始通过例子来说明由闭包引用产生的问题：

x := 1
f := func() {
	println(x)
}
x = 2
x = 3
f() // 3

因为闭包对外层词法域变量是引用的，所以这段代码会输出 3。

可以想象 f 中保存着 x 的地址，它使用 x 时会直接解引用，所以 x 的值改变了会导致 f 解引用得到的值也会改变。

但是，这段代码却会输出 1：

x := 1
func() {
	println(x) // 1
}()
x = 2
x = 3

把它转换成这样的形式就容易理解了：

x := 1
f := func() {
	println(x)
}
f() // 1
x = 2
x = 3

这是因为 f 调用时就已经解引用取值了，这之后的修改就与它无关了。

不过如果再次调用 f 还是会输出 3，这也再一次证明了 f 中保存着 x 的地址。

可以通过在闭包内外打印所引用变量的地址来证明：

x := 1
func() {
	println(&x) // 0xc0000de790
}()
println(&x) // 0xc0000de790

可以看到引用的是同一个地址。

循环闭包引用

接下来在三个例子中说明由循环内的闭包引用所产生的问题：

第一个例子

for i := 0; i < 3; i++ {
	func() {
		println(i) // 0, 1, 2
	}()
}

这段代码相当于：

for i := 0; i < 3; i++ {
	f := func() {
		println(i) // 0, 1, 2
	}
	f()
}

每次迭代后都对 i 进行了解引用并使用得到的值且不再使用，所以这段代码会正常输出。

第二个例子

正常代码：输出 0, 1, 2：

var dummy [3]int
for i := 0; i < len(dummy); i++ {
	println(i) // 0, 1, 2
}

然而这段代码会输出 3：

var dummy [3]int
var f func()
for i := 0; i < len(dummy); i++ {
	f = func() {
		println(i)
	}
}
f() // 3

前面讲到闭包取引用，所以这段代码应该输出 i 最后的值 2 对吧？

不对。这是因为 i 最后的值并不是 2。

把循环转换成这样的形式就容易理解了：

var dummy [3]int
var f func()
for i := 0; i < len(dummy); {
	f = func() {
		println(i)
	}
	i++
}
f() // 3

i 自加到 3 才会跳出循环，所以循环结束后 i 最后的值为 3。

所以用 for range 来实现这个例子就不会这样：

var dummy [3]int
var f func()
for i := range dummy {
	f = func() {
		println(i)
	}
}
f() // 2

这是因为 for range 和 for 底层实现上的不同。

第三个例子

var funcSlice []func()
for i := 0; i < 3; i++ {
	funcSlice = append(funcSlice, func() {
		println(i)
	})

}
for j := 0; j < 3; j++ {
	funcSlice[j]() // 3, 3, 3
}

输出序列为 3, 3, 3。

看了前面的例子之后这里就容易理解了：这三个函数引用的都是同一个变量（i）的地址，所以之后 i 递增，解引用得到的值也会递增，所以这三个函数都会输出 3。

添加输出地址的代码可以证明：

var funcSlice []func()
for i := 0; i < 3; i++ {
	println(&i) // 0xc0000ac1d0 0xc0000ac1d0 0xc0000ac1d0
	funcSlice = append(funcSlice, func() {
		println(&i)
	})

}
for j := 0; j < 3; j++ {
	funcSlice[j]() // 0xc0000ac1d0 0xc0000ac1d0 0xc0000ac1d0
}

可以看到三个函数引用的都是 i 的地址。

解决方法

1. 声明新变量：

声明新变量：j := i，且把之后对 i 的操作改为对 j 操作。
声明新同名变量：i := i。注意：这里短声明右边是外层作用域的 i，左边是新声明的作用域在这一层的 i。原理同上。

这相当于为这三个函数各声明一个变量，一共三个，这三个变量初始值分别对应循环中的 i 并且之后不会再改变。

2. 声明新匿名函数并传参：

var funcSlice []func()
for i := 0; i < 3; i++ {
	func(i int) {
		funcSlice = append(funcSlice, func() {
			println(i)
		})
	}(i)

}
for j := 0; j < 3; j++ {
	funcSlice[j]() // 0, 1, 2
}

现在 println(i) 使用的 i 是通过函数参数传递进来的，并且 Go 语言的函数参数是按值传递的。

所以相当于在这个新的匿名函数内声明了三个变量，被三个闭包函数独立引用。原理跟第一种方法是一样的。

这里的解决方法可以用在大多数跟闭包引用有关的问题上，不局限于第三个例子。

参考链接

Go 语言圣经 - 匿名函数