我们在学习与使用Go语言的过程中,对channel并不陌生,channel是Go语言与众不同的特性之一,也是非常重要的一环,深入理解Channel,相信能够在使用的时候更加的得心应手。
一、Channel基本用法
1、channel类别
channel在类型上,可以分为两种:
- 双向channel:既能接收又能发送的channel
- 单向channel:只能发送或只能接收的channel,即单向channel可以为分为:
只写channel
只读channel
声明并初始化如下如下:
上述定义中,<-表示单向的channel。如果箭头指向chan,就表示只写channel,可以往chan里边写入数据;如果箭头远离chan,则表示为只读channel,可以从chan读数据。
在定义channel时,可以定义任意类型的channel,因此也同样可以定义chan类型的channel。例如:
当channel未初始化时,其零值为nil。nil 是 chan 的零值,是一种特殊的 chan,对值是 nil 的 chan 的发送接收调用者总是会阻塞。
通过make我们可以初始化一个channel,并且可以设置其容量的大小,如下初始化了一个类型为string,其容量大小为512的channel:
当初始化定义了channel的容量,则这样的channel叫做buffered chan,即**有缓冲channel。如果没有设置容量,channel的容量为0,这样的channel叫做unbuffered chan,即无缓冲channel**。
有缓冲channel中,如果channel中还有数据,则从这个channel接收数据时不会被阻塞。如果channel的容量还未满,那么向这个channel发送数据也不会被阻塞,反之则会被阻塞。
无缓冲channel则只有当读写操作都准备好后,才不会阻塞,这也是unbuffered chan在使用过程中非常需要注意的一点,否则可能会出现常见的bug。
channel的常见操作:
发送数据
往channel发送一个数据使用ch <-
上述的ch可以是chan int类型,也可以是单向chan <-int。
接收数据
从channel接收一条数据可以使用<-ch
ch 类型是 chan T,也可以是单向<-chan T
在接收数据时,可以返回两个返回值。第一个返回值返回channel中的元素,第二个返回值为bool类型,表示是否成功地从channel中读取到一个值。
如果第二个参数是false,则表示channel已经被close而且channel中没有缓存的数据,这个时候第一个值返回的是零值。
所以,如果从channel读取到一个零值,可能是发送操作真正发送的零值,也可能是closed关闭channel并且channel没有缓存元素产生的零值,这是需要注意判别的一个点。
其他操作
Go内建的函数close、cap、len都可以对chan类型进行操作。
- close:关闭channel。
- cap:返回channel的容量。
- len:返回channel缓存中还未被取走的元素数量。
发送操作与接收操作可以作为select语句中的case clause,例如:
for-range语句同样可以在chan中使用,例如:
2、select介绍
在Go语言中,select语句用于监控一组case语句,根据特定的条件执行相对应的case语句或default语句,与switch类似,但不同之处在于select语句中所有case中的表达式都必须是channel的发送或接收操作。select使用示例代码如下:
上述代码中,select关键字让当前goroutine同时等待ch1 的可读和ch2的可写,在满足任意一个case分支之前,select 会一直阻塞下去,直到其中的一个 channel 转为就绪状态时执行对应case分支的代码。如果多个channel同时就绪的话则随机选择一个case执行。
当使用空select时,空的 select 语句会直接阻塞当前的goroutine,使得该goroutine进入无法被唤醒的永久休眠状态。空select,即select内不包含任何case。
另外当select语句内只有一个case分支时,如果该case分支不满足,那么当前select就变成了一个阻塞的channel读/写操作。
上述select中,当ch1可读时,会执行打印操作,反之则阻塞当前goroutine。
当select语句内包含default分支时,如果select内的所有case都不满足,则会执行default分支的逻辑,用于当其他case都不满足时执行一些默认操作。
上述代码中,当ch1可读或ch2可写时,会执行相应的打印操作,否则就执行default语句中的代码,相当于一个非阻塞的channel读取操作。
select的使用可以总结为:
- select不存在任何的case且没有default分支:永久阻塞当前 goroutine;
- select只存在一个case且没有default分支:阻塞的发送/接收;
- select存在多个case:随机选择一个满足条件的case执行;
- select存在default,其他case都不满足时:执行default语句中的代码;
二、Channel实现原理
从代码的角度剖析channel的实现,能够让我们更好的去使用channel。
我们可以从chan类型的数据结构、初始化以及三个操作发送、接收和关闭这几个方面来了解channel。
1、chan数据结构
chan类型的数据结构定义位于runtime.hchan[1],其结构体定义如下:
解释一下上述各个字段的意义:
- qcount:表示chan中已经接收到的数据且还未被取走的元素个数。内建函数len可以返回这个字段的值。
- datasiz:循环队列的大小。chan在实现上使用一个循环队列来存放元素的个数,循环队列适用于生产者-消费者的场景。
- buf:存放元素的循环队列buffer,buf 字段是一个指向队列缓冲区的指针,即指向一个dataqsiz元素的数组。buf 字段是使用 unsafe.Pointer 类型来表示队列缓冲区的起始地址。unsafe.Pointer是一种特殊的指针类型,它可以用于指向任何类型的数据。由于队列缓冲区的类型是动态分配的,所以不能直接使用某个具体类型的指针来表示。
- elemtype、elemsize:elemtype表示chan中元素的数据类型,elemsize表示其大小。当chan定义后,它的元素类型是固定的,即普通类型或者指针类型,因此元素大小也是固定的。
- sendx:处理发送数据操作的指针在buf队列中的位置。当channel接收到了新的数据时,该指针就会加上elemsize,移动到下一个位置。buf 的总大小是elemsize的整数倍且buf是一个循环列表。
- recvx:处理接收数据操作的指针在buf队列中的位置。当从buf中取出数据,此指针会移动到下一个位置。
- recvq:当接收操作发现channel中没有数据可读时,会被则色,此时会被加入到recvq队列中。
- sendq:当发送操作发现buf队列已满时,会被进行阻塞,此时会被加入到sendq队列中。
图片
2、chan初始化
channel在进行初始化时,Go编译器会根据是否传入容量的大小,来选择调用makechan64,还是makechan。makechan64在实现上底层还是调用makechan来进行初始化,makechan64只是对size做了检查。
makechan函数根据chan的容量的大小和元素的类型不同,初始化不同的存储空间。省略一些检查代码,makechan函数的主要逻辑如下:
3、send发送操作
Go在编译发送数据给channel时,会把发送操作send转换成chansend1函数,而chansend1函数会调用chansend函数。
我们可以来分段分析chansend函数的实现逻辑。
第一部分:
主要是对chan进行判断,判断chan是否为nil,若为nil,则判断是否需要将当前goroutine进行阻塞,阻塞通过gopark来对调用者goroutine park(阻塞休眠)。
第二部分
第二部分的逻辑判断是当你往一个容量已满的chan实例发送数据,且不想当前调用的goroutine被阻塞时(chan未被关闭),那么处理的逻辑是直接返回。
第三部分
第三部分的逻辑判断是首先进行互斥锁加锁,然后判断当前chan是否关闭,如果chan已经被close了,则释放互斥锁并panic,即对已关闭的chan发送数据会panic。
第四部分
第四部分的逻辑主要是判断接收队列中是否有正在等待的接收方receiver。如果存在正在等待的receiver(说明此时buf中没有缓存的数据),则将他从接收队列中弹出,直接将需要发送到channel的数据交给这个receiver,而无需放入到buf中,让发送操作速度更快一些。
第五部分
当等待队列中并没有正在等待的receiver,则说明当前buf还没有满,此时将发送的数据放入到buf中。
第六部分
当逻辑走到第六部分,说明正在处理buf已满的情况。如果buf已满,则发送操作的goroutine就会加入到发送者的等待队列,直到被唤醒。当goroutine被唤醒时,数据或者被取走了,或者chan已经被关闭了。
4、recv接收操作
从channel中接收数据时,Go会将代码转换成chanrecv1函数。如果需要返回两个返回值,则会转换成chanrecv2,chanrecv1函数和chanrecv2都会调用chanrecv函数。chanrecv1和chanrecv2传入的 block参数的值是true,两种调用都是阻塞方式,因此在分析chanrecv函数的实现时,可以不考虑 block=false的情况。
同样,省略一些检查类的代码,我们也可以分段分析chanrecv函数的逻辑。
第一部分
第一部分主要判断当前进行接收操作的chan实例是否为nil,若为nil,则从nil chan中接收数据的调用这goroutine会被阻塞。
第二部分
这一部分只要是考虑block=false且c为空的情况,block=false的情况我们可以不做考虑。
第三部分
第三部分的逻辑为判断当前chan是否被关闭,若当前chan已经被close了,并且缓存队列中没有缓冲的元素时,返回true、false。
第四部分
第四部分是处理通道未关闭且buf缓存队列已满的情况。只有当缓存队列已满时,才能够从发送等待队列获取到sender。若当前的chan为unbuffer的chan,即无缓冲区channel时,则直接将sender的发送数据传递给receiver。否则就从缓存队列的头部读取一个元素值,并将获取的sender携带的值加入到buf循环队列的尾部。
第五部分
第五部分的主要逻辑是处理发送队列中没有等待的sender且buf中有缓存的数据。该段逻辑与外出的互斥锁共用一把锁,因此不存在并发问题。当buf缓存区有缓存元素时,则取出该元素传递给receiver,同时移动接收指针。
第六部分
第六部分的逻辑主要是处理buf缓存区中没有缓存数据的情况。当buf缓存区没有缓存数据时,那么当前的receiver就会被阻塞,直到它从sender中接收了数据,或者是chan被close,才会返回。
5、close关闭
close函数主要用于channel的关闭,Go编译器会替换成closechan函数的调用。省略一些检查下的代码后,closechan函数的主要逻辑如下:
- 如果当前chan为nil,则直接panic
- 如果当前chan已关闭,再次close则直接panic
- 如果chan不为nil,chan也没有closed,就把等待队列中的 sender(writer)和 receiver(reader)从队列中全部移除并唤醒。
三、总结
通过学习channel的基本使用,了解其操作背后的实现原理,可以帮助我们更好的使用channel,避免一些操作不当而导致的panic或者说是bug,让我们在使用channel时能够更加的得心应手。
channel的值和状态有多种情况,而不同的操作(send、recv、close)又可能得到不同的结果,这是使用 channel 类型时需要经常注意的点,我们可以将不同channel值下的不同操作进行一个总结,特别注意操作channel时会产生panic的情况,已经可能会导致线程阻塞的情况,都是有可能导致死锁与goroutine泄漏的罪魁祸首。
channel执行操作\channel状态 | channel为nil | channel buf为空 | channel buf已满 | channel buf未满且不为空 | channel已关闭 |
| 阻塞 | 阻塞 | 读取数据 | 读取数据 | 返回buf中缓存的数据 |
| 阻塞 | 写入数据 | 阻塞 | 写入数据 | panic |
| panic | 关闭channel,buf中没有缓存数据 | 关闭channel,保留已缓存的数据 | 关闭channel,保留已缓存的数据 | panic |
原文链接
小韬同学 的掘金账号:Serena[2]
深入解析Go Channel的神秘原理[3]
本文转载自微信公众号「 程序员升级打怪之旅」,作者「小韬&王中阳」,可以通过以下二维码关注。
转载本文请联系「 程序员升级打怪之旅」公众号。