您的位置:首页 >聚焦 >

热消息:码住!Golang并发安全与引用传递总结

2022-06-12 06:21:47    来源:程序员客栈

导语|因为现在服务上云的趋势,业务代码都纷纷转向golang的技术栈。在迁移或使用的过程中,由于对golang特性的生疏经常会遇到一些问题,本文总结了golang并发安全和参数引用传值时的一些知识。

一、Map类型并发读写引发FatalError

先看一个在Go中关于Map类型并发读写的经典例子:

var testMap  = map[string]string{}func main() {go func() {for{_ = testMap["bar"]}}()go func() {for  {testMap["bar"] = "foo"}}()select{}}

以上例子会引发一个Fatal error:

fatal error: concurrent map read and map write

产生这个错误的原因就是在Go中Map类型并不是并发安全的,出于安全的考虑,此时会引发一个致命错误以保证程序不出现数据的混乱。

二、Go如何检测Map并发异常

在Go源码map.go中,可以看到以下flags:

// flagsiterator     = 1 // there may be an iterator using bucketsoldIterator  = 2 // there may be an iterator using oldbucketshashWriting  = 4 // a goroutine is writing to the mapsameSizeGrow = 8 // the current map growth is to a new map of the same size

在源码中mapaccess1、mapaccess2都用于查询mapassign和mapdelete用于修改。

对于查询操作,大致检查并发错误的流程如下:在查询前检查并发flag是否存在,如果存在就抛出异常。

if h.flags&hashWriting != 0 {throw("concurrent map read and map write")}

对于修改操作则如下:

写入前检查一次标记位,通过后打上标记。

写入完成再次检查标记位,通过后还原标记。

//各类前置操作....if h.flags&hashWriting != 0 {//检查是否存在并发throw("concurrent map writes")}//赋值标记位h.flags ^= hashWriting....//后续操作done://完成修改后,再次检查标记位if h.flags&hashWriting == 0 {throw("concurrent map writes")}//还原标记位取消hashWriting标记h.flags &^= hashWriting

三、如何避免Map的并发问题

go官方认为因为Map并发的问题在实际开发中并不常见,如果把Map原生设计成并发安全的会带来巨大的性能开销。因此需要使用额外方式来实现。

(一)自行使用锁和map来解决并发问题

参考如下:

type cocurrentMap = struct {sync.RWMutexm map[string]string}func main() {var testMap = &cocurrentMap{m:make(map[string]string)}//写testMap.Lock()testMap.m["a"] = "foo"testMap.Unlock()//读testMap.RLock()fmt.Println(testMap.m["a"])testMap.RUnlock()}

这个方法存在问题就是并发量巨大的时候,锁的竞争也会带来巨量消耗,性能一般。

(二)使用sync.Map

sync.Map通过巧妙的设计来提高并发安全下Map的性能,其设计思路是通过空间换时间来实现的,同时维护2份数据,read&dirty。read主要用来避免读写冲突。

其数据结构如下:

type Map struct {mu Mutex //锁read atomic.Value //readOnlydirty map[interface{}]*entry //*entrymisses int}type readOnly struct {m       map[interface{}]*entryamended bool // true if the dirty map contains some key not in m.}type entry struct {p unsafe.Pointer // *interface{}}

使用示例如下:

var m sync.Map// 写m.Store("test", 1)m.Store(1, true)// 读val1, _ := m.Load("test")val2, _ := m.Load(1)fmt.Println(val1.(int))fmt.Println(val2.(bool))//遍历m.Range(func(key, value interface{}) bool {//....return true})//删除m.Delete("test")//读取或写入m.LoadOrStore("test", 1)

这里对sync.Map的原理不做深入展开,只提几点特性:

read和dirty是共享内存的,尽量减少冗余内存的开销。

read是原子性的,可以并发读,写需要加锁。

读的时候先read中取,如果没有则会尝试去dirty中读取(需要有标记位readOnly.amended配合)

dirty就是原生Map类型,需要配合各类锁读写。

当read中miss次数等于dirty长度时,dirty会提升为read,并且清理已经删除的k-v(延迟更新,具体如何清理需要enrty中的p标记位配合)

双检查(在加锁后会再次对值检查一遍是否依然符合条件)

sync.Map适用于读多写少的场景。

sync.Map没有提供获取长度size的方法,需要通过遍历来计算。

四、切片类型Slice是并发安全的吗

与Map一样,Slice也不是并发安全的:

var testSlice []intfunc main() {for i:=0; i<1000; i++ {go func() {testSlice = append(testSlice, i)}()}for idx, val := range testSlice {fmt.Printf("idx:%d val:%d\n", idx, val)}}

可以看到输出如下:

........

idx:901 val:999

idx:902 val:999

.........

但是在切片中并不会引发panic,如果程序无意中对切片使用了并发读写,严重的话会导致获取的数据和之后存储的数据错乱,所以这里要格外小心,可以通过加锁来避免。

五、Map、Slice作为参数传递的问题

切片除了并发有问题外,当他作为参数传递的时候,也会导致意料之外的问题,Go官方说明在Go中所有的传递都是值传递,没有引用传递的问题,但是在实际使用时,切片偶尔会引起一些疑惑,例如以下情况:

func changeVal(testSlice []string, idx int, val string){testSlice[idx] = val}func main() {var testSlice []stringtestSlice = make([]string, 5)testSlice[0] = "foo"changeVal(testSlice, 0, "bar")fmt.Println(testSlice[0])}

以上代码执行后可以看到打印出的值为:

bar

这里就奇怪了,如果按照Go官方说明在该语言中传递都是值传递的话,为什么函数内修改切片会导致原切片也一起修改呢?这里要分2个问题来看:

Go只会对基础值类型在传参中使用深拷贝,实际上对于Slice和Map类型,使用的是浅拷贝,Slice作为传参,其指向的内存地址依然是原数据。

Slice扩容机制的影响:向Slice中添加元素超出容量的时候,我们知道会触发扩容机制,而扩容机制会创建一份新的【原数据】此时,它与浅拷贝获取到的变量是没有任何关联的。

可以通过以下代码验证,我们故意构造触发扩容的场景:

(资料图)

func appendVal(testSlice []string, val string){fmt.Printf("testSlice:%p\n", testSlice)testSlice = append(testSlice, "addCap") //触发了扩容机制fmt.Printf("after append testSlice:%p\n", testSlice)testSlice[0] = val}func main() {var testSlice []stringtestSlice = make([]string, 5)testSlice[0] = "foo"appendVal(testSlice,"bar")fmt.Println(testSlice[0]) //此时打印出的值为foo}

可以看到控制台打印如下:

testSlice:0xc00005a050

after append testSlice:0xc0000700a0

foo

此时因为扩容的影响导致原切片和传递后的切片不再有关联,因此打印值回到了最初的原数据foo

除了扩容机制外,我们也可以利用go中的copy函数来强制深拷贝:

var newTestSlice []stringnewTestSlice = make([]string, len(testSlice))copy(newTestSlice, testSlice)fmt.Printf("testSlice:%p\n", testSlice)fmt.Printf("newTestSlice:%p\n", newTestSlice)

testSlice:0xc0000d6000

newTestSlice:0xc0000d6050

另外对于数组类型,如果无意中转换为切片时,也极容易导致这种不确定性发生。切片作为参数传递时,在函数内对切片进行修改,需要时刻注意。

回过头再来看Map就一目了然了,因为Map的操作对象一直是引用,其即使扩容后,引用的地址不会改变,所以不会出现时而可以修改,时而不能修改的情况:

func changeMap(testMap map[string]string, k string, v string){testMap[k] = v}func main() {var testMap map[string]stringtestMap = make(map[string]string)testMap["foo"] = "bar"changeMap(testMap, "foo", "rab")fmt.Println(testMap)}

输出:map[foo:rab]

可以看到函数内修改了原参数的值。

六、总结

Go因为其简洁的语法和高效的性能在当今微服务领域笑傲江湖,但是其本身语言特性在使用时,也会带来不少坑,本文总结了并发场景和参数传递时容易引发的问题,从而注意避免这些情况的发生。

作者简介

徐世佳

腾讯IEG运营开发工程师

腾讯IEG运营开发工程师,负责腾讯游戏营销活动开发,有丰富的大流量高并发活动开发经验。

关键词: 参数传递 再次检查 开发工程师

相关阅读