通俗理解tf.name_scope()、tf.variable_scope()
发布网友
发布时间:2024-10-08 03:16
我来回答
共1个回答
热心网友
时间:2024-10-08 03:20
2022-04-30更新:这篇内容分享还是很多年前,当时接触tf,所以随手记录了一下,后来收到很多读者的反馈,表示其中有很多错误,估计是我当时使用的tf版本太老的缘故,对此最近专门去看了官方api并重新梳理。 大家也可以去参考权威的说明文件: tf.name_scope()
tf.variable_scope()
通过在tf1.15版本上运行,发现第一个代码样例无法运行,具体原因在于tf.variable_scope()会判断是否要共享变量名,而在样例中,因为首先创建了"V1/a1",而在"V2"中设置"reuse=True"去共享变量名,如果继续创建"a1"则会报错,这就是代码无法运行的原因。修改代码如下:
输出:
此时,可以发现"V1"和"V2"没有共享参数,分别各自创建了属于自己的"a1","a2",而且分别具备不同的size。
然后,我们修改"V2"为"tf.variable_scope('V2',reuse=True)",具体如下:
输出:
下面讨论一个评论区的分享(@weiwei ):将"tf.variable_scope('V2',reuse=True)"修改为"tf.variable_scope('V1',reuse=True)"
之后,我进一步将代码修改为:
上述两个样例清楚说明了tf.get_variable()和tf.Variable()的区别:在一个命名空间"V1"内,tf.get_variable()会执行检测机制,并且,节点信息相同,会直接运行,否则会报错,而 tf.Variable() 会自动创建新的命名空间。
前言:最近做一个实验,遇到TensorFlow变量作用域问题,对tf.name_scope()、tf.variable_scope()等进行了较为深刻的比较,记录相关笔记:
tf.name_scope()、tf.variable_scope()是两个作用域函数,一般与两个创建/调用变量的函数tf.variable() 和tf.get_variable()搭配使用。常用于:
1)变量共享;2)tensorboard画流程图进行可视化封装变量。
通俗理解就是:tf.name_scope()、tf.variable_scope()会在模型中开辟各自的空间,而其中的变量均在这个空间内进行管理,但是之所以有两个,主要还是有着各自的区别。
1.name_scope() 和 variable_scope():
name_scope 和 variable_scope主要用于变量共享。其中,变量共享主要涉及两个函数:tf.variable() 和tf.get_variable();即就是必须要在tf.variable_scope()的作用域下使用tf.get_variable()函数。这里用tf.get_variable( ) 而不用tf.Variable( ),是因为前者拥有一个变量检查机制,会检测已经存在的变量是否设置为共享变量,如果已经存在的变量没有设置为共享变量,TensorFlow 运行到第二个拥有相同名字的变量的时候,就会报错。
注意,tf.variable() 和tf.get_variable()有不同的创建变量的方式:tf.Variable() 每次都会新建变量。如果希望重用(共享)一些变量,就需要用到了get_variable(),它会去搜索变量名,有就直接用,没有再新建。此外,为了对不同位置或者范围的共享进行区分,就引入名字域。既然用到变量名了,就涉及到了名字域的概念。这就是为什么会有scope 的概念。name_scope 作用域操作,variable_scope 可以通过设置reuse 标志以及初始化方式来影响域下的变量,因为想要达到变量共享的效果, 就要在 tf.variable_scope()的作用域下使用 tf.get_variable() 这种方式产生和提取变量. 不像 tf.Variable() 每次都会产生新的变量, tf.get_variable() 如果遇到了已经存在名字的变量时, 它会单纯的提取这个同样名字的变量,如果不存在名字的变量再创建.
例如:
输出:
2.name_scope()和variable_scope()区别
TF中有两种作用域类型: 命名域 (name scope),通过tf.name_scope() 或 tf.op_scope()创建; 变量域 (variable scope),通过tf.variable_scope() 或 tf.variable_op_scope()创建; 这两种作用域,对于使用tf.Variable()方式创建的变量,具有相同的效果,都会在变量名称前面,加上域名称。对于通过tf.get_variable()方式创建的变量,只有variable scope名称会加到变量名称前面,而name_scope()不会作为前缀。
举例1:
输出:
举例2:
输出:
总结:
1、name_scope()不会作为tf.get_variable()变量的前缀,但是会作为tf.Variable()的前缀。(举例1)
2、在variable_scope()的作用域下,tf.get_variable()和tf.Variable()都加了scope_name()前缀。因此,在tf.variable_scope()的作用域下,通过get_variable()可以使用已经创建的变量,实现了变量的共享,即可以通过get_variable()在tf.variable_scope()设定的作用域范围内进行变量共享。(举例2)
3、在重复使用的时候, 一定要在代码中强调 scope.reuse_variables()
参考链接:
[1] scope 命名方法 - Tensorflow | 莫烦Python
[2] tf.name_scope()和tf.variable_scope() - AI-FUTURE - CSDN博客