【发布时间】:2017-10-05 02:23:19
【问题描述】:
如何计算张量流中列表的中值? 喜欢
node = tf.median(X)
X 是占位符
在 numpy 中,我可以直接使用 np.median 来获取中值。如何在tensorflow中使用numpy操作?
【问题讨论】:
标签: python numpy tensorflow median
如何计算张量流中列表的中值? 喜欢
node = tf.median(X)
X 是占位符
在 numpy 中,我可以直接使用 np.median 来获取中值。如何在tensorflow中使用numpy操作?
【问题讨论】:
标签: python numpy tensorflow median
要使用tensorflow 计算数组的中位数,您可以使用percentile 函数,因为第 50 个百分位数是中位数。
import tensorflow as tf
import tensorflow_probability as tfp
import numpy as np
np.random.seed(0)
x = np.random.normal(3.0, .1, 100)
median = tfp.stats.percentile(x, 50.0, interpolation='midpoint')
tf.Session().run(median)
上面的代码等价于np.percentile(x, 50, interpolation='midpoint')。
【讨论】:
编辑:此答案已过时,请改用 Lucas Venezian Povoa 的解决方案。它更简单、更快捷。
您可以使用以下方法计算 tensorflow 中的中位数:
def get_median(v):
v = tf.reshape(v, [-1])
mid = v.get_shape()[0]//2 + 1
return tf.nn.top_k(v, mid).values[-1]
如果 X 已经是向量,则可以跳过整形。
如果您关心中值是偶数大小向量的两个中间元素的平均值,您应该改用它:
def get_real_median(v):
v = tf.reshape(v, [-1])
l = v.get_shape()[0]
mid = l//2 + 1
val = tf.nn.top_k(v, mid).values
if l % 2 == 1:
return val[-1]
else:
return 0.5 * (val[-1] + val[-2])
【讨论】:
tf.shape(v) 我不确定这是否可以与 top_k 结合使用。另一种方法是让两个网络使用相同的权重(使用变量范围并为第二个网络设置重用=True)。使用 [10, 5] 占位符创建第一个网络,使用 [1, 5] 占位符创建第二个网络。
v = [1, 2, 3],这给出了3。因此你应该给m加1:m = v.get_shape()[0]//2 + 1。但是对于具有偶数个值的集合,它仍然是错误的。对于v = [1, 2, 3, 4],中位数通常应该是两个中间元素的平均值:2.5。这在 Lucas answer 的第二部分是正确的。
我们可以修改 BlueSun 的解决方案,使其在 GPU 上更快:
def get_median(v):
v = tf.reshape(v, [-1])
m = v.get_shape()[0]//2
return tf.reduce_min(tf.nn.top_k(v, m, sorted=False).values)
这与使用 tf.contrib.distributions.percentile(v, 50.0) 一样快(根据我的经验),并返回实际元素之一。
【讨论】: