【发布时间】:2014-04-21 21:17:03
【问题描述】:
我在这里需要集群方面的帮助。我需要了解集合中的变量分组,所以我做了以下事情:
- 我得到了数据并确定它是浮点类型的
- 我使用 x = (x - min)/(max - min) 对这些值进行了标准化,其中 min 和 max 是表示数据中最小值和最大值的变量 范围
- 我使用 np.array 函数将其转换为 numpy 数组
- 然后我尝试使用带宽(使用 ManShift)或 DBSCAN 函数来执行处理,但它会陷入
"ValueError: data type not understood"错误。我做错了什么?
这里是代码-
print ('Minimum value is {0}, maximum is {1}'.format(min_value, max_value))
for position in range(0, len(sub_set)):
sub_set[position] = (sub_set[position] - min_value)/(max_value - min_value)
data = np.array(sub_set)
print (type(data))
print len(data)
bandwidth = estimate_bandwidth(data, quantile=0.2, n_samples=len(data))
问候马特维
【问题讨论】:
-
@bibhas 我删除了与here 和至少
np.array相对应的问候是 代码