【发布时间】:2017-06-01 03:33:43
【问题描述】:
我正在尝试构建一种算法来查找集群数量。我需要从数据集中分配随机点作为初始均值。
我首先尝试了以下代码:
mu=random.sample(df,10)
它给出的索引超出范围错误。
我把它转换成一个 numpy 数组然后做了
mu=random.sample(np.array(df).tolist(),10)
不是给出 10 个值作为平均值,而是给了我 10 个值数组。
如何从数据框中获取 10 个值来初始化为 10 个集群的平均值?
【问题讨论】:
标签: python pandas numpy random