【发布时间】:2020-01-02 01:19:42
【问题描述】:
我想使用 DBSCAN 根据给定位置 (X,Y,Z) 对一些恒星进行聚类,我不知道如何调整数据以获得正确数量的聚类以在之后绘制它?
这就是数据的样子 这些数据的正确参数是什么?
行数为1.202672e+06
import pandas as pd
data = pd.read_csv('datasets/full_dataset.csv')
from sklearn.cluster import DBSCAN
clusters=DBSCAN(eps=0.5,min_samples=40,metric="euclidean",algorithm="auto")
【问题讨论】:
-
大声笑,为什么你的行数是两倍?什么是“正确”的集群数量?聚类没有对错。
标签: python cluster-analysis data-science dbscan