【发布时间】:2021-04-30 18:09:58
【问题描述】:
我已经使用 pyspark 开发了一个聚类模型,我只想预测一个向量的类别,这里是代码
spark = SparkSession.builder.config("spark.sql.warehouse.dir",
"file:///C:/temp").appName("Kmeans").getOrCreate()
vecAssembler = VectorAssembler(inputCols=FEATURES_COL, outputCol="features")
df_kmeans = vecAssembler.transform(df).select('LCLid', 'features')
k = 6
kmeans = KMeans().setK(k).setSeed(1).setFeaturesCol("features")
model = kmeans.fit(df_kmeans)
centers = model.clusterCenters()
predictions = model.transform(df_kmeans)
transformed = model.transform(df_kmeans).select('LCLid', 'prediction')
rows = transformed.collect()
假设我有一个特征向量 V,我想预测它属于哪个类 我尝试了一种在此链接中找到的方法http://web.cs.ucla.edu/~zhoudiyu/tutorial/ 但它不起作用,因为我正在使用 SparkSession 而不是在 sparkContext 中
【问题讨论】:
标签: pyspark k-means prediction