【发布时间】:2021-02-20 06:14:17
【问题描述】:
#import libraries
import pandas as pd
import numpy as np
import random as rd
import matplotlib.pyplot as plt
import seaborn as sns
data = pd.read_csv('C:/Users/yehya/Desktop/cmps276/forestfires.csv')
data = pd.get_dummies(data)
#Visualise data points
sns.pairplot(data)
sns.plt.show()
#plt.show()
我正在尝试使用 sns.pairplot 运行一个简单的散点图,我的最终目标是在我的数据上应用 Kmeans 集群。但我想可视化我的数据。在应用任何我想使用散点图的东西之前。使用上面的代码,我得到的结果是这些。数据由 13 列和大约 450 行组成。我是这些数据操作算法和可视化的新手,我不确定我是否以正确的方式处理这个问题。什么是可视化我的数据的更好方法?目标列是区域。我会留下一个数据集的链接,可以在 Kaggle https://www.kaggle.com/elikplim/forest-fires-data-set, forestfire 上找到。帮助将不胜感激,谢谢
【问题讨论】:
标签: python seaborn cluster-analysis k-means