【发布时间】:2017-01-16 00:31:34
【问题描述】:
我有一个csv,如下所示:
Description
0 ['boy']
1 ['boy', 'jumped', 'roof']
2 ['paris']
3 ['paris', 'beautiful', 'new', 'york']
4 ['lets', 'go', 'party']
5 ['refused', 'come', 'party']
我需要从这些数据中找出唯一的词。所以输出将是:
Unique Words
0 boy
1 jumped
2 roof
3 paris
4 beautiful
5 new
6 york
以此类推。我正在尝试使用 Pandas 和 Python 来做到这一点,但无法实现。我的代码是:
df = pd.read_csv('output.csv')
list(set(df.Description))
g = list(df['Description'].unique())
print(g)
这会抛出错误的输出,它只会抛出原始的 csv 数据帧。
【问题讨论】:
-
我怀疑您的数据框的列包含其元素是这些单词的列表,或者它包含字符串格式的列表,即每行包含所有单词的长字符串。无论哪种方式,它都会对这些列表/完整字符串而不是单个字符串执行
unique操作。
标签: python list csv pandas unique