【发布时间】:2021-03-05 03:10:17
【问题描述】:
我有一个包含多个单词的单列的 excel 文件。我正在尝试计算每个单词的出现频率。 所以如果我有一个清单
Labels
a
a
b
b
c
c
c
输出应该是
c : 3
b : 2
a : 2
我使用下面的代码sn-p
import pandas as pd
train = pd.read_csv("ani2.csv")
A = train['Labels'].value_counts()
f = open("ani3.csv",'a')
f.write(str(A))
f.close()
数据集有大约 53000 个值,我得到的输出被截断了。我得到的输出就是这种格式。
z : 1700
y : 1500
x : 1000
...
c : 3
b : 2
a : 2
由于某种原因,中间的值丢失了,我得到的只是三个点。
【问题讨论】: