【问题标题】:N gram NLP to Excel fileN gram NLP 到 Excel 文件
【发布时间】:2018-12-08 15:40:45
【问题描述】:

我正在为这段代码苦苦挣扎。我需要创建一个 1 克和 2 克模型,并根据它们的频率映射克数;在我需要将 2 个模型写入两个不同工作表中的一个 EXCEL 文件之后.. 我来到这里显示 2 模型克和频率,但在如何附加结果和创建 excel 文件方面苦苦挣扎。

import nltk
nltk.download('punkt')
f = open('data.json','r')
raw = f.read()

tokens = nltk.word_tokenize(raw)

#Create your bigrams
bgs = nltk.bigrams(tokens)

#compute frequency distribution for all the bigrams in the text
fdist = nltk.FreqDist(bgs)
for k,v in fdist.items():
print (k,v)

谢谢

【问题讨论】:

  • 澄清一下,您的问题是关于如何将输出导出到 Excel 文件,对吗?
  • 是的,它是将两个模型(一克和二元)的输出导出到 2 个不同的 excel 文件中

标签: python excel python-3.x nlp export-to-csv


【解决方案1】:

此代码将在 csv 文件中导出频率分布。 :

import csv
import nltk
nltk.download('punkt')
f = open('data.json','r')
raw = f.read()
tokens = nltk.word_tokenize(raw)

#Create your bigrams
bgs = nltk.bigrams(tokens)

#compute frequency distribution for all the bigrams in the text
fdist = nltk.FreqDist(bgs)
with open("fdist.csv", "w") as fp:
    writer = csv.writer(fp, quoting=csv.QUOTE_ALL)
    writer.writerows(fdist.items())

【讨论】:

  • 我有这个回溯 writer.writerows(fdist.items()) TypeError: a bytes-like object is required, not 'str'
  • 把“wb”改成“w”然后告诉我
猜你喜欢
  • 2023-03-22
  • 1970-01-01
  • 1970-01-01
  • 2013-08-14
  • 2018-08-12
  • 1970-01-01
  • 2013-10-06
  • 2012-04-11
  • 2018-08-24
相关资源
最近更新 更多