【发布时间】:2020-03-24 17:20:50
【问题描述】:
计算与文本语料库 Gutenberg 关联的所有文件 ID 的单词覆盖率。 这个的写代码是什么,
import nltk
from nltk.corpus import gutenburg
from decimal import Decimal
for fileid in gutenburg.fileids():
n_chars = len(gutenburg.raw(fileid))
n_words = len(gutenburg.words(fileids))
print(round(Decimal(n_chars/n_words), 7), fileids)
【问题讨论】:
标签: python-3.x nltk nltk-book