【发布时间】:2013-06-07 12:12:44
【问题描述】:
我正在寻找一个 python 程序来计算文本中每个单词的频率,并输出每个单词及其出现的计数和行号。
我们将单词定义为连续的非空白字符序列。 (提示:split())
注意:同一个字符序列的不同大小写应该被认为是同一个单词,例如Python和python,我和我。
输入将是几行,空行终止文本。输入中只会出现字母字符和空格。
输出格式如下:
每行以一个表示单词出现频率的数字、一个空格、然后是单词本身以及包含该单词的行号列表开头。
示例输入
Python is a cool language but OCaml
is even cooler since it is purely functional
样本输出
3 is 1 2
1 a 1
1 but 1
1 cool 1
1 cooler 2
1 even 2
1 functional 2
1 it 2
1 language 1
1 ocaml 1
1 purely 2
1 python 1
1 since 2
附言。 我不是学生,我正在自学 Python..
【问题讨论】:
-
你的问题是什么?
-
一个程序,它计算文本中每个单词的频率,并输出每个单词及其出现的计数和行号。
-
您自己尝试过吗?如果是这样,请发布您的代码并解释您遇到的问题。如果您证明自己付出了努力,人们往往会变得更好,并提供回答。提示:检查
with-statement 和collections-module。 -
我们应该用 hint: `split() 做什么?您是如何遇到这个问题的?
-
我对此投了反对票,因为这不是一个真正的问题——你只是要求整个代码,准备好运行。你还没有尝试过自己做。这是一个“帮助”论坛,而不是代码工厂。