【发布时间】:2015-06-15 10:55:21
【问题描述】:
我已经四处寻找解决此问题的方法,但还没有找到。我有一个大文本文件,它被分成几个句子,只用“。”分隔。我需要计算每个句子有多少个单词并将其写入文件。我为这部分代码使用了一个单独的文件,到目前为止我有这个
tekst = open('father_goriot.txt','r').read()
tekst = tekst.split('.')
有了这个,我得到一个“列表”类型变量,每个句子都在它自己的索引中。我知道如果我写了
print len(tekst[0].split())
我得到了第一句话中的单词数。我需要的是某种循环来获取每个句子中的单词数。之后,我需要将这些数据以以下形式写入文件: 1. 文本中句子的索引号, 2. 该特定句子中的单词数, 3. 不同文本中同一句子中的单词数(这是使用单独文件中的代码对第一个文本的翻译), 4. 两个句子共有的词数。 有什么想法吗?
【问题讨论】:
标签: python string text words sentence