如何在文本文件中搜索一组单词？答案

【问题标题】：How to search for a set of words in a text file?如何在文本文件中搜索一组单词？
【发布时间】：2018-06-15 07:46:12
【问题描述】：

我正在编写一个关于从存储在文本文件中的评论中提取语义方向的项目。我有一个 400*2 数组，每行包含一个单词和它的权重。我想检查这些单词中的哪些在文本文件中，并计算整个内容的权重。

我的问题是——

最有效的方法是什么？我是否应该分别搜索每个单词，例如使用 for 循环？将文本文件的内容存储在字符串对象中是否有任何好处？

【问题讨论】：

【解决方案1】：

https://docs.python.org/3.6/library/mmap.html

这可能对你有用。您可以使用查找

【讨论】：

【解决方案2】：

这可能是开箱即用的想法，但如果您不关心单词的语义/语法连接：

通过一些修补，它可能会为您带来良好的性能提升，而不是“幼稚”的搜索。

如果您想获得额外的提升（关于查找（400 个中的）第一个单词（例如 6 个字母）），还请研究搜索算法 - 然后“向下”搜索列表，直到出现第一个包含 5 个字母的单词，然后停下来。

另外，假设您的单词没有改变，您也可以使用所有 5 字母单词的第一个和最后一个的索引构建一个索引数组（其余为类比）。

【讨论】：