【问题标题】:Java Text ReaderJava 文本阅读器
【发布时间】:2025-12-22 09:30:11
【问题描述】:

我想制作一个程序来读取输入的文本并解析每个单词并将其存储在数据结构中,以便稍后我可以对此进行一些统计(单词的频率、最常见的单词等)。

我需要关于两件事的指导:

a.我的“解析函数”的最佳方法,它将按术语划分文本

b. 数据结构选择的最佳方法,涉及复杂性、访问时间和最适合的情况。

【问题讨论】:

    标签: java parsing data-structures text


    【解决方案1】:

    a) 我的“解析函数”的最佳方法

    使用Scanner 它对next(单词)等有很好的功能。

    b) 数据结构选择的最佳方法

    从单词到统计对象的映射:Map<String, WordStatistics>

    【讨论】:

    • 字符串标记器也工作得很好。很确定你可以只说明你想要标记的内容,这可能会让事情变得更容易。
    • @csaunders 我觉得 Scanner 更简单,而且它还有一个next(Pattern pattern) 方法。
    【解决方案2】:

    根据您需要的其他统计信息,听起来您想使用Map<String, Integer>。然后对于每个键(您读入的单词),您可以存储您读入的次数。其余的听起来像家庭作业......

    【讨论】: