【问题标题】:Are there unix shell tools to compute various word statistics on files?是否有 unix shell 工具来计算文件的各种单词统计信息?
【发布时间】:2009-10-04 07:39:24
【问题描述】:

不是基本的(比如 wc)...我需要工具来构建标签云、计算文件之间的语义距离、从文件中提取单词字典等。

【问题讨论】:

    标签: unix shell command-line


    【解决方案1】:

    这是一个广泛的问题...您是否查看过NLTK。这是一个开源库,用 Python 编写,提供了非常多的自然语言处理原语。这不会“开箱即用”(“需要一些组装;-))但允许您可能需要的任何自定义。

    【讨论】:

      猜你喜欢
      • 2023-01-12
      • 2013-07-23
      • 1970-01-01
      • 1970-01-01
      • 2013-11-13
      • 2019-08-14
      • 2019-03-22
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多