【发布时间】:2016-05-30 00:33:20
【问题描述】:
我正在进行文本分析(主题建模),当我通过CountVectorizer 运行它时,我得到一堆与我的需求完全无关的数字、日期和位置。我以为我会输入preprocessing function,但scikit-learn page for preprocessing 似乎没有我在构建预处理器时需要的任何信息。
【问题讨论】:
标签: machine-learning scikit-learn topic-modeling data-cleaning data-science