【发布时间】:2011-01-05 04:05:04
【问题描述】:
是否有我可以阅读的研究论文/书籍可以告诉我手头的问题哪种特征选择算法最有效。
我试图简单地将 twitter 消息识别为 pos/neg(开始)。我从基于频率的特征选择开始(从 NLTK 书开始),但很快意识到对于类似的问题,不同的人选择了不同的算法
虽然我可以尝试基于频率、互信息、信息增益和各种其他算法,但列表似乎无穷无尽。我想知道是否有一种有效的方法,然后试错。
任何建议
【问题讨论】:
标签: nlp nltk semantic-analysis