【发布时间】:2013-01-15 01:19:30
【问题描述】:
我通过绘制它们对应的学习曲线,比较了 NLTK 和 Scikits(伯努利版本,类先验并不重要,因为我为每个类使用完全相同数量的训练示例)中朴素贝叶斯的两种实现的性能对于我的三级问题。 X 轴是训练数据集大小(忘记实际值),Y 是准确度。 Here is 我得到了什么。
造成这种性能差异的原因是什么?
【问题讨论】:
标签: machine-learning nltk scikit-learn bayesian-networks scikits