目前参与到了实验室的某一个项目中的子需求中。这个子需求可以归结为一个文本分类问题,但是对文本分类精度的要求非常高。所有考虑做如下工作:

1。 程序中实现KNN分类器或者多项式朴素贝叶斯分类器。(调用weka的分类器不太方便,还是自己直接写。毕竟这是做工程,而不是做“实验”)

目前已经完成了KNN分类器

2。考虑用bagging或者boosting的方法加强基本分类器的性能。或者通俗点说是用“串联”或者“并联”分类器的方法,提供分类性能。

3。考虑用半监督学习方法中的“使用朴素贝叶斯分类器的EM算法”来提供分类性能。

真想做个实验,看看1,2,3那种方法更好,就是不知道boss是不是会不给我时间,只是草草地完成工程就OK了。

相关文章:

  • 2022-12-23
  • 2022-03-01
  • 2022-01-02
  • 2021-05-22
  • 2022-02-16
  • 2021-09-01
  • 2021-06-29
猜你喜欢
  • 2021-11-25
  • 2021-11-24
  • 2021-07-28
  • 2021-06-03
  • 2022-02-26
相关资源
相似解决方案