【问题标题】:I want to implement a machine learning or deep learning model for text classification (100 classes)我想为文本分类实现机器学习或深度学习模型(100 类)
【发布时间】:2020-03-18 07:42:45
【问题描述】:

我有一个数据集,类似于我们拥有电影情节及其类型的数据集。类的数量在 100 个左右。对于这 100 个类的分类,我应该选择什么算法?分类是多标签的,因为一部电影可以有多种类型 请从以下推荐任何人。如果您愿意,您可以随意推荐任何其他型号。

1.Naive Bayesian
2.Neural networks
3.SVM
4.Random forest
5.k nearest neighbours

如果你在python中也提供必要的库会很有用

【问题讨论】:

    标签: python machine-learning text-classification multilabel-classification


    【解决方案1】:

    机器学习工程的一个重要步骤是正确检查数据。 Herby 你会得到一些洞察力来决定选择什么算法。有时,您可能会尝试不止一种算法并比较模型,以确保您在数据上尽了最大努力。

    由于您没有透露您的数据,我只能给您以下建议:如果您的数据“简单”,即您只需要很少的特征和它们的轻微组合即可解决任务,请使用朴素贝叶斯或k-最近邻。如果您的数据“中等”难度,则使用随机森林或 SVM。如果解决任务需要一个非常复杂的决策边界,以非线性方式组合特征的许多维度,请选择神经网络架构。

    我建议您将 python 和 scikit-learn 包用于 SVM 或随机森林或 k-NN。 对于神经网络,请使用 keras。

    很抱歉,我无法为您提供解决问题的方法。您提出的问题非常广泛。

    【讨论】:

    • 其实我的数据集和CAIL数据集差不多
    猜你喜欢
    • 2021-06-17
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2019-09-23
    • 1970-01-01
    • 2017-12-25
    • 2020-10-14
    • 1970-01-01
    相关资源
    最近更新 更多