【问题标题】:Visualize text classes in a scatter-plot在散点图中可视化文本类
【发布时间】:2020-06-24 09:22:26
【问题描述】:

我正在寻找方法来调查我的训练数据“可建模性”,并检查这些类在词汇方面是否得到很好的区分......等等。

我有点尴尬,但我想知道是否可以在 Torch 中为文本分类模型做散点图?或任何其他调查数据质量的方法。

【问题讨论】:

    标签: python nlp text-classification torch


    【解决方案1】:

    您可以使用降维(PCA、t-SNE 或 UMAP)+ 色调来检查您的数据。我建议使用散景以交互方式查看您的数据,即使在这里我将向您展示 seaborn。

    import numpy as np
    import seaborn as sns
    import umap
    from sklearn.datasets import load_digits
    
    digits = load_digits()
    
    embedding = umap.UMAP().fit_transform(digits.data)  # 2D embedding
    
    sns.scatterplot(x=embedding[:,0], y=embedding[:,1], hue=digits.target)
    

    【讨论】:

      猜你喜欢
      • 2013-11-01
      • 2019-11-30
      • 2012-03-14
      • 1970-01-01
      • 1970-01-01
      • 2013-10-04
      • 2019-03-18
      • 2014-07-10
      • 1970-01-01
      相关资源
      最近更新 更多