【问题标题】:Prepare dataframe for Flair model training为 Flair 模型训练准备数据框
【发布时间】:2020-04-29 03:17:52
【问题描述】:

我正在尝试将以下格式的数据框转换为 txt 文件,如屏幕截图所示。

我比较接近显示的代码,但是当我尝试将 txt 读入我的 ML 算法时出现以下错误:“labels = set([label.value for sent in self.train for label in sent.labels] ) AttributeError: 'NoneType' 对象没有属性 'labels'"

谁能帮忙?

output['label']=['__label__'+ s for s in output['label'].astype(str)]
output['text']= output['text'].replace('\n',' ', regex=True).replace('\t',' ', regex=True)
output.to_csv(r'sst_train.csv', index=False, sep=' ', header=False)

【问题讨论】:

    标签: python-3.x pandas machine-learning nlp flair


    【解决方案1】:

    以下似乎有效:

    lab = data['label'].tolist()
    text = data['text'].tolist()
    with open('test.txt', 'w') as outfile:
        for x in range(len(lab)):
            l1 = str(lab[x])
            print(type(l1))
            t1 = str(text[x])
            print(t1)
            d = 'ewdwed'
            message = "__label__{}\t{}\n".format(l1,t1)
            outfile.write(message)
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2018-03-29
      • 2019-09-30
      • 2011-01-05
      • 2017-10-26
      • 2020-04-05
      • 2016-08-26
      • 2020-03-16
      • 2019-01-12
      相关资源
      最近更新 更多