【发布时间】:2022-01-21 03:33:17
【问题描述】:
我正在编写一个 pytorch 情感分析模型。 我想将我自己的数据集与 torchtext 一起使用。 https://github.com/bentrevett/pytorch-sentiment-analysis 我尝试使用 torchtext 修改上述存储库。
tokenize = lambda x: x.split()
comment= Field(sequential=True , use_vocab=True, tokenize=tokenize, lower=True)
Label= Field(sequential=False, use_vocab=False)
fields={'comment':('c', comment), 'Label':('L', Label)}
mydata = '/content/'
train_data, valid_data, test_data = TabularDataset.splits(
path=mydata,
train_data='train.csv',
valid_data='valid.csv',
test_data='test.csv',
format='csv',
fields = fields)
上面的代码在拆分数据集的最后部分给出了错误。 错误是
ValueError Traceback (most recent call last)
<ipython-input-113-cb08939d17bf> in <module>()
5 test_data='test.csv',
6 format='csv',
----> 7 fields = fields)
ValueError: not enough values to unpack (expected 3, got 0)
你能帮我理解和解决这个问题吗?
【问题讨论】:
-
您的代码期望
TabularDataset.splits()返回三个值的序列。但相反,它返回了一个空序列。
标签: python nlp pytorch sentiment-analysis