【发布时间】:2020-03-08 09:47:31
【问题描述】:
我有一个不平衡的推文数据集,标记为 -1、0、+1。 我想通过上采样来平衡数字。我收到以下错误:
tweet_train=tweet_train.reshape(-1, 1)
X_train_upsample, y_train_upsample = SMOTE(random_state=42).fit_sample(tweet_train, y_train)
不能将字符串转换为浮动:“ازاینبهبعدهمینهسلبریتیهاییکهایدیولوژیهای#جمهوری_اسلامیروتبلیغمیکننخارجازمرزایرانهمحقندارنآسایشداشتهباشنومجبوربود#باشهمچناناداوفاداریبهاونایدیولوژیرودربیارن هر جا یه دوربین منتظره که #ریاکاری شون رو ثبت کنه '
为什么它应该尝试将字符串变成浮点数?
附言。在重塑之前,tweet_train 和 y_train 是 shape=(n,)
的 numpy 数组【问题讨论】:
标签: scikit-learn oversampling smote