【发布时间】:2018-10-16 08:49:39
【问题描述】:
我的数据集如下:
症状 (X) :: 条件 (Y)
发烧、头痛、失明 :: 瓦格纳综合症
牙痛、发烧、尿甜 :: buri buri 疾病
失明,流鼻血,发烧 :: Taylor 综合征
其中 X 是特征,Y 是我的标签。我想将 X 编码为 one-hot-encoding 矩阵。 panda 的 get_dummies 无法在一列中处理多个值,但如果我将 X 拆分为多列,我将失去将症状编码为同一个单热矩阵的能力
有什么想法吗?
【问题讨论】:
标签: pandas machine-learning categorical-data one-hot-encoding