【发布时间】:2018-04-18 20:47:42
【问题描述】:
正如问题所说,我有一个数据框 df_original,它非常大,但看起来像:
ID Count Column 2 Column 3 Column 4
RowX 1 234. 255. yes. 452
RowY 1 123. 135. no. 342
RowW 1 234. 235. yes. 645
RowJ 1 123. 115. no. 342
RowA 1 234. 285. yes. 233
RowR 1 123. 165. no. 342
RowX 2 234. 255. yes. 234
RowY 2 123. 135. yes. 342
RowW 2 234. 235. yes. 233
RowJ 2 123. 115. yes. 342
RowA 2 234. 285. yes. 312
RowR 2 123. 165. no. 342
.
.
.
RowX 1233 234. 255. yes. 133
RowY 1233 123. 135. no. 342
RowW 1233 234. 235. no. 253
RowJ 1233 123. 115. yes. 342
RowA 1233 234. 285. yes. 645
RowR 1233 123. 165. no. 342
我正在尝试删除文本数据并将其替换为预定义的等效数字。例如,在这种情况下,我想将Column3 的yes 或no 值分别替换为1 或0。有没有办法做到这一点,而我不必手动进入并更改值?
【问题讨论】:
-
For-loop 和 if-else 语句并使用 replace 方法或正则表达式
-
类似
df['Column 3']=df['Column 3'].replace({'yes.':1,'no.':0})? -
df_original.Column3 = df_original.Column3.apply(lambda x : int(x == 'yes.'))不够吗?
标签: python pandas dataframe categorical-data