【发布时间】:2017-06-25 06:44:55
【问题描述】:
这是我拥有的数据框的一个子集。对于句子列具有值的每一行,对于接下来的两行重复 A B C D 列,而句子列没有值。如何删除句子的空值的第二行。我需要为句子列保留第一行的空值。
A B C D R sentence ADR
112 135 21 EffexorXR.21 1 lack of good feeling. good
113 135 21 EffexorXR.21 1 1
114 135 21 EffexorXR.21 1
115 136 21 EffexorXR.21 2 Feel disconnected disconnected
116 136 21 EffexorXR.21 2
117 136 21 EffexorXR.21 2
118 142 22 EffexorXR.22 1 Weight gain gain
119 142 22 EffexorXR.22 1 1
120 142 22 EffexorXR.22 1
输出是这样的
A B C D R sentence ADR
112 135 21 EffexorXR.21 1 lack of good feeling. good
113 135 21 EffexorXR.21 1 1
115 136 21 EffexorXR.21 2 Feel disconnected disconnected
116 136 21 EffexorXR.21 2
118 142 22 EffexorXR.22 1 Weight gain gain
119 142 22 EffexorXR.22 1 1
如果我使用以下代码:
df = df[pd.notnull(df['sentences'])], 然后它将删除具有空值的两行。有什么建议吗?
以下解决方案不起作用。
df.set_index('A').drop_duplicates().reset_index()
【问题讨论】: