【问题标题】:Converting List of Values into Encoded Variables? [duplicate]将值列表转换为编码变量? [复制]
【发布时间】:2018-09-07 01:59:54
【问题描述】:
business_id               categories
1K4qrnfyzKzGgJPBEcJaNQ   ['Tiki Bars', 'Nightlife', 'Mexican', 'Restaurants', 'Bars']
dTWfATVrBfKj7Vdn0qWVWg   ['Restaurants', 'Chinese', 'Food Court']

这就是我的数据框的样子。第二列的每个值都有一个列表。

我目前正在使用此代码,但它不起作用并给我一个错误 下面:

categorical_data = pd.DataFrame()
for i in range(len(data)):
  for j in range(len(data.iloc[i][1])):
    categorical_data = pd.concat(data.iloc[i][0], data.iloc[i][1][j])

TypeError: first argument must be an iterable of pandas objects, you pass a object of type "str"

有没有一种方法可以将类别列表添加到同一家餐厅?我尝试过使用“get_dummies”,但它无法拆分列表并对其进行编码。

【问题讨论】:

  • 预期输出是什么?
  • 是的,我没找到。谢谢。

标签: python python-3.x pandas dataframe encoding


【解决方案1】:

我相信你需要MultiLabelBinarizerjoin

from sklearn.preprocessing import MultiLabelBinarizer

mlb = MultiLabelBinarizer()
df1 = pd.DataFrame(mlb.fit_transform(df['categories']),columns=mlb.classes_, index=df.index)
df2 = df[['business_id']].join(df1)
print (df2)
              business_id  Bars  Chinese  Food Court  Mexican  Nightlife  \
0  1K4qrnfyzKzGgJPBEcJaNQ     1        0           0        1          1   
1  dTWfATVrBfKj7Vdn0qWVWg     0        1           1        0          0   

   Restaurants  Tiki Bars  
0            1          1  
1            1          0  

或者从第一列创建索引:

df1 = pd.DataFrame(mlb.fit_transform(df['categories']),
                   columns=mlb.classes_, index=df['business_id'])
print (df1)
                        Bars  Chinese  Food Court  Mexican  Nightlife  \
business_id                                                             
1K4qrnfyzKzGgJPBEcJaNQ     1        0           0        1          1   
dTWfATVrBfKj7Vdn0qWVWg     0        1           1        0          0   

                        Restaurants  Tiki Bars  
business_id                                     
1K4qrnfyzKzGgJPBEcJaNQ            1          1  
dTWfATVrBfKj7Vdn0qWVWg            1          0  

【讨论】:

  • 非常感谢。
猜你喜欢
  • 2015-07-28
  • 1970-01-01
  • 2022-01-22
  • 2017-12-21
  • 1970-01-01
  • 2021-08-19
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多