【发布时间】:2023-03-21 00:34:01
【问题描述】:
我在尝试 .isin() 时遇到了一些意外错误 这就是问题所在。我已经废弃了网页,变成了数据框。现在我想进行更改以使数据对项目更有用。 从报废的数据中,一列包含所有特征,它是 json 中的一个列表,但在 pd 中,它是一个“非空对象”:
"feature": ["Wi-Fi", "LAN", "LED"]
我想根据每个功能创建新的布尔列,这将在以后有所帮助。 它应该是这样的
Product Wifi LAN LED
1 True True True
2 True False False
我已经尝试了 str.contains 和 .isin(),但都出现了错误。 比如
TypeError: only list-like objects are allowed to be passed to isin(), you passed a [str]
ValueError: Length of values does not match length of index
有什么更好的方法来解决这个问题?
另外,原始数据是日文的,我已经用 "encoding="utf-8" 加载了数据框,如何在 pandas 中使用 utf8 进行最佳编码?我使用 notepad++ 作为编辑器.
【问题讨论】:
-
你能提供一个小的可重复的输入数据集样本吗?
feature是什么 - 它是 JSON 字符串 还是功能列表? -
请按edit 并将数据集样本放入您的问题 - 作为评论很难阅读
-
{"name": "CHEZ MADU ", "address": "5-17-62", "access": "30", "tel": "042-465-3533", "hour": "9:00〜22:00", "offday": "-", "web": "http://www.hakka-group.co.jp/shoplist/", "feature": ["Wi-Fi", "LAN", "Non-smoking"]},这是一行原始数据