【发布时间】:2021-09-27 05:27:54
【问题描述】:
我遇到了以下问题。我确实有 2 个列表/数据框。一个是客户列表/数据框,其中每一行都是客户,列是这些客户的同义词,其他口头表达。
customer_list = {'A': ['AA', 'AA', 'AAA'], 'B': ['B', 'BB','BBB'], 'C': ['C','CC','CCC']}
customer_df = pd.DataFrame.from_dict(customer_list, orient='index')
比我有另一个具有以下结构的数据框:
text = [['A', 'Hello i am AA', 'Hello i am BB', 'Hello i am A'], ['B', 'Hello i am B', 'Hello i am BBB','Hello i am BB'], ['C', 'Hello i am AAA','Hello i am CC','Hello i am CCC']]
text_df = pd.DataFrame(text)
text_df = text_df.set_index(0)
text_df = text_df.rename_axis("customer")
如何(哪些类型,哪些功能)我可以检查 text_df 的每一行(例如行“A”的每个元素)是否有“错误条目”,这意味着其他客户的所有元素/同义词(所以检查除了自己的每个条目)。我是否必须在 for 循环中创建多个数据框?一个循环就够了吗?
感谢您的任何建议,即使只是有关方法的提示。 对于我的示例,结果类似于
错误的文字:A:你好,我是 BB, C: 你好,我是 AAA 或者一些相应的指数会很棒。
【问题讨论】:
-
您的预期输出是什么?你想要一个只有正确值的数据框,还是想要一个包含所有不正确值的列表?
-
包含错误值和位置的列表
标签: python pandas string loops