【发布时间】:2018-01-18 23:08:53
【问题描述】:
我有一个要测试字谜的单词列表。我想使用熊猫,所以我不必使用计算上的浪费循环。给定一个 .txt 的单词列表说:
"acb" “bca” “富” “钱币” “猎犬”
我想将它们放在一个 df 中,然后按它们的字谜列表对它们进行分组 - 我可以稍后删除重复的行。
到目前为止,我有代码:
import pandas as pd
wordlist = pd.read_csv('data/example.txt', sep='\r', header=None, index_col=None, names=['word'])
wordlist = wordlist.drop_duplicates(keep='first')
wordlist['split'] = ''
wordlist['anagrams'] = ''
for index, row in wordlist.iterrows() :
row['split'] = list(row['word'])
wordlist = wordlist.groupby('word')[('split')].apply(list)
print(wordlist)
我如何按一个集合分组以便它知道
[[a, b, c]]
[[b, a, c]]
都一样吗?
【问题讨论】:
标签: python pandas pandas-groupby