【发布时间】:2017-05-29 05:28:11
【问题描述】:
我正在遍历单词列表以查找单词之间最常用的字符(即在列表中[hello, hank]、'h' 算作出现两次,而 'l' 算作出现一次。)。 python 列表工作正常,但我也在研究 NumPy(dtype 数组?)和 Pandas。看起来 Numpy 可能是要走的路,但还有其他软件包需要考虑吗?还有什么方法可以让这个功能更快?
有问题的代码:
def mostCommon(guessed, li):
count = Counter()
for words in li:
for letters in set(words):
count[letters]+=1
return count.most_common()[:10]
谢谢。
【问题讨论】:
-
你能解释一下“最常见的独特字符”是什么意思吗?并包括一些示例输入和输出数据
-
@Chris_Rands 编辑了一个例子,如果你需要更多,请 lmk。
-
所以你只想要最频繁的字符还是所有字符的频率?
标签: python pandas numpy optimization