【发布时间】:2017-03-19 00:05:10
【问题描述】:
我正在尝试将反向搜索作为 map reduce 的一部分,我能够完成其中的第一部分(mapper)。第一部分的输出如下所示 (标题仅供参考,并非mapper的实际输出)
word frequency document
------------------------------
tire 1 car
headlight 1 shop
tire 1 car
gas 1 gasstation
beer 1 gasstation
headlight 1 car
tire 1 shop
我正在尝试以下解决方案:
单词在哪个文件中找到,以及它的频率。 (例如在汽车文件中发现了两次轮胎)
到目前为止,我一直尝试使用字典来获取找到该单词的文件,但我无法链接它来获取计数,下面是我得到的输出:
{'car':[tire,tire,headlight],'shop':[headlight],'gasstation':[gas,beer]}
预期:
tire {'car':2,'shop':1}
headlight {'car':1, 'shop':1}
【问题讨论】:
-
请注意,“预期”不是 desired 输出的占位符。你为什么期待这个输出?您希望生成它的代码在哪里?给minimal reproducible example。
-
看Counter类
标签: python python-2.7 dictionary inverted-index