【发布时间】:2021-12-02 15:17:09
【问题描述】:
我有 2 个数据框,我想在其中计算编号。从 df1 到 df 2 的匹配词数
df1 是属于每个部门的关键字列表,例如教育、金融、交通等
df1:
| Sector | Content |
|---|---|
| Education | ['school', 'children', 'learning', 'enrichment' ] |
| Finance | ['banks', 'insurance', 'moneylender'] |
df 2 是从网站抓取的数据。单词已经被拆分和清理,并且是列表形式。
df2:
| Company Name | Website Info |
|---|---|
| ABC | ['school', 'enrichment'] |
| DEF | ['banks', 'children', 'school' ] |
我想找出答案。 df1 中每个扇区匹配的单词数。
预期结果:
| Company Name | Website Info | No. of Matched Words Education | No. of Matched words Finance |
|---|---|---|---|
| ABC | ['school', 'enrichment'] | 2 | 0 |
| DEF | ['banks', 'children', 'school' ] | 2 | 1 |
【问题讨论】: