【发布时间】:2021-06-18 21:40:02
【问题描述】:
查询:我想统计某个单词在excel单元格范围内出现的次数
如果可能,不要寻找某个单词,而是使用一个脚本来总结 Excel 单元格范围内每个单词出现的次数。即按照频率从高到低的顺序总结,每个单词出现的次数。
Excel 文件:
- 单元格范围在 K 列中
- 每个单元格有 >1000 个字符
- 有 >1000 行
谢谢!
【问题讨论】:
-
你能告诉我们你到目前为止得到了什么吗?
-
import pandas as pd # 在此处插入您的文件名 filename = r"C:\Users\compl\OneDrive\Desktop\Documents"+"\\"+ "TEST" # Excel 列搜索 columname = "Notes1" # 要搜索的关键字 Keyword = "The" df = pd.read_excel(filename) #print(df) #condensed = df[df[columname].str.contains(Keyword, na=False)] print(condensed [columname].str.split(expand=True).stack().value_counts()) 返回文件未找到错误。我对此很陌生,所以任何帮助都会很棒,谢谢!
-
对你来说重要的是它是用python制作的还是VBA可以?如果您必须为很多工作表执行此操作,这不是一个好的选择,如果您只需要在几个工作表中执行此操作,它可能是一个可行的选择,因为它易于编写并且全部在 excel 中。
-
只有 12 张,如果可能的话,如果你有一个脚本可以在 VBA 中做吗?谢谢!
-
我想我可以想出一些东西,我最近对一个脚本做了类似的事情。单词是否仅由空格分隔,或者是否还有点和 - 或 ;正确拆分单词很重要,否则您可能会有“某物”和“某物”。输入结果