【发布时间】:2020-02-02 08:16:08
【问题描述】:
我有一个数据集,我想打印所有频率最高的句子 喜欢:
假设我有这个:
这是我的原始数据集
我想打印所有包含 (i) 的句子,然后从数据集中删除那些提取的句子
然后以(you)开头,打印所有包含(you)的句子,然后删除(you)
但我想设置它们之间的范围示例从(频率 600 到 100)开始,而不是全部 如何做到这一点
知道怎么做吗?我的数据集是 .txt
我试过这个:
【问题讨论】:
-
描述不够清楚。您想打印常用词(我、您、我们)的数量,还是想打印它们出现的句子?无论哪种情况——你所说的常用词是什么意思——你有一个清单吗?还是您想考虑前 5 或 10 个最常出现的词?....请更清楚地描述问题陈述...
-
同时发布您已经尝试过的内容,这样更容易提供帮助
-
示例我想打印所有出现 (i) 的句子,然后从原始数据集中删除这些句子
-
对不起,我找不到合适的答案,我尝试了多种方法,但我失败了
标签: python dataset extract frequency sentence