【问题标题】:Check if a text string contains text or similar text检查文本字符串是否包含文本或类似文本
【发布时间】:2021-06-30 12:00:23
【问题描述】:

我有一个有趣的问题:

我有一个相当大的文本段落,我想检查该段落是否包含某些短语。现在,不允许直接匹配,因为我想知道该段落是否包含短语或类似短语,例如如果我有一份隐私政策文档,并且我想检查该文档是否提到任何有关“跟踪 cookie”的内容,我将如何处理?

我是用 Python 做的。

【问题讨论】:

    标签: python text nlp data-science textmatching


    【解决方案1】:

    您可以构建一个正则表达式来捕获字符串“跟踪 cookie”的多个变体。例如,一个正则表达式捕获:

    tracking cookies
    cookie trackers
    Cookies
    cookie
    tracker cookie
    Tracking Cookies
    .
    .
    .
    etc.
    

    然后,每次遇到字符串的新变体时,都可以将其添加到正则表达式中。

    【讨论】:

    • 我该怎么做?
    • 查找“Python 中的正则表达式”。我(以及本网站上没有其他人)将为您编写代码。如果您遇到困难,请在 Stack Overflow 和其他在线网站上查找答案。如果您找不到答案,请在 Stack Overflow 上提出一个新问题。祝你好运!
    • 非常感谢亚历山德鲁·克里斯蒂安。需要说明的是,我没有要求代码,我要求的是合乎逻辑的解释,而不是您给出的提示。不管怎样,我想通了。谢谢。
    • 我明白了。如果您认为我的回答有帮助,请考虑投票并使其成为公认的答案
    • 我接受了它作为答案,很遗憾我不能投票,因为我是一个相当新的成员。谢谢亚历山德鲁!
    猜你喜欢
    • 2020-04-15
    • 2013-05-03
    • 2015-01-31
    • 2021-03-04
    • 2020-01-27
    • 2016-11-05
    • 2019-08-25
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多