【发布时间】:2021-10-09 17:39:45
【问题描述】:
我有一个关于为文本搜索单词的问题。
在我的代码中,我在意大利语文本中查找单词(根据段落分为字符串)但是当我有像 "e", "in", "ad" 这样的单词时,它告诉我它找到了很多次,但实际上,这些是诸如“begin”、“adduce”之类的词以及任何包含 e 的词。有没有一种有效的方法来避免这种“错误”?我到处搜索,但找不到任何东西,我认为这是一个简单的问题,但我根本不是专家,感谢那些会帮助我的人。我想在不导入任何库的情况下这样做
示例文本: ['sostanza di cieli ed astri cercai per oceani。 di donarmi il diluvio ti dissi io, o musa, scorgendo il destino.', "o zeus che infiniti addurre volle, principiando constormi arditi fulmini di ira molto funesta laddove si alzasse eccessivamente il volare negato all'uomo.", 'imperterrita unfrenabile poiché poiché memore di ciò, da qualunque principio, memore di di di di ciò di ciò, da qualunque principio, ad ogni costo, dea figlia di zeus, narrane cagione e spirito。 ']
我必须找到这些词(有可能并非所有这些词都在文本中,例如缺少“e”): 莫莫, 迪西奥, 哦穆萨, 莫尔托, 例行公事, e, 在, 迪西奥
预期输出:uomo、dissi io、o musa、molto、eccessivamente、di ciò
【问题讨论】:
-
你能提供一些你的文本样本和预期的输出吗?
-
搜索
" e "、" in "、" ad "(带空格),这样只会显示单个单词 -
@IoaTzimas 我刚刚编辑过 :)
-
@Einliterflasche 是的,这是个好主意,但我该怎么做呢?
-
@orsettomorbido 您可以编写一个函数来返回输入的字符串但带有空格(
"ad"=>" ad "),但这不如 H. Rittich 的正则表达式解决方案那么优雅跨度>