【发布时间】:2015-01-26 11:05:16
【问题描述】:
我在一个文件夹中有多个文档。其中一些,有这样的文字:
text="???????????????????????????????????? ??????????????????????? ?????????????????????????????????? ????????????? ???????????????????? ?????? ? ? ???? ????????????? ??????????? ????????????????????? ?????? ? ? ???? ????????? ?????????????????? ??????????????????????? ??????????? ????? ??????? ?????????????? ??????????????????????? ?????? ? ? "
我想识别这些文档并将这个可变文本输入:text=""。
我的问题是,我如何识别这种模式?如您所见,有几个“?”重复没有相同的重复次数。模式应该是“如果没有文本且只有“?”字符,则删除内容。
【问题讨论】:
-
这看起来像是没有正确处理 Unicode 的人工制品。这是xy problem吗?
-
第一个想法,像这样:string = string.find (text, "%w") print(string)
-
感谢@Phylogenesis。我正在尝试解决它,但我担心删除一些我不会删除的内容。
标签: string lua lua-patterns