【发布时间】:2024-12-16 21:00:01
【问题描述】:
我对 pdf 图像进行了 OCR 并提取了文本。 出于某种原因,OCR 已将单个空格转换为双回车换行。
例如。
"\r\n\r\n"
以下不起作用,因为我认为我的 4 个字符并不是真正的搅拌,而是 4 个不可打印的字符。
DocumentData = DocumentData.Replace(@"\r\n\r\n", "");
我只想在这 4 个不可打印字符一起出现时用空格替换它们。
如何不费吹灰之力实现这一点。
【问题讨论】:
-
如果它们不可打印,请删除@ - 它是一个逐字字符串,然后按照 sakura 写的 - " "
标签: c# string str-replace non-printing-characters