【发布时间】:2025-12-12 02:15:01
【问题描述】:
我有一个 pdf 文档(无表单),我想在其中禁用使用 pdfBox (java) 的文本搜索。 我可以想象以下几种可能性:
- 扁平化文本
- 删除文本信息(不删除文本本身)
- 向文档添加叠加层。
目前我不知道如何实现它。有谁知道如何解决这个问题?
【问题讨论】:
-
虽然我的第一个问题是您为什么要这样做,但一个简单的解决方案可能是只为您的文本制作图像。你仍然可以图像 -> 文本它无论如何并搜索它。如果没有视觉混淆,你无法真正阻止这种情况,所以除了给搜索过程增加不必要的复杂层之外,我看不出它在哪里做任何事情。
-
该请求的原因是 pdf 包含不应向用户显示的关键信息。因此,我们添加了一个隐藏这些信息的框。但只有有了这个盒子,信息仍然是可搜索的。现在我正在寻找一种解决方案如何防止这种情况发生。
-
您应该使用实际的编辑,而不仅仅是用矩形覆盖。