【发布时间】:2011-08-07 11:04:53
【问题描述】:
盲文是盲人专用的字体。我正在尝试解码 PDF 文件中以盲文字体编写的文本并输出普通文本。但 PDFTextExtractor(在 iTextSharp 中)无法处理此字体。有没有其他办法?
我想弄清楚如何从 pdf 文件中解码。
我试过用,
PdfReader pdf = new PdfReader("C:\\pdfs\\file.pdf");
string text = PdfTextExtractor.GetTextFromPage(pdf, 1);
this.brailleTextBox.Text = text.ToString();
this.normalTextBox.Text = text.ToString();
在具有常规字体(例如 Arial)和盲文字体的文本的 pdf 文件上,但它不返回盲文文本,而是仅返回页面上的普通文本。
如何使用 iTextSharp 获取盲文字体文本。
【问题讨论】:
-
你能发一个示例文件让我们看看吗?
-
另外,您可以在 Adobe Acrobat 中选择“文本”吗?如果你复制它,它会以文本形式出现吗?
-
我找到了免费的盲文字体并且它被正确选择了。但是这些字体对于不同的母语是不同的,这让我麻烦了 2 次。现在盲文字符必须通过图像处理来解密。盲文样本 pdf dl.dropbox.com/u/18670740/…
标签: pdf itextsharp extract itext braille