【发布时间】:2020-07-10 16:51:15
【问题描述】:
我正在尝试使用 iText7 读取 PDF 中使用的所有字体。为此,我创建了一个IEventListener,它从TextRenderInfo 读取字体:
private class FontReader : IEventListener
{
public ICollection<string> Fonts { get; }
public FontReader()
{
Fonts = new List<string>();
}
public void EventOccurred(IEventData data, EventType type)
{
if (!(data is TextRenderInfo)) return;
var font = ((TextRenderInfo) data).GetFont();
var fontName = font.GetFontProgram().GetFontNames().GetFontName();
if (!string.IsNullOrEmpty(fontName) && !Fonts.Contains(fontName))
{
Fonts.Add(fontName);
}
}
public ICollection<EventType> GetSupportedEvents()
{
return new HashSet<EventType> {EventType.RENDER_TEXT};
}
}
这似乎工作正常,并允许我阅读所有 Type 1 字体。但是在 Type 3 字体上调用 GetFontProgram().GetFontNames().GetFontName(); 会返回 null。
在 Acrobat Reader 中查看字体确实显示了 Type 3 字体的名称(见屏幕截图)。如何在 C# 中通过 iText7 找到这个名称?
【问题讨论】:
-
您好,能否附上示例PDF进行复制?
-
@AlexeySubach 不幸的是我不能,因为它们是机密的。