【发布时间】:2019-08-06 10:50:24
【问题描述】:
我有一个具有以下映射的 pdf:
<019A> <0074>
<039E> <00A9>
<019F> <00740069>
<01B5> <0075>
<01C0> <0076>
<01C7> <0079>
<03EC> <0030>
映射,cid 代表连字ti。
在映射 \u0074 -> t 和 \u0069 -> i(因此)连字 ti。
如何获得实际的连字 unicode?或者我必须跟踪这种模式并用连字的实际 unicode 替换 cid 映射?
谢谢。
【问题讨论】:
-
Unicode 没有“ti”连字字符。这个 CMap 是从哪里来的?
-
它嵌入在 PDF 中。 :(
-
看起来必须以编程方式对其进行跟踪。
-
是的,你必须这样做。