【发布时间】:2019-08-15 22:26:46
【问题描述】:
我正在使用 Amazon Textract 从扫描的文档中提取数据。现在我想将输出转换为 PDF 文件。以下是 Textract 的示例输出:
[1] => Array
(
[BlockType] => LINE
[Confidence] => 99.4744720459
[Text] => Hello
[Geometry] => Array
(
[BoundingBox] => Array
(
[Width] => 0.243866533041
[Height] => 0.0134594505653
[Left] => 0.176409825683
[Top] => 0.0463116429746
)
[Polygon] => Array
(
[0] => Array
(
[X] => 0.176409825683
[Y] => 0.0463116429746
)
[1] => Array
(
[X] => 0.420276373625
[Y] => 0.0463116429746
)
[2] => Array
(
[X] => 0.420276373625
[Y] => 0.0597710944712
)
[3] => Array
(
[X] => 0.176409825683
[Y] => 0.0597710944712
)
)
)
[Id] => 75e8917d-701e-4e26-bade-f00bde9d87db
[Relationships] => Array
(
[0] => Array
(
[Type] => CHILD
[Ids] => Array
(
[0] => 46f44500-4960-4405-99f3-fa43101bc2ca
)
)
)
)
如您所见,输出包含文本、高度、宽度及其 XY 坐标。如何将具有相同坐标的文本放入 PDF 文件中?
【问题讨论】:
-
您想将文本叠加到现有 PDF 上,还是想使用此信息从头开始创建 PDF?另一种询问方式是,您是用这些数据填写表格,还是创建一个全新的文档。
-
@user1153660 我正在尝试使用这些数据从头开始创建 PDF。
-
@Sreeraj 你做到了吗?
标签: amazon-web-services pdf pdf-generation tcpdf fpdf