【发布时间】:2016-02-10 20:33:46
【问题描述】:
我有一个嵌套哈希
[{:page=>1,
:lines=>[
{:y=>774.0, :text_groups=>[{:x=>18.0, :width=>421.59599999999995, :text=>"-*- Demonstration Powered by HP Exstream 04/21/2015, Version 9.0.104 32-bit -*-"}]},
{:y=>762.0, :text_groups=>[{:x=>504.24, :width=>53.78399999999999, :text=>"July 16, 2014"}]},
{:y=>699.12, :text_groups=>[{:x=>54.0, :width=>80.01709144799977, :text=>"Capital One Auto Finance"}]},
{:y=>690.9599999999999, :text_groups=>[{:x=>54.0, :width=>59.619068135999825, :text=>"7933 Preston Road"}]},
{:y=>682.8, :text_groups=>[{:x=>54.0, :width=>53.450022959999956, :text=>"Plano, TX 75024"}]},...........
[{:page=>2, :lines=>[.....
这是 PDF 内容的哈希值。 当给定键值对:y=>"690.9599999999999"、:x=>"54.0" 和 :width=>"59.619068135999825"
时,我想获得“文本”“7933 Preston Road”的值基本上我在这里要做的是,在作为字母的 PDF 中,我试图找出给定坐标处存在的文本。 我可以将 PDF 内容放入哈希中,但无法搜索并打印所需坐标的文本。
有人可以帮我解决这个问题吗?
【问题讨论】:
-
坐标是否固定且每次都相同?
-
长浮点值可能会受到少量抖动的影响。多近才够近?
-
现在我们假设坐标是固定的
-
不确定浮点值。我想我们可以说+或-一两个地方。这行得通吗?
标签: ruby-on-rails ruby pdf hash hashmap