【发布时间】:2017-07-30 08:00:00
【问题描述】:
我在文档中有一组带有坐标的单词,我想把它们变成句子。 我的数组输入:
[
{
"bounds": [
{
"x": 10,
"y": 10
},
{
"x": 15,
"y": 10
},
{
"x": 15,
"y": 15
},
{
"x": 10,
"y": 15
}
],
"desc": "Hey"
},
{
"bounds": [
{
"x": 18,
"y": 10
},
{
"x": 24,
"y": 10
},
{
"x": 24,
"y": 15
},
{
"x": 18,
"y": 15
}
],
"desc": "Name"
},
{
"bounds": [
{
"x": 18,
"y": 20
},
{
"x": 24,
"y": 20
},
{
"x": 24,
"y": 25
},
{
"x": 18,
"y": 25
}
],
"desc": "What"
},
{
"bounds": [
{
"x": 18,
"y": 20
},
{
"x": 24,
"y": 20
},
{
"x": 24,
"y": 25
},
{
"x": 18,
"y": 25
}
],
"desc": "Sup"
}
]
程序输出应该是:
Hey Name
What Sup
- 坐标不准确只是一个例子,算法需要处理句子中间的单词和其他极端情况。
最好的方法是什么(最好用 JavaScript 实现)?
【问题讨论】:
-
请解释一下,您希望如何实现这一目标。用“机器学习”或“算法”标记这个问题并不能解释你想要做什么。
-
@MichaelHirschler 我正在寻找最好的方法......
-
@gal 这绝对没有增加问题。它是什么”?您想将一组单词变成句子。数组的结构是什么?你想创建什么类型的句子?
-
@victor 很抱歉造成混乱。数组在问题内容和输出中,我想根据单词位置而不是它们的含义来创建句子。我有一个 OCR 模型来查找单词位置,但我不知道如何将它们连接到句子。
-
@Lora129 完全正确!
标签: javascript algorithm machine-learning ocr document