【发布时间】:2015-08-10 17:02:05
【问题描述】:
我有一个小问题,你一定会在 30 秒内解决! ;-)
我尝试阅读 .PDF 时间表的特定行。
示例:
New York: 06:30 / 07:00 / 10:15 / 12:30
Boston: 07:30 / 08:00 / 11:15 / 01:30
Chicago: 08:30 / 09:00 / 12:15 / 02:30
我参考了那个topic并尝试调整它,但它不起作用!
如果我理解行尾的注释
String lines[] = text.split("\\r?\\n"); // give you all the lines separated by new line
在我的情况下,String lines[] = text.split("Boston"); 应该检索所有波士顿列,但事实并非如此。
那么我怎样才能检索所有波士顿时间(07:30、08:00、11:15、01:30 等)?
任何帮助将不胜感激。
编辑:
我显然是在谈论原生 pdfbox 函数
否则,我当然可以逐行分析从 PDF 文件中提取的文本,但我想它不会安静地优化/快速。
【问题讨论】:
标签: java pdfbox text-extraction