【发布时间】:2015-04-23 14:00:15
【问题描述】:
我正在尝试学习如何抓取嵌入在 javascript 谷歌地图标记内的数据。
这是我想从中提取的代码类型的示例,而不是实际的预期代码。注意:让我重复一遍,这只是一个示例,而不是实际的预期页面。
我把代码放在了一个 paste-bin 中,因为代码 sn-p 太大了: http://pastebin.com/sVZq4B5j
从这段代码中,我想提取如下数据:
"centroid_id":"23913",
"纬度":"35.899757906753",
“经度”:“-79.046030044556”,
"location_name":"UNC 麦科尔大楼",
联系方式
詹姆斯·布里顿
UNC 麦科尔大楼
可用性:通常周一、周二和周三下午都有空。 如果您想申请时间,请给我发电子邮件。我不是 周末可用。
停车:下午 4 点后不收停车费。如果白天有 是游客停车场的停车收费表,每人收费约 1.50 美元 小时。
费用:25.00 美元
费用详情:2 小时考试 25 美元,3 小时考试 35 美元。费用是位置 和监考
机考:是
在线/基于互联网的考试:是
计算机考试的安静环境:封闭且持续 计算机考试监督:是
笔试:是
安静的纸质考试环境:是
对纸质考试进行密切和持续的监督:是
ADA 可访问性:是
执行此操作的 XPath 表达式是什么?我正在使用 Scraper Chrome 扩展程序。有没有其他方法可以做到这一点?
另外,谁能解释一下 /t 、 /n 、 \t 和 \n 的字符串是干什么用的?例如:
\n\t\t\t\n\t\t\t\n\t\t\t\n\n\t\t<\/td>\n\n\t<\/tr>\n\n\t\t\n\n\t\n\t<tr>\n\n\t\t\t
【问题讨论】:
标签: javascript xpath web-scraping google-maps-markers screen-scraping