【问题标题】:xpath to scrape data from javascript google maps markers, using chrome scraper使用 chrome scraper 从 javascript 谷歌地图标记中抓取数据的 xpath
【发布时间】:2015-04-23 14:00:15
【问题描述】:

我正在尝试学习如何抓取嵌入在 javascript 谷歌地图标记内的数据。

这是我想从中提取的代码类型的示例,而不是实际的预期代码。注意:让我重复一遍,这只是一个示例,而不是实际的预期页面。

我把代码放在了一个 paste-bin 中,因为代码 sn-p 太大了: http://pastebin.com/sVZq4B5j

从这段代码中,我想提取如下数据:

"centroid_id":"23913",

"纬度":"35.899757906753",

“经度”:“-79.046030044556”,

"location_name":"UNC 麦科尔大楼",

联系方式

詹姆斯·布里顿

UNC 麦科尔大楼

可用性:通常周一、周二和周三下午都有空。 如果您想申请时间,请给我发电子邮件。我不是 周末可用。

停车:下午 4 点后不收停车费。如果白天有 是游客停车场的停车收费表,每人收费约 1.50 美元 小时。

费用:25.00 美元

费用详情:2 小时考试 25 美元,3 小时考试 35 美元。费用是位置 和监考

机考:是

在线/基于互联网的考试:是

计算机考试的安静环境:封闭且持续 计算机考试监督:是

笔试:是

安静的纸质考试环境:是

对纸质考试进行密切和持续的监督:是

ADA 可访问性:是

执行此操作的 XPath 表达式是什么?我正在使用 Scraper Chrome 扩展程序。有没有其他方法可以做到这一点?

另外,谁能解释一下 /t 、 /n 、 \t 和 \n 的字符串是干什么用的?例如:

\n\t\t\t\n\t\t\t\n\t\t\t\n\n\t\t<\/td>\n\n\t<\/tr>\n\n\t\t\n\n\t\n\t<tr>\n\n\t\t\t

【问题讨论】:

    标签: javascript xpath web-scraping google-maps-markers screen-scraping


    【解决方案1】:

    我认为您需要的不是 XPath,而是一种解析代码并获得所需部分的方法。 一种方法可能是使用正则表达式,这在 html 上效果不佳,另一种方法可能是使用 HTML 解析器。

    无论如何,您都需要一些编程技能才能使用其中任何一种。例如,使用一些节点/javascript 技能,您可以使用this 解析器来完成工作。

    引用node-htmlparser的文档,这个html:

    <a href="test.html">xxx</a>
    

    变成:

    [ { type: 'tag'
      , name: 'a'
      , attribs: { href: 'test.html' }
      , children: [ { data: 'xxx', type: 'text' } ]
      }
    ]
    

    所以基本上你可以读取任何文本内容并将它们放入 JavaScript 变量中。

    关于你问题的最后一部分: \n 是换行符 \t 转换为标签

    【讨论】:

    • 您能详细介绍一下解析器的功能吗?
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2012-06-06
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2011-11-15
    • 1970-01-01
    相关资源
    最近更新 更多