【问题标题】:xPath, DomDocument, Scraping table [duplicate]xPath,DomDocument,抓取表[重复]
【发布时间】:2013-04-29 16:30:46
【问题描述】:

我有这个link,我需要在该表上使用 xPath 和 domDocument 进行一些抓取。我需要得到化学、链接和零件的名称。我尝试在 chrome 中使用 xPath 助手,但没有运气,它没有做出正确的查询。任何想法我做错了什么? 我正在使用这个查询://table/tbody/tr/td/a

【问题讨论】:

    标签: php xpath


    【解决方案1】:

    我可以通过以下方式在 Chrome 中使用 xPath 帮助程序获取您要查找的数据(这些行输入到 Chrome 控制台):

    所有化学品/第一种化学品:

    > allChemicals = $x("descendant::tr/td[(position() =1)]")
    > firstChemical = allChemicals[0].innerText
    

    所有链接/第一个链接:

    > allLinks = $x("descendant::tr/td[(position() =1)]/a")
    > firstLink = allLinks[0].href
    

    所有部分/第一部分:

    > allParts = $x("descendant::tr/td[(position() =2)]")
    > firstPart = allParts[0].innerText
    

    希望对您有所帮助。

    【讨论】:

    • 是的,您的 xPath 工作得很好,发现有一个用于 xPath 的控制台,您可以在其中构建查询.. 有趣 :-d 但即使它们工作似乎当我在 php 中使用相同的东西时不会选择同路怪。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2016-02-14
    • 2020-07-22
    • 1970-01-01
    • 2021-10-31
    • 2016-04-13
    • 1970-01-01
    相关资源
    最近更新 更多