【问题标题】:getting the xpath for crawling a video url获取用于抓取视频 url 的 xpath
【发布时间】:2019-10-31 21:52:02
【问题描述】:

我想从webpage 获取视频 url 的 xpath,以便我可以使用 python 下载它的视频。

我所做的是按 F12 并找到视频部分,然后在视频类下,右键单击源并复制 xpath。但我找不到视频网址的 xpath。我得到的xpath如下:

//*[@id="react-project-header"]/div/div/div[1]/div[1]/div[1]/div/video/source[1]

【问题讨论】:

    标签: html python-3.x xml xpath web-crawler


    【解决方案1】:

    尝试使用此 xpath 表达式提取 url

    //*[@id="react-project-header"]/div/div/div[1]/div[1]/div[1]/div/video/source[2]/@src
    

    编辑:如何到达那里

    最初,我以与您相同的方式获得路径 - 通过“开发人员”选项卡。我将结尾部分从source[1] 更改为source[2],因为那是视频的高清版本所在的位置,为什么不呢?更重要的是,您的实际目标(视频的 url)是 - 使用正式的 xpath 术语 - 节点属性的属性值。在本例中,节点为source[2],属性为src,值为所需的url。要选择节点属性的属性值,必须使用@ 运算符,如

    node/@attribute
    

    或者,在这种情况下

    [xpath to]source[2]/@src
    

    【讨论】:

    • 谢谢!请指导我如何获得此 xpath?
    • 我还有一个问题。因此,我按照您的指示进行了操作,它有效,但不适用于我想要获取的另一个网址。从这个网站(kickstarter.com/projects/peak-design/…)我想得到这个网址(youtube.com/embed/…),我得到的 xpath 是://*[@id="player"]/@src
    • @MaryamRahmaniMoghaddam - 根据 SO 政策,您应该将其作为单独的问题发布。我很乐意看看。
    • 这是问题的链接。谢谢你! stackoverflow.com/questions/59256717/…
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2016-03-19
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多