获取用于抓取视频 url 的 xpath答案

【问题标题】：getting the xpath for crawling a video url获取用于抓取视频 url 的 xpath
【发布时间】：2019-10-31 21:52:02
【问题描述】：

我想从webpage 获取视频 url 的 xpath，以便我可以使用 python 下载它的视频。

我所做的是按 F12 并找到视频部分，然后在视频类下，右键单击源并复制 xpath。但我找不到视频网址的 xpath。我得到的xpath如下：

//*[@id="react-project-header"]/div/div/div[1]/div[1]/div[1]/div/video/source[1]

【问题讨论】：

标签： html python-3.x xml xpath web-crawler

【解决方案1】：

尝试使用此 xpath 表达式提取 url

//*[@id="react-project-header"]/div/div/div[1]/div[1]/div[1]/div/video/source[2]/@src

编辑：如何到达那里

最初，我以与您相同的方式获得路径 - 通过“开发人员”选项卡。我将结尾部分从source[1] 更改为source[2]，因为那是视频的高清版本所在的位置，为什么不呢？更重要的是，您的实际目标（视频的 url）是 - 使用正式的 xpath 术语 - 节点属性的属性值。在本例中，节点为source[2]，属性为src，值为所需的url。要选择节点属性的属性值，必须使用@ 运算符，如

node/@attribute

或者，在这种情况下

[xpath to]source[2]/@src

【讨论】：

谢谢！请指导我如何获得此 xpath？
我还有一个问题。因此，我按照您的指示进行了操作，它有效，但不适用于我想要获取的另一个网址。从这个网站（kickstarter.com/projects/peak-design/…）我想得到这个网址（youtube.com/embed/…），我得到的 xpath 是：//*[@id="player"]/@src
@MaryamRahmaniMoghaddam - 根据 SO 政策，您应该将其作为单独的问题发布。我很乐意看看。
这是问题的链接。谢谢你！ stackoverflow.com/questions/59256717/…