【问题标题】:find contact us pages using google importxml xpath使用 google importxml xpath 查找联系我们页面
【发布时间】:2015-03-05 16:48:17
【问题描述】:

我正在尝试从 B 列中的 url 列表中提取联系页面的链接。我尝试了以下操作,但出现错误:

=IMPORTXML(B10,"//a[contains('contact')]/@href")

我希望能够为每个具有包含单词“contact”的锚文本的 a 元素获取 href 值。

任何帮助将不胜感激。

【问题讨论】:

  • 您能好心一点并显示单元格B10 的内容吗(或者,显示其中一个URL)?并显示错误消息。

标签: html xpath google-sheets


【解决方案1】:

没有看到你导入的 URL,我只能评论 XPath 表达式。您的表达式无效,contains() 始终采用两个参数。使用

=IMPORTXML(B10,"//a[contains(.,'contact')]/@href")

如果这没有给出预期的结果,您必须告诉我们您正在导入的文档的 URL。

【讨论】:

  • 您能帮忙处理一下这个网址吗? clarksonuniversity.org/admissions/undergrad_admissions/costs/… 我正在尝试提取底部联系我们页面的完整网址。这个页面碰巧在 href 代码中使用了相对 url,这使事情变得更加复杂。
  • @RayA 通常,人们不会仅仅为了提出后续问题而拒绝接受答案。对于此特定页面,C 应为大写://a[contains(.,'Contact')]/@href。不,XPath 不能帮助您扩展相对链接,因为 URL 不在文档中的任何位置并且对 XPath 引擎不可见。您必须使用成熟的编程语言。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 2018-03-28
  • 2015-05-09
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2013-03-16
相关资源
最近更新 更多