【问题标题】:Google Sheets ImportXML issuesGoogle 表格 ImportXML 问题
【发布时间】:2020-12-10 22:52:30
【问题描述】:

我有一个 google 表格,我正在尝试为我的 WoW Raid 小组尽可能地自动化。我在这里尝试做的是从 WoW 的军械库中解析一些数据以自动拉出一个人的物品级别。

我在直接从 WoW 网站 (https://worldofwarcraft.com/en-us/character/us/sargeras/Beansy) 拉取物品时遇到问题,但我可以从另一个网站 (https://raider.io/characters/us/sargeras/beansy) 拉取项目级别。我能发现的唯一区别是我可以从 [ /div/span/b clas"text-white" ] 和 WoW 中提取的一个站点的信息直接在 [ /div/class="media-text" ]

WOW Formula =IMPORTXML(C32,"//*[@id='character-profile-mount']/div/div/div[2]/div/div[1]/div[1]/div/div[2]/div[1]/a[1]/div/div[2]")
Raider IO Formula =IMPORTXML(C31,"//*[@id='content']/div/div/div/div[2]/div[1]/div[1]/section/div/div[1]/div/span/b")

WOW Inspect Element <div class="Media-text">184 ilvl</div>
Raider IO Inspect Element <b class="text-white">184</b>

以上是我使用的各个公式和元素。 Raider IO 正确拉取并输出 184 作为信息。然而,WoW 无法正确拉动并输出 N/A Google Sheets Output Screencap

有没有人知道为什么会发生这种情况?

提前致谢!

【问题讨论】:

    标签: google-sheets-formula


    【解决方案1】:

    我认为https://worldofwarcraft.com/en-us/character/us/sargeras/Beansy 使用 Javascript 准备值。例如,当从这个 URL 中检索到没有使用 Javascript 的 HTML 时,在检索到的 HTML 中找不到Media-text。另一方面,https://raider.io/characters/us/sargeras/beansy 在不使用 Javascript 的情况下具有 HTML 中的值。我认为差异是由于这个。

    但是为了从前者的 URL 中检索 184 的值,当我在没有使用 Javascript 的情况下查看 HTML 时,我注意到该值包含在元数据中。所以当从元数据中检索184的值时,示例公式如下。

    示例公式:

    =REGEXEXTRACT(IMPORTXML(A1,"//meta[@name='description']/@content"),"(\d+) ilvl")
    
    • 在这个公式中,https://worldofwarcraft.com/en-us/character/us/sargeras/Beansy 的 URL 被放到单元格“A1”中。

    结果:

    另外,作为额外的修改,关于你的=IMPORTXML(URL,"//*[@id='content']/div/div/div/div[2]/div[1]/div[1]/section/div/div[1]/div/span/b"),在这种情况下,xpath可能可以简单地修改如下。

    修改公式:

    =IMPORTXML(A1,"//span[contains(text(),'Item Level')]/b[@class='text-white']")
    
    • 在这个公式中,https://raider.io/characters/us/sargeras/beansy 的 URL 被放到单元格“A1”中。

    结果:

    参考资料:

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2014-04-24
      • 1970-01-01
      • 2012-10-17
      • 1970-01-01
      • 2019-06-03
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多