【问题标题】:Google Sheets, my importxml formula suddenly broke谷歌表格,我的 importxml 公式突然坏了
【发布时间】:2019-11-02 15:45:43
【问题描述】:

一个小问题,因为几天来,我基于 importxml 的公式被破坏了,没有那个,我没有对我的网站进行任何更改。

我显然有一个问题,XPath 无法在我的文章正文中提取信息。

我可以提取标题的元素,但不能提取正文,甚至像我的 h1 这样非常简单的东西。

如果有人有曲目

我的公式(坏了):

= ImportXML ( "https://piao.fr/2019/10/une-nouvelle-offre-de-mobilite-reduite-avec-tao/","//h1 [1]")

【问题讨论】:

    标签: regex web-scraping google-sheets google-sheets-formula array-formulas


    【解决方案1】:

    尝试:

    =REGEXEXTRACT(QUERY(ARRAY_CONSTRAIN(IMPORTDATA(
     "https://piao.fr/2019/10/une-nouvelle-offre-de-mobilite-reduite-avec-tao/"), 500, 3), 
     "select Col3 where Col3 contains '<h1'"), "headline"">(.+)</h1")
    

    【讨论】:

    • 哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇哇谢谢。但我不明白为什么现在这么复杂。
    • 现在(使用 importdata)直接从源代码中废弃
    猜你喜欢
    • 2015-05-09
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2021-05-03
    • 1970-01-01
    相关资源
    最近更新 更多