【问题标题】:Using =ImportHTML\XML on an Infinite Scrolling table在无限滚动表上使用 =ImportHTML\XML
【发布时间】:2018-03-02 17:00:33
【问题描述】:

我一直在使用 Google 表格来跟踪我的视频游戏收藏,但我已经到了从某个网站导入数据时开始出现问题的地步。我从 2 个站点链接,GameValueNow 和 VideoGamePriceCharting。

GVN 的网站运行良好,我的代码是

=QUERY(ImportHTML( "http://gamevaluenow.com/nintendo-nes" , "table" , 11 ), "SELECT Col3 where Col2="""&$B3&"""",0)

返回指定游戏的价格。我也想对 VGPC 做同样的事情并从 2 中获得平均价格,但是它的表格只显示前 50 个结果并且有无限滚动,直到发布最终结果。

我想知道是否有办法在运行 importHTML 或 importXML 之前使用脚本预加载网站,以便我能够查询所有结果,而不仅仅是前 50 个。

我要导入的网站是:

https://www.pricecharting.com/console/nes?sort=name

【问题讨论】:

    标签: javascript google-apps-script web-scraping google-sheets


    【解决方案1】:

    IMPORTHTML 和 IMPORTXML 能够访问作为它们的参数设置的 URL 所指出的文件的内容,因此,如果可以通过 Google Apps 脚本“预加载网站”,那将无济于事。

    【讨论】:

    • 感谢您的回复! importHTML/XML 命令不只是抓取页面源并返回它们找到的值吗?在初始登陆后查看源代码时,表格在 50 个条目后停止,但是如果我向下滚动源代码将开始添加行。那么这不会改变任一命令的结果吗?还是我弄错了,他们的工作方式完全不同?再次感谢!
    • @mckgn 我认为您将“源代码”称为浏览器开发人员工具的元素选项卡上显示的代码,但这不是由 JavaScript 动态修改的 DOM 的源代码.
    • @mckgn 也许Difference between source code and “inspect element” 将有助于澄清这一点。
    猜你喜欢
    • 1970-01-01
    • 2021-04-02
    • 2021-04-12
    • 2020-10-11
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2022-11-26
    • 2018-11-02
    相关资源
    最近更新 更多