【发布时间】:2021-10-04 18:03:39
【问题描述】:
我需要抓取以下链接中的“通话日期”和“分发日期”单元格,并将数据导入谷歌表格。
https://www.quantumonline.com/search.cfm?tickersymbol=acp-a&sopt=symbol
但是,当我这样做时,我会获得特定单元格中的所有信息。我试图只获得单元格中的第一行,但我无法弄清楚如何做到这一点。我试过这个:
=IMPORTXML("https://www.quantumonline.com/search.cfm?tickersymbol="&B2&"&sopt=symbol","//tr[@bgcolor='FFEFB5']/../tr[2 ]/td[6]")
例如,当我使用它时,我在第六列中获得了分发日期,但不知道如何切断其下方的行,而只获得第一行的信息。其他列也是如此。
【问题讨论】:
-
这就是你可以使用的替代方式
=INDEX(IMPORTXML("https://www.quantumonline.com/search.cfm?tickersymbol="&B2&"&sopt=symbol","//tr[./th[.='Distribution Dates']]/following::tr/td[6]/font"),1)
标签: xml web-scraping google-sheets