【问题标题】:Scrape a website with interactive buttons使用交互式按钮抓取网站
【发布时间】:2016-03-29 17:44:39
【问题描述】:

我对抓取网站完全陌生。 我正在尝试从https://www.ssa.gov/oact/NOTES/as120/LifeTables_Tbl_7.html下载表格

我们使用网站的方式是从按钮中选择年份并按“Go”,然后显示所选年份的表格,我想保存表格。

我想应该有一种方法可以模拟人类选择年份,例如自动选择1900然后按“go”,然后循环100次以记录1900-2000的表格。但我不知道如何模拟这种人类行为。

我知道如何下载表格,但我不知道如何让表格展示。

谢谢!

【问题讨论】:

  • 查看Selenium,它是为这种事情设计的。

标签: python pandas web-scraping


【解决方案1】:

https://www.ssa.gov/oact/NOTES/as120/LifeTables_Tbl_7_**1950**.html

https://www.ssa.gov/oact/NOTES/as120/LifeTables_Tbl_7_**2030**.html

就像你看到的,唯一改变的是年份。所以当你去抓取一个网站时。你需要刮https://www.ssa.gov/oact/NOTES/as120/LifeTables_Tbl_7_" + TheYearIWant + ".html

【讨论】:

  • 对我有很大帮助。谢谢!!
  • 接受。我们的 stackoverflow 新手,我不知道是询问者决定“接受”。哎呀!
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2022-08-14
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多