【问题标题】:Import csv from web从网络导入 csv
【发布时间】:2015-12-11 07:13:47
【问题描述】:

在以下网址中

 http://www.indiavotes.com/ac/details/1/32051/216

有“导出到 CSV”的链接,但我在 pagesource() 中既找不到表格信息,也找不到 download.csv 链接。

如何使用 R 下载此 csv?

【问题讨论】:

  • Selenium + HTML table 抓取或拦截它发出的 POST 请求的 http 请求参数。他们费了很多的麻烦,很难以自动方式从该站点获取数据。
  • 好吧..有什么办法我能想到或者我可以试试
  • 很抱歉,如果这不能提供更多帮助。我用 R 尝试了很多东西;我没有取得太大进展。我绝对不是 R 专家。可能有一种方法可以使用 R 来做到这一点,但我无法弄清楚。我有一个 VBA 解决方案给你,如果可以的话。运行下面的脚本,您将获得数据转储。然后,解析数据并将其保存为 CSV 文件。那应该很容易。如果您需要更多帮助,请回复。

标签: html r url web export


【解决方案1】:
Sub DumpData()

Set IE = CreateObject("InternetExplorer.Application")
IE.Visible = True

URL = "http://www.indiavotes.com/ac/details/1/32051/216"

'Wait for site to fully load
IE.Navigate2 URL
Do While IE.Busy = True
   DoEvents
Loop

RowCount = 1

With Sheets("Sheet1")
   .Cells.ClearContents
   RowCount = 1
   For Each itm In IE.document.all
      .Range("A" & RowCount) = itm.tagname
      .Range("B" & RowCount) = itm.ID
      .Range("C" & RowCount) = itm.classname
      .Range("D" & RowCount) = Left(itm.innertext, 1024)

      RowCount = RowCount + 1
   Next itm
End With
End Sub

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2018-12-02
    • 2022-08-09
    • 2023-04-04
    • 1970-01-01
    • 2020-09-18
    • 2015-02-08
    相关资源
    最近更新 更多