【问题标题】:Exporting several scraped tables into a single CSV File将多个抓取的表导出到单个 CSV 文件中
【发布时间】:2025-12-25 05:10:06
【问题描述】:

如何连接从多个 HTML 中读取的表格?我知道它们被认为是列表,并且列表不能连接,但是我怎样才能将多个从不同 URL 抓取的表格插入到一个 CSV 中?有任何想法吗?是否可以将打印输出保存在变量中,然后将其移动到 CSV 中?

import pandas as pd

df = pd.read_html('URL')
df1 = pd.read_html('URL')

print(df, df1)

(**df,df1**).to_csv('name.csv')

属性(df,df1)当然是不对的,只是为了描述我所缺少的而写的。

非常感谢您

【问题讨论】:

  • 记住read_html即使网页上只有一个表格也会返回一个数据框列表。

标签: python pandas web-scraping export-to-csv scrape


【解决方案1】:

pd.read_html 返回数据帧列表。因此,如果您确定列表包含以可以连接的方式格式化的数据框,您可以将其合并为单个数据框,然后将其导出到 csv:

import pandas as pd

dframes_list1 = pd.read_html('URL1')
dframes_list2 = pd.read_html('URL2')
dframes_all = dframes_list1 + dframes_list2
consolidated_dframe = pd.concat(dframes_all)
consolidated_dframe.to_csv('name.csv')

【讨论】:

  • 这很有帮助。谢谢!