【发布时间】:2020-12-21 15:58:39
【问题描述】:
我想找到印度所有的冷藏库及其容量。信息可在https://www.napanta.com/cold-storage/
每个州都有自己的 URL(例如:https://www.napanta.com/cold-storage/andhra-pradesh/)...转到每个州的 URL,我们看到它有很多区,每个区都有自己的 URL (https://www.napanta.com/cold-storage/andhra-pradesh/krishna) 用于克里希纳区美联社
我的目标是创建一个单一的 CSV 文件,其中包含来自每个州的所有地区的这些信息。此 One Big CSV 文件中的其他列将是州和地区名称。
在我们有了这个州区数据框后,我想将它附加到所有州和区的更大数据框。最后将这个大型主数据框导出到单个 CSV 文件中。最终的结果应该是一个单独的 CSV 文件,其中包含每个州每个地区的所有数据。
我用 Beautiful Soup 尝试了 scraping 部分,但现在我卡住了。请帮我写代码。
【问题讨论】:
标签: python pandas csv beautifulsoup