【发布时间】:2017-04-06 18:21:29
【问题描述】:
我对 python 还很陌生,我正在尝试编写一个网络爬虫来获取美国医生的名单。我发现许多网站的数据库都包含该列表,包括 AMA,但我无法将列表抓取到 CSV 文件中。
我正在尝试使用 Pandas 和 Beautiful soup 来完成这项工作。 请指出正确的方向。
import bs4 as bs
import urllib.request
import pandas as pd
import csv
import io
dataFrames = pd.read_html('link of the website')
for df in dataFrames:
print(df)
with io.open('doctorlist.csv', 'w',encoding="utf-8") as database:
df.to_csv(database, sep='\t',encoding="utf-8")
【问题讨论】:
-
可以分享一下“网站链接”吗?
标签: python pandas web-scraping beautifulsoup