python中的网络爬虫获取医生列表答案

【问题标题】：Web scraper in python to get the list of doctorspython中的网络爬虫获取医生列表
【发布时间】：2017-04-06 18:21:29
【问题描述】：

我对 python 还很陌生，我正在尝试编写一个网络爬虫来获取美国医生的名单。我发现许多网站的数据库都包含该列表，包括 AMA，但我无法将列表抓取到 CSV 文件中。

我正在尝试使用 Pandas 和 Beautiful soup 来完成这项工作。请指出正确的方向。

import bs4 as bs
import urllib.request
import pandas as pd
import csv
import io

dataFrames = pd.read_html('link of the website')



for df in dataFrames:
    print(df)
    with io.open('doctorlist.csv', 'w',encoding="utf-8") as database:
        df.to_csv(database, sep='\t',encoding="utf-8")

【问题讨论】：

可以分享一下“网站链接”吗？
apps.ama-assn.org/doctorfinder/home.jsp。这是网站..

标签： python pandas web-scraping beautifulsoup

【解决方案1】：

首先，我建议你分享确切的 URL，但这对你没有帮助，所以在这里我给你的是你需要的，而不是你想要的。

您只是从 Python 开始，当一个孩子开始学习数学时，他不会从线性代数或三角学开始，而是从基础开始。 学习 Python 基础知识！同样，您使用的模块甚至连自己都不懂：

import pandas # This one is Python Data Analysis Library
import bs4 # Used for parsing data( through html/xml...)
from urllib import reqests #Used for making requests such as urlopen (open a URL to get the HTML)

给你你需要的东西：（'给我指出正确的方向'）：

Great AUTOMATEBORINGSTUFF, for basics quickly to advanced

Learn PYTHON - [学习基础、数据科学教程、高级教程]

只需简单的 Google/YouTube 搜索即可为您提供一个非常好的主意！

【讨论】：

嘿，谢谢你的建议。但是，我确实知道 python 到中级水平。今年我学了一个学期的python。而且，我有点解决了这个问题。原来真正的问题是数据库的 URL。
这太棒了，但你知道只是玩这些模块，你可能没有使用这些确切的模块。无论如何，玩得开心，尝试发布特定问题以便人们回答，如果您想问另一个问题并且人们会回答，您也可以编辑问题。