【问题标题】:Web scraper in python to get the list of doctorspython中的网络爬虫获取医生列表
【发布时间】:2017-04-06 18:21:29
【问题描述】:

我对 python 还很陌生,我正在尝试编写一个网络爬虫来获取美国医生的名单。我发现许多网站的数据库都包含该列表,包括 AMA,但我无法将列表抓取到 CSV 文件中。

我正在尝试使用 Pandas 和 Beautiful soup 来完成这项工作。 请指出正确的方向。

import bs4 as bs
import urllib.request
import pandas as pd
import csv
import io

dataFrames = pd.read_html('link of the website')



for df in dataFrames:
    print(df)
    with io.open('doctorlist.csv', 'w',encoding="utf-8") as database:
        df.to_csv(database, sep='\t',encoding="utf-8")

    

【问题讨论】:

标签: python pandas web-scraping beautifulsoup


【解决方案1】:

首先,我建议你分享确切的 URL,但这对你没有帮助,所以在这里我给你的是你需要的,而不是你想要的。

您只是从 Python 开始,当一个孩子开始学习数学时,他不会从线性代数或三角学开始,而是从基础开始。 学习 Python 基础知识!同样,您使用的模块甚至连自己都不懂:

import pandas # This one is Python Data Analysis Library
import bs4 # Used for parsing data( through html/xml...)
from urllib import reqests #Used for making requests such as urlopen (open a URL to get the HTML)

给你你需要的东西:('给我指出正确的方向'):

Great AUTOMATEBORINGSTUFF, for basics quickly to advanced

Learn PYTHON - [学习基础、数据科学教程、高级教程]

只需简单的 Google/YouTube 搜索即可为您提供一个非常好的主意!

【讨论】:

  • 嘿,谢谢你的建议。但是,我确实知道 python 到中级水平。今年我学了一个学期的python。而且,我有点解决了这个问题。原来真正的问题是数据库的 URL。
  • 这太棒了,但你知道只是玩这些模块,你可能没有使用这些确切的模块。无论如何,玩得开心,尝试发布特定问题以便人们回答,如果您想问另一个问题并且人们会回答,您也可以编辑问题。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2015-05-12
  • 1970-01-01
  • 2014-10-29
  • 2015-03-05
  • 1970-01-01
相关资源
最近更新 更多