【发布时间】:2021-05-24 22:18:50
【问题描述】:
我正在抓取网页(使用 Python 请求和 beautifulsoup),我需要浏览项目列表的所有页面,但我需要单击下一页,代码只返回我的第 50 行代码到现在
import pandas as pd
import requests
from bs4 import BeautifulSoup
url = 'http://sistemas.anatel.gov.br/se/public/view/b/licenciamento'
antenas = requests.get(url)
if antenas.status_code == 200:
print('Requisição bem sucedida!')
content = antenas.content
soup = BeautifulSoup(content, 'html.parser')
table = soup.find_all(name='table')
table_str = str(table)
df = pd.read_html(table_str)[0]
我的目标是自动从所有链接中抓取整个表格!
【问题讨论】:
-
“废弃”的意思是扔掉,丢弃。你应该使用'scrape'
标签: python beautifulsoup python-requests