【发布时间】:2021-09-05 14:39:28
【问题描述】:
对 python 非常陌生,并且在这个循环中苦苦挣扎。我正在尝试从我已经拥有的列表格式的静态页面列表中提取 html 属性数据地址。我已经设法使用 BS4 从一页中提取数据,但我无法正确地循环遍历我的 URL 列表。现在我收到此错误(无效的 URL '0':未提供架构。也许您的意思是 http://0?)但我在单次拉取中检查了 URL,它们都可以工作。这是我的工作单拉代码:
import requests
from bs4 import BeautifulSoup
result = requests.get('https://www.coingecko.com/en/coins/0xcharts')
src = result.content
soup = BeautifulSoup(src, 'lxml')
contract_address = soup.find(
'i', attrs={'data-title': 'Click to copy'})
print(contract_address.attrs['data-address'])
这是我正在处理的循环:
import requests
from bs4 import BeautifulSoup
url_list = ['https://www.coingecko.com/en/coins/2goshi','https://www.coingecko.com/en/coins/0xcharts']
for link in range(len(url_list)):
result = requests.get(link)
src = result.content
soup = BeautifulSoup(src, 'lxml')
contract_address = soup.find(
'i', attrs={'data-title': 'Click to copy'})
print(contract_address.attrs['data-address'])
url_list.seek(0)
【问题讨论】:
标签: python python-3.x list web-scraping beautifulsoup