【发布时间】:2018-07-09 13:44:21
【问题描述】:
我需要在我的 html 代码中找到所有元素为 <td alert="0" op="0" class=" es_numero cell_imps24ad"><span>1.204</span></td>。我不能发送所有的 html 代码,因为它是机密信息。
我正在尝试使用此代码:
# encoding=utf8
# -*- coding: utf-8 -*-
import random
import requests
from requests.auth import HTTPBasicAuth
import sys
import csv
from bs4 import BeautifulSoup
reload(sys)
sys.setdefaultencoding('utf-8')
lista = []
number = str(random.random())
user = ''
passwd = ''
url = ''
login = requests.get(url, auth=HTTPBasicAuth(user, passwd))
url_sitios = ''
sitios = requests.get(url_sitios, auth=HTTPBasicAuth(user, passwd))
sitios2 = sitios.text
html = sitios2
soup = BeautifulSoup(html)
for item in soup.find_all("td", {"class": " es_numero cell_imps24ad"}):
print item.text, item.next_sibling
我想要的输出是这样的:
es_numero cell_imps24ad : 1.204
【问题讨论】:
-
soup.find_all("td", {"class": " es_numero cell_imps24ad"})在这种情况下应该是正确的。你收到什么输出而不是es_numero cell_imps24ad : 1.204? -
我做的时候什么也没收到!所以,我不明白为什么我不能提取它。 @Ajax1234
标签: python html beautifulsoup