【发布时间】:2018-05-13 14:04:20
【问题描述】:
我正试图弄清楚如何从https://www.fda.gov/Safety/Recalls/ 网站提取我想要的多个信息
import requests
from bs4 import BeautifulSoup
res = requests.get("https://www.fda.gov/Safety/Recalls/")
soup = BeautifulSoup(res.text, "lxml")
for item in soup.select("table td"):
if "Undeclared" in item.text:
brand = item.find_parents()[0].select("td")[1].text
reason = item.text
print(brand,reason)
如何从 html 中获取brand_link?
【问题讨论】:
-
我建议,在您说“召回”的地方,考虑您的意思是“召回行”还是“表格单元格”,并相应地进行编辑以澄清。尤其是最后一点,您说您的代码“提取所有具有 : 的召回”。那里也有漏字。 :-)
标签: python-3.x web-scraping beautifulsoup