【发布时间】:2018-04-23 23:27:56
【问题描述】:
我对编程很陌生,似乎无法解决以下数据提取问题。
这是我的数据的样子(黄色 = 我要提取的内容):
提取标题、价格和时间可以正常工作:
# Title
advertTitle = firstAdvert.find_all(
"section", {"class": "aditem-main"})[0].find("h2").text.encode("utf-8").strip().replace("\n", "")
# Price
advertPrice = firstAdvert.find_all(
"section", {"class": "aditem-details"})[0].find("strong").text.encode("utf-8").strip().replace("\n", "")
# Time
advertTimeAdded = advertTitle = firstAdvert.find_all(
"section", {"class": "aditem-addon"})[0].text.encode("utf-8").strip().replace("\n", "")
但我的主要问题是:如何从中提取“79924470”:
<article class="aditem" data-adid="79924470">
我已经尝试过例如:
item.find_all("article", "data-adid"}
感谢您为我指明正确的方向!
【问题讨论】:
-
请不要在图片中发布代码。有些可能无法打开,从而使他们无法提供帮助。 -1
标签: python beautifulsoup web-crawler