【发布时间】:2015-07-03 15:00:04
【问题描述】:
所以我想从这个 url 中抓取“购买价格”整数: https://rsbuddy.com/exchange?id=5502
但是当我查看源代码时,我无法达到这些价格。 BeautifulSoup 刮刀也没有。这是 BeautifulSoup 的输出:
<div class="col-md-7" id="buy-price">
---
</div>
但是当我使用 chrome '检查元素'时,我实际上 am 能够看到这个价格:
<div id="buy-price" class="col-md-7">29,990 gp</div>
为什么这部分代码是“隐藏的”?仅仅是因为他们不希望人们从他们的网站上抓取信息吗? 有没有办法解决这个问题?
提前致谢
编辑: 我通过使用 chrome 工具跟踪 javascript 流量找到了答案。 显然,即使 api.rsbuddy.com 没有给你任何东西,它确实使用了 api: https://api.rsbuddy.com/grandExchange?a=guidePrice&i=5502
【问题讨论】:
标签: python html screen-scraping hidden