【发布时间】:2021-11-15 16:26:32
【问题描述】:
我在一个网站上找到了这个button,我想得到它指向的link,但我找不到href标签,href标签在哪里?
<button aria-label=“..“><span>...</span></button>
编辑:
- This 是网站。
- 这是我要从中获取链接的按钮:
【问题讨论】:
标签: javascript html css web-scraping
我在一个网站上找到了这个button,我想得到它指向的link,但我找不到href标签,href标签在哪里?
<button aria-label=“..“><span>...</span></button>
编辑:
【问题讨论】:
标签: javascript html css web-scraping
如果在按钮 html 代码上没有可见的锚元素或 onclick 属性,则可能它有一个 JavaScript 侦听器被攻击,该侦听器正在触发点击时的重定向,例如:
document.getElementById("myButton").onclick = function () {
location.href = "www.yoursite.com";
};
如果您有权查看页面 JavaScript,您可能希望从那里抓取该信息。如果页面非常复杂,仅仅通过抓取可能很难知道触发器是在哪里创建的。但这是您通常无法自动化的事情。
如果按钮是表单元素的一部分,您可能能够看到表单操作并从那里抓取它,但表单提交事件仍有可能通过 JavaScript 路由。
对于给定的页面,我可以说结果页面具有以下格式:
https://resultados.gob.ar/elecciones/3/[NUMBER]/1/-1/-1/
如果您将数字替换为 1-24 之间的值,您将进入与您提供的链接的序号元素相对应的页面。 您可能希望从 24 个可能值中的每一个中提取数据,因为不期望链接会随着时间而改变。
将该值设置为零会给出初始页面。 不需要在 URL 后面写名称。 此外,给出了 403 响应,但您仍然会获得 html,并且看起来像是通过 JavaScript 加载的内容。
如果你想要原始数据,最好的办法是使用这个:
https://resultados.gob.ar/assets/mapas/[number].json
但是你仍然需要了解那些不重要的数据。
【讨论】: