【发布时间】:2018-07-01 04:46:12
【问题描述】:
我正在修改一个相当广泛的 VBA 网络爬虫,并寻找一些关于如何在没有指定实际 id 时通过 id 获取元素的建议。
<ul class="rtUL">
<li class="rtLI"><div class="rtMid">
<span class="rtSp"></span><span class="rtPlus"></span>
<a class="rtIn" href="/mhpviewer.aspx?FID=CSTAT">Claim Status</a>
</div></li><li class="rtLI"><div class="rtMid">
<span class="rtSp"></span><span class="rtPlus"></span>
<a class="rtIn" href="/mhpviewer.aspx?FID=EVER">Eligibility Verification</a>
我需要获取的元素是包含“资格验证”的<li>。有没有办法获取子元素或只是内部 HTML?
【问题讨论】:
-
this thread 有帮助吗?或者this one?
-
我正在为数百个网页修改代码,并尝试学习获取这些元素的所有各种方法,因为创建变量可能更容易,即它们都需要相同类型的输入,而不是寻找特定的 id 或内部 HTML 文本,我试图找到一种方法来查看无序列表中的每个 li,这样我就可以最小化代码。这可能是不可能的,但有人可能会有一些提示。
标签: html excel vba web-scraping