【发布时间】:2019-09-27 18:56:00
【问题描述】:
我正在(试图)从一个包含大量
的 Intranet 页面中抓取信息<div id="CustID_1234567"[...]>
<div class="logged">2019-09-27</div>
</div>
<div id="CustID_2345678"[...]>
<div class="logged">2019-09-26</div>
</div>
我正在尝试将所有客户 ID 收集到一个数组中以进行进一步处理,但我很难找到使用 selenium 获取完整 ID 的正确代码。
我在循环代码时尝试了 FindElementsByXPath 的不同变体,但我不知道如何获取 ID 文本
Customers(a)=bot.FindElementsByXPath("//*[contains(@id, 'CustID_')]").Item(a).ID
Customers(a)=bot.FindElementsByXPath("//*[contains(@id, 'CustID_')]").Item(a).text
第一个(.id)以错误结尾,但最后一个(.text)得到文本(duh),“2019-09-27”和“2019-09-26”,所以我想我是与真正的解决方案相去甚远。
有什么建议吗?
【问题讨论】:
-
你的 xpath 是正确的。它应该返回所有元素。如果您尝试获取填充 cust_id 那么您应该尝试获取 id 属性..类似这样的东西... Xpath("").item(a).getAttribute("id")
-
.attribute("id") 成功了 "bot.FindElementsByXPath("//*[contains(@id, 'CustID_')]").Item(a).attribute("id “)“ 谢谢。我可以请您将其作为答案,以便我将其标记为正确答案吗?
-
完成。乐于助人!!!
标签: excel vba selenium-webdriver web-scraping