【发布时间】:2021-06-28 17:04:55
【问题描述】:
我正在创建一个使用 selenium 从网站提取数据的程序。在这种情况下,我试图了解课程的长度。我在网页上有以下代码
<li class="">
<a href="/academy/lesson/intro-to-personality.html" data-virtual="3">
<span class="lesson__title">Intro to Personality</span></a>
<span class="lessonTime">4:16</span>
</li>
<li class="">
<a href="/academy/lesson/intro-to-real-estate.html" data-virtual="3">
<span class="lesson__title">Intro to Real Estate</span></a>
<span class="lessonTime">6:16</span>
</li>
<li class="is-viewing" test-id="course_nav_current_lesson">
<a href="/academy/lesson/freudian-defense-mechanisms.html" data-virtual="3">
Freudian Defense Mechanisms: Definition, Levels & Examples</a>
<span class="lessonTime">7:29</span>
<span class="icon-eye"></span>
</li>
该网页包含大约 8-15 个其他课程长度的列表,但我只对分配给用户的课程感兴趣。因为每次 xpath 都是动态的时它不会访问同一个网页。唯一一致的两件事是,分配给用户的课程始终位于底部,以及它有一个名为is-viewing 的特殊类。我尝试使用此代码提取数据:
lessonlength = driver.find_element_by_class_name('lessonTime').get_attribute('innerHTML')
print(f'Lesson is {lessonlength} long')
这将返回4:16,因为它是第一个与定义的类具有相同类的元素。有没有办法找到最后一堂课(因为它总是在最后)。
【问题讨论】:
标签: python html css python-3.x selenium