【发布时间】:2018-10-21 03:37:16
【问题描述】:
我刚刚开始学习如何使用 LXML 和请求进行网络抓取。我想编写一个应用程序,它可以告诉我特定电影院正在放映什么电影。
这是我的代码:
import requests
from lxml import html
# Getting the Page
HTML = requests.get('https://www.eventcinemas.com.au/Sessions#cinemas=86')
doc = html.fromstring(HTML.content)
# Getting the Movie
path1 = doc.xpath('//div[@class="body-content"]')[0]
path2 = path1.xpath('.//div[@class="content"]')[0]
path3 = path2.xpath('.//div[@id="first-dates"]')[0]
path4 = path3.xpath('.//div[@class="split-content"]')[0]
path5 = path4.xpath('.//div[@id="session-list"]')[0]
我一直在尝试获取电影标题。 我感觉这与课程有关,但不确定:
<div class="movie-container list-view"...
我也试过这个,但它没有给我任何价值:
path6 = path5.xpath('.//div[@class="movie-container list-view"]')
print(path6)
但是,打印的输出什么都没有,据我了解,这意味着它找不到目录。
【问题讨论】:
标签: python python-3.x python-requests lxml python-3.7