【发布时间】:2020-06-18 04:24:30
【问题描述】:
我想从网站工具提示中抓取文本。它的 HTML 代码作为属性 oldtitle 的值嵌入。我尝试了 css 和 xpath 选择器——例如//span[@class="spanTip underLine"]/@oldtitle -- 但没有成功。是不是因为属性值被分成了多行?有没有办法使用选择器来做到这一点?
<tr><td>
<span class="spanTip underLine" style="cursor:default;" data-hasqtip="true" oldtitle="<table class='qtipTable'>
<tbody>
<tr>
<td><span class='label'>A:</span>1</td>
<td><span class='label'>B:</span>2</td>
</tr>
<tr>
<td><span class='label'>C:</span>3</td>
<td><span class='label'>D:</span>4</td>
</tr>
<tr>
<td><span class='label'>E:</span></td>
</tr>
<tr>
<td><span class='label'>F:</span>5</td>
<td><span class='label'>G:</span>6</td>
</tr>
</tbody>
</table>" title="" aria-describedby="qtip-5">Item with Tooltip</span>
</td>
</tr>
【问题讨论】:
-
你用什么软件刮?
-
我正在使用scrapy。 :)
标签: xpath web-scraping css-selectors