【发布时间】:2017-04-24 03:09:54
【问题描述】:
我正在尝试获取 html 代码所在的电话号码
<span>
<a class="click-to-call-link text-gray-light trackMe" href="javascript:;" objid="1236535" compid="clickToCall_profile_directory_sponsored" phone="(617) 981-6551"">Click to Call
</a>
</span>
电话号码末尾有两个双引号。这使得使用 lxml 获取数据变得困难。
有没有办法获得这个属性。
当我使用 span 的 xpath 并打印结果时,它会显示 <Element span at 0x3750060>,但是当我将 anchoe 标签添加到 xpath 时,它会引发错误。
【问题讨论】:
-
所以,您有一个失败的 xpath.... 发布该 xpath 和错误消息!从该示例中,我可以成功执行 xpath
/span/a。
标签: python web-scraping scrapy lxml