【发布时间】:2022-01-01 16:42:28
【问题描述】:
HTML 代码:
<a target="_blank" class="truncate-text" id="rfq-display-attachment-0">
BEHR SDS.pdf
</a>
我正在下载这个链接:
link1 = driver.find_element_by_xpath("//a[@id='rfq-display-attachment-0']")
filename = link1.text
link1.click()
据此,文件名将是BEHR SDS.pdf,但是下载文件后,下载文件的文件名是BEHR SDS.1637344008787.pdf。这里文中的名字和实际的文件名是不同的。
在这种情况下如何获得准确的文件名?我不想要<a> 标签的文本?
【问题讨论】:
-
可以取文字,然后替换下载文件的名称
-
如何替换??重命名下载目录中的文件?
-
是的,这就是我能想到的。如果您对该解决方案感兴趣,请告诉我,我可以为您提供答案。
-
我不认为这是可能的,因为这段代码经过了很多循环,而且还有
try except块,如果没有找到这个链接,我已经设置为``空字符串。跨度> -
我认为修剪
.1637344008787部分就足够了,因为每个文件名都只有这种类型的部分。
标签: python python-3.x selenium selenium-webdriver web-scraping