【发布时间】:2010-05-17 09:46:57
【问题描述】:
我正在尝试自动化下载过程。在此我想知道,特定文件的保存是否完成。场景是这样的。
- 使用 Chrome 或 Firefox(任何浏览器)打开网站地址
- 使用“Crtl + S”将页面保存到磁盘(我在 Windows 上工作)
- 现在如果页面很大,那么保存需要几秒钟。保存完成后,我想解析 html。
由于我无法控制浏览器的保存功能,我不知道保存是否已完成。
我想到的一个想法是,使用 while 循环获取文件的 md5sum,并检查计算的前一个,然后继续 while 循环,直到前一个和当前一个匹配的 md5 总和。我猜这不起作用,因为浏览器似乎首先尝试将文件保存在 tmp 文件中,然后将内容复制到指定的文件(或只是重命名文件)。
有什么想法吗?我使用 python 进行自动化,因此欢迎任何可以使用 python 实现的想法。
谢谢 英德拉吉特
【问题讨论】:
-
为什么不用python下载呢?它会让你完全控制