【发布时间】:2015-07-08 12:46:20
【问题描述】:
我需要在python3中打开这个文件:
我必须在这里阅读它,然后提取数据表。我已经搜索了几个小时,但似乎没有任何效果。我是抓取/解析的新手,这是我第一次研究 PDF 的文件处理。
感谢大家的帮助!
【问题讨论】:
-
你能找回原来的.html文件吗?您可以使用 BeautifulSoup 轻松解析。但是 pdf...pdf 充其量是痛苦的。
标签: python pdf python-3.x web-scraping pdf-parsing