【发布时间】:2015-04-03 01:00:56
【问题描述】:
我觉得从 html 表中提取数据非常困难,需要为每个站点自定义构建。我非常希望在这里被证明是错误的。。
是否有一种简单的 Pythonic 方法可以通过使用感兴趣表的 url 和 xpath 从网站中提取字符串和数字?
例子:
url_str = 'http://www.fdmbenzinpriser.dk/searchprices/5/'
xpath_str = //*[@id="sortabletable"]
我曾经有一个可以从该站点获取数据的脚本。却丢了。我记得我正在使用标签 '' 和一些字符串逻辑.. 不是很漂亮
我知道像thingspeak 这样的网站可以做这些事情..
【问题讨论】:
标签: python html python-2.7 parsing xpath