【发布时间】:2011-02-20 03:20:57
【问题描述】:
我一直在网上搜索以下问题的答案,我没有成功可能与我在网络编程/html 方面缺乏经验有关。如果是这样并且有一个明显的答案,很抱歉打扰大家。我一直在尝试解析网站上的一堆文本,我发现了 python 脚本 html2text.py,它很好地以我可以解析的方式呈现网站。但是,为了获取所有信息,我需要访问网站上的下拉菜单。下拉菜单控制显示哪一年的数据,我想获取所有可用的年份。我已经看到使用 urllib2 我可以访问一个网站,看起来我也可以通过这种方式将信息发送到一个网站,但我无法准确地弄清楚如何操作下拉菜单。我感兴趣的网站是http://www.nfldata.com/nfl-stats/team-stats.aspx,如果这有帮助的话。提前感谢您提供的任何建议。
-马特
【问题讨论】:
-
感谢您的建议。我学到了很多关于 xml/html 的知识。我找到了影响显示年份的选择小部件,但我仍然不太清楚如何自动请求网站在 python 中更改该选项。我想要的统计信息是在这些选项更改时动态生成的。看起来如果我单独保存每个网页(即年份),然后我可以从这些 html 文件中提取我想要的信息。