【问题标题】:Manipulate website dropdown menu in Python在 Python 中操作网站下拉菜单
【发布时间】:2011-02-20 03:20:57
【问题描述】:

我一直在网上搜索以下问题的答案,我没有成功可能与我在网络编程/html 方面缺乏经验有关。如果是这样并且有一个明显的答案,很抱歉打扰大家。我一直在尝试解析网站上的一堆文本,我发现了 python 脚本 html2text.py,它很好地以我可以解析的方式呈现网站。但是,为了获取所有信息,我需要访问网站上的下拉菜单。下拉菜单控制显示哪一年的数据,我想获取所有可用的年份。我已经看到使用 urllib2 我可以访问一个网站,看起来我也可以通过这种方式将信息发送到一个网站,但我无法准确地弄清楚如何操作下拉菜单。我感兴趣的网站是http://www.nfldata.com/nfl-stats/team-stats.aspx,如果这有帮助的话。提前感谢您提供的任何建议。

-马特

【问题讨论】:

  • 感谢您的建议。我学到了很多关于 xml/html 的知识。我找到了影响显示年份的选择小部件,但我仍然不太清楚如何自动请求网站在 python 中更改该选项。我想要的统计信息是在这些选项更改时动态生成的。看起来如果我单独保存每个网页(即年份),然后我可以从这些 html 文件中提取我想要的信息。

标签: python html


【解决方案1】:

查看 python 中的 xml 库。您可以获取原始 html 文本并将其解析为文档对象模型 (DOM) 接口:

http://docs.python.org/library/xml.dom.minidom.html

【讨论】:

    【解决方案2】:

    您看到的不是下拉菜单,而是选择小部件。

    您应该能够解析它,并找到所有 <option value="X">name<option> 条目。 X 就是你所需要的。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2017-05-10
      • 1970-01-01
      • 2019-07-28
      相关资源
      最近更新 更多