【发布时间】:2012-02-16 01:36:45
【问题描述】:
我不确定如何正确描述这些问题,但无论如何, 所以我想使用 mechanize 来获取表单并获取输入的名称。 但是,当我使用 mechanize 解析时,它不显示表单名称和输入名称。 如果我通过查看网站手动尝试,我必须检查元素以便我可以获得输入名称,但它仍然是动态的,所以每次我检查元素时,它都会给我不同的名称。任何想法? 顺便说一句,如果有人感兴趣,我要解析的网站是https://www.ursa.ucla.edu/logon/logon.asp。
这是我尝试过的:
br = mechanize.Browser(factory=mechanize.RobustFactory())
br.open("https://www.ursa.ucla.edu/logon/logon.asp/")
br.select_form(nr=0)
print br.response().read()
提前致谢, 理查德。
【问题讨论】:
-
尝试beautifulSoup,您可以尝试使用其xml/html树结构而不是标签名称来解析页面。
-
我也试过beautifulSoup,但也没有用。
标签: python forms parsing mechanize