【问题标题】:Fill and submit html form填写并提交html表单
【发布时间】:2012-10-06 03:29:49
【问题描述】:

我正在尝试/想要编写一个 Python 脚本 (2.7),该脚本会转到网站上的一个表单(名称为 "form1"),并用单词 hello 填写所述表单的第一个输入字段,第二个输入字段带有单词Ronald,第三个字段带有ronaldG54@gmail.com

任何人都可以帮我编写代码或给我有关如何执行此操作的任何提示或指示吗?

【问题讨论】:

    标签: python python-2.7


    【解决方案1】:

    除了 David 提到的 Mechanize 和 Selenium 之外,还可以通过 RequestsBeautifulSoup 来实现。

    为了更清楚,使用Requests向服务器发送请求并从服务器检索响应,并使用BeautifulSoup解析响应html以了解要向服务器发送哪些参数。

    这是我编写的示例脚本,它使用RequestsBeautifulSoup 提交用户名和密码以登录维基百科:

    import requests
    from bs4 import BeautifulSoup as bs
    
    
    def get_login_token(raw_resp):
        soup = bs(raw_resp.text, 'lxml')
        token = [n['value'] for n in soup.find_all('input')
                 if n['name'] == 'wpLoginToken']
        return token[0]
    
    payload = {
        'wpName': 'my_username',
        'wpPassword': 'my_password',
        'wpLoginAttempt': 'Log in',
        #'wpLoginToken': '',
        }
    
    with requests.session() as s:
        resp = s.get('http://en.wikipedia.org/w/index.php?title=Special:UserLogin')
        payload['wpLoginToken'] = get_login_token(resp)
    
        response_post = s.post('http://en.wikipedia.org/w/index.php?title=Special:UserLogin&action=submitlogin&type=login',
                               data=payload)
        response = s.get('http://en.wikipedia.org/wiki/Special:Watchlist')
    

    更新:

    对于您的具体情况,这里是工作代码:

    import requests
    from bs4 import BeautifulSoup as bs
    
    
    def get_session_id(raw_resp):
        soup = bs(raw_resp.text, 'lxml')
        token = soup.find_all('input', {'name':'survey_session_id'})[0]['value']
        return token
    
    payload = {
        'f213054909': 'o213118718',  # 21st checkbox
        'f213054910': 'Ronald',  # first input-field
        'f213054911': 'ronaldG54@gmail.com',
        }
    
    url = r'https://app.e2ma.net/app2/survey/39047/213008231/f2e46b57c8/?v=a'
    
    with requests.session() as s:
        resp = s.get(url)
        payload['survey_session_id'] = get_session_id(resp)
        response_post = s.post(url, data=payload)
        print response_post.text
    

    【讨论】:

    • 啊,好吧。我可以看到这是如何工作的,但我仍然对如何做一些事情感到困惑。
    • 你介意告诉我如何实现以下填写表格的实例,这样我就可以学习如何填写我想要的表格吗?表格位于app.e2ma.net/app2/survey/39047/213008231/f2e46b57c8/?v=a
    • 我正在尝试使用“survey_form”的 id 填写表单。然后我想勾选第 21 个复选框,它的 id 为“option_213118718”。其次,我想填充第一个输入字段,ID 为“field_213054910_input”,名称为“f213054910”,文本为“Ronald”。
    • 以及下一个输入字段,其 id 为“field_213054911_input”,名称为“f213054911”。我想用文本“ronaldG54@gmail.com”填写,然后提交表格。在解决这个问题时,我真的很感激任何和所有的帮助。
    • @IrfanM 我已经更新了工作代码。请记住,MechanizeSelenium 仍然值得学习。
    【解决方案2】:

    看看MechanizeSelenium。两者都是出色的软件,可让您自动填写和提交表单以及其他浏览器任务。

    【讨论】:

    • 我以前听说过 Mechanize,但我对如何做我想要完成的事情感到困惑。更具体地说,实际上是用这些行填写表格。你有什么办法可以给我一些基本的代码来开始吗?
    • Mechanize 带有大量示例脚本。有一个完整的 section devoted to forms 应该可以帮助您入门。
    猜你喜欢
    • 2011-05-16
    • 1970-01-01
    • 1970-01-01
    • 2018-05-22
    • 1970-01-01
    • 1970-01-01
    • 2012-06-19
    • 1970-01-01
    • 2014-08-09
    相关资源
    最近更新 更多