【问题标题】:Twisted HTTPS Client扭曲的 HTTPS 客户端
【发布时间】:2016-11-22 20:01:02
【问题描述】:

我目前在使用 twisted python 库访问通过 https 托管的内容时遇到了一些问题。我是这个库的新手,我假设我遗漏了一些导致问题的概念,但可能不是基于示例。

这是我收集示例的页面的链接: https://twistedmatrix.com/documents/current/web/howto/client.html

HTTP over SSL 标题下

from twisted.python.log import err
from twisted.web.client import Agent
from twisted.internet import reactor
from twisted.internet.ssl import optionsForClientTLS

def display(response):
    print("Received response")
    print(response)

def main():
    contextFactory = optionsForClientTLS(u"https://example.com/")
    agent = Agent(reactor, contextFactory)
    d = agent.request("GET", "https://example.com/")
    d.addCallbacks(display, err)
    d.addCallback(lambda ignored: reactor.stop())
    reactor.run()

if __name__ == "__main__":
    main()

运行此代码时,它直接失败。我收到如下所示的错误:

Traceback (most recent call last):
  File "https.py", line 19, in <module>
    main()
  File "https.py", line 11, in main
    contextFactory = optionsForClientTLS(u"https://example.com/")
  File "/home/amaricich/.local/lib/python2.7/site-packages/twisted/internet/_sslverify.py", line 1336, in optionsForClientTLS
    return ClientTLSOptions(hostname, certificateOptions.getContext())
  File "/home/amaricich/.local/lib/python2.7/site-packages/twisted/internet/_sslverify.py", line 1198, in __init__
    self._hostnameBytes = _idnaBytes(hostname)
  File "/home/amaricich/.local/lib/python2.7/site-packages/twisted/internet/_sslverify.py", line 86, in _idnaBytes
    return idna.encode(text)
  File "/usr/local/lib/python2.7/dist-packages/idna/core.py", line 355, in encode
    result.append(alabel(label))
  File "/usr/local/lib/python2.7/dist-packages/idna/core.py", line 276, in alabel
    check_label(label)
  File "/usr/local/lib/python2.7/dist-packages/idna/core.py", line 253, in check_label
    raise InvalidCodepoint('Codepoint {0} at position {1} of {2} not allowed'.format(_unot(cp_value), pos+1, repr(label)))
idna.core.InvalidCodepoint: Codepoint U+003A at position 6 of u'https://example' not allowed

这个错误让我相信传递给 optionsForClientTLS 的参数不正确。它需要一个主机名而不是一个完整的 url,所以我将参数缩短为简单的 example.com。进行更改后,该功能成功完成。

不幸的是,在进行更改后,脚本现在在调用 agent.request 的行处失败。它提供的错误是这样的:

Traceback (most recent call last):
  File "https.py", line 19, in <module>
    main()
  File "https.py", line 13, in main
    d = agent.request("GET", "https://example.com/")
  File "/home/amaricich/.local/lib/python2.7/site-packages/twisted/web/client.py", line 1596, in request
    endpoint = self._getEndpoint(parsedURI)
  File "/home/amaricich/.local/lib/python2.7/site-packages/twisted/web/client.py", line 1580, in _getEndpoint
    return self._endpointFactory.endpointForURI(uri)
  File "/home/amaricich/.local/lib/python2.7/site-packages/twisted/web/client.py", line 1456, in endpointForURI
    uri.port)
  File "/home/amaricich/.local/lib/python2.7/site-packages/twisted/web/client.py", line 982, in creatorForNetloc
    context = self._webContextFactory.getContext(hostname, port)
AttributeError: 'ClientTLSOptions' object has no attribute 'getContext'

这个错误让我相信 optionsForClientTLS 生成的对象不是预期在创建时传递给代理的对象类型。试图调用一个不存在的函数。说了这么多,我有两个问题。

  1. 是否已弃用此示例?前面提出的 http 请求的例子都像一个魅力。是我做错了什么,还是示例不再有效?
  2. 我只是在寻找一种使用 HTTPS 从服务器检索数据的简单方法。如果以这种方式做事不是解决方案,是否有人熟悉如何使用 twisted 发出 HTTPS 请求?

【问题讨论】:

    标签: python https twisted


    【解决方案1】:

    是的,您绝对正确,文档上的示例是错误的。我注意到了错误while working w/ treq。尝试从 v14 开始关注 this example。话虽如此,您应该使用 treq 而不是直接尝试使用 Twisted。大部分繁重的工作都已为您完成。这是您的示例的简单转换:

    from __future__ import print_function
    import treq
    from twisted.internet import defer, task
    from twisted.python.log import err
    
    @defer.inlineCallbacks
    def display(response):
        content = yield treq.content(response)
        print('Content: {0}'.format(content))
    
    def main(reactor):
        d = treq.get('https://twistedmatrix.com')
        d.addCallback(display)
        d.addErrback(err)
        return d
    
    task.react(main)
    

    如您所见,treq 为您处理 SSL 问题。 display() 回调函数可用于提取 HTTP 响应的各种组件,例如标头、状态码、正文等。如果您只需要单个组件,例如响应正文,则可以像这样进一步简化:

    def main(reactor):
        d = treq.get('https://twistedmatrix.com')
        d.addCallback(treq.content)     # get response content when available
        d.addErrback(err)
        d.addCallback(print)
        return d
    
    task.react(main)
    

    【讨论】:

    • 你是圣人!非常感谢你的帮助。 Treq 效果很好,可以让我继续我的工作。你是一颗宝石,我很感激你和你所做的一切。
    • 很高兴能帮上忙 :D 很高兴听到人们在 DMV 领域使用 Python/Twisted。
    猜你喜欢
    • 2011-05-30
    • 2011-01-09
    • 1970-01-01
    • 2012-09-13
    • 2013-05-17
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2012-09-05
    相关资源
    最近更新 更多