【问题标题】:How to print raw html string using urllib3?如何使用 urllib3 打印原始 html 字符串?
【发布时间】:2013-06-23 05:16:02
【问题描述】:

我使用下面的语句来获取 html 字符串:

import urllib3

url ='http://urllib3.readthedocs.org/'
http_pool = urllib3.connection_from_url(url)
r = http_pool.urlopen('GET',url)

print (r.data)

但输出是:

b'<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "b'\n<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"\n  "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">\n\n\n<html xmlns="http://www.w3.org/1999/xhtml">\n  <head>\n    <meta http-equiv="Content-Type" content="text/html; charset=utf-8" />\n    \n\n   .......................................\n</script>\n\n\n\n  </body>\n</html>''

如何获取原始 html 字符串?

【问题讨论】:

  • sys.stdout.buffer.raw.write(r.data)

标签: python urllib3


【解决方案1】:

答案是print (r.data.decode('utf-8'))
但是这个声明会在崇高的文本 2 中中断。
因为this issue.
当我使用 IDLE 时,输出会很好。

【讨论】:

猜你喜欢
  • 2021-01-11
  • 1970-01-01
  • 2021-12-23
  • 1970-01-01
  • 2016-03-12
  • 1970-01-01
  • 1970-01-01
  • 2014-02-09
相关资源
最近更新 更多