【发布时间】:2015-10-26 05:20:04
【问题描述】:
如何从 Google Play 的日语概要中获取正确的编码?这是我目前所拥有的:
import requests
from lxml import html
res=requests.get('https://play.google.com/store/tv/show?id=bgJpf84fT4Q')
node=html.fromstring(res.content)
print node.xpath('//div[@itemprop="description"]')[0].text
æ¥æ¬ã®ã©ãã«åå¨ããå¶æªãªç¯ç½ªã¤çºãç¡æ³å°å¸¯ãéç§°ãæ··æ²è¡ï¼ã«ã¼ãªã¹ã¿ã¦ã³ï¼ããè¦å¯ããè¦æ¾ããã® è¡ã«ãç¯ç½ªèããæããããç¾èã®å¥³æ®ºãå±ã¡ãåå¨ãã...ãã®åããã¢ã·ãã¬ãï¼ã¢ãã«ã¬ã¼ã«ãºï¼ãããã£ãã¬ã¼ã»ã¢ã·ã㬠ãããã¯ã表åãã¯ç¾èã®è¸ãåãã¡ãéãéå ´ã ãè£ã®é¡ã¯æªã¸ã®å¾©è®ãæãèã¢ã·ãã¬ã«æ®ºãää¾é ¼ãå ´æãå¼·ãçµæåãããããã§ããªããã °ãä¾é ¼äººã«ææç§»å¥ãããããã§ããªããéãç©ã¾ããã°ã©ããªç¸æã§ããèªæ¢ã®ç¾èã§ã¯ã¼«ï¼ã»ã¯ã·ã¼ã«ãããã¦å¿ã»çããã®ã.. 。 /p>
如何在 text 属性上设置 utf-8 编码?
【问题讨论】:
-
如果您使用的是
requests,为什么不使用BeautifulSoup? -
@Kupiakos 我只是发现从 lxml 解析 xpath 更容易一些。这是我第一次遇到非拉丁字符的编码问题。