【发布时间】:2014-10-26 21:43:24
【问题描述】:
我正在为 yahoo 天气 API (python 2.7) 使用 Beautiful Soup:
url = 'http://weather.yahooapis.com/forecastrss?w=2344116'
page=urllib2.urlopen(url).read()
soup = BeautifulSoup(page)
但在此之后,在解析的 url 中,没有任何 CDATA。为什么美丽的汤忽略了这一点?如何防止忽略 CDATA?
在xml中:
<img src="http://l.yimg.com/a/i/us/we/52/11.gif"/>
在解析的页面中:
如您所见,那里的 CDATA 丢失了。
【问题讨论】:
-
是什么让您认为它忽略了 CDATA 部分?该部分包含在 text. 中
-
我刚刚运行了你的代码,CDATA 就在那里。
-
请看我编辑的问题。
-
感谢您的澄清。在我忽略
yweather-part 之前。为什么不使用那个? BeautifulSoup 可以更容易地解析它。对于 CDATA,您将需要一些正则表达式魔法。
标签: python beautifulsoup