【发布时间】:2012-06-22 14:11:19
【问题描述】:
我需要使用 Python、Atom 来显示 RSS 提要。来自 PHP,我可以通过 $entry->link 快速获取值,我发现 lxml 更精确、更快,尽管很复杂。经过数小时的探索,我得到了这个与 arstechnica-feed 的合作:
def GetRSSFeed(url):
out = []
feed = urllib.urlopen(url)
feed = etree.parse(feed)
feed = feed.getroot()
for element in feed.iterfind(".//item"):
meta = element.getchildren()
title = meta[0].text
link = meta[1].text
for subel in element.iterfind(".//description"):
desc = subel.text
entry = [title,link,desc]
out.append(entry)
return out
这可以更简单吗?如何直接访问标签? Feedparser 只需一行代码即可完成工作!为什么?
【问题讨论】:
-
那你为什么要使用 lxml 而不是 feedparser?
标签: python django lxml atom-feed feedparser