【问题标题】:How do you remove html tags using Universal Feed Parser?如何使用 Universal Feed Parser 删除 html 标签?
【发布时间】:2010-10-23 08:53:18
【问题描述】:

文档列出了默认允许/删除的标签:

http://www.feedparser.org/docs/html-sanitization.html

但它没有说明如何指定要删除的附加标签。

有没有办法使用 Universal Feed Parser 来做到这一点,或者您是否必须使用自己的正则表达式和/或 Beautiful Soup 之类的东西进行进一步处理?

【问题讨论】:

    标签: python django feed parsing


    【解决方案1】:

    我快速浏览了代码,我认为没有办法直接覆盖它们。但是你可以覆盖feedparser._HTMLSanitizer.acceptable_elements,这是在执行feedparser.parse之前不会被删除的标签列表

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2013-09-05
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多