【发布时间】:2019-12-24 15:45:50
【问题描述】:
我有一个 XBRL 文档,它应该是一个 XML 文档。
我正在尝试提取按名称空间分组的不同标签。虽然代码似乎适用于某些命名空间 (us-gaap),但它似乎不适用于其他命名空间 (xbrli)。但是,在 xml 文件中有很多 * *
类型的标签代码:
from bs4 import BeautifulSoup
with open('test.xml', 'r') as fp:
raw_text = fp.read()
soup = BeautifulSoup(raw_text, 'xml')
print( len(soup.find_all(lambda tag: tag.prefix == 'us-gaap')) ) # print 941
print( len(soup.find_all(lambda tag: tag.prefix == 'xbrli')) ) # print 0
您可以找到test.xml file here。
【问题讨论】:
-
我无法复制这个。我正在使用您的代码获取
941和1268等值。 -
请添加预期的结果输出
标签: python xml beautifulsoup namespaces xbrl