【问题标题】:How to get the metadata from a Markdown file using python-markdown?如何使用 python-markdown 从 Markdown 文件中获取元数据?
【发布时间】:2021-05-31 22:22:54
【问题描述】:

我正在尝试使用python-markdown 从以下文件中提取元数据:

---
title: this is the title and it is compulsory
tags: this part is optional
something: this is not interesting, only 'title' and 'tags' is
---
some content

元数据的documentation 给出了两个示例:

markdown.markdown(some_text, extensions=['meta'])

>>> md = markdown.Markdown(extensions = ['meta'])
>>> html = md.convert(text)
>>> # Meta-data has been stripped from output
>>> print html
<p>This is the first paragraph of the document.</p>

>>> # View meta-data
>>> print md.Meta
{
'title' : ['My Document'],
'summary' : ['A brief description of my document.'],
'authors' : ['Waylan Limberg', 'John Doe'],
'date' : ['October 2, 2007'],
'blank-value' : [''],
'base_url' : ['http://example.com']
}

我无法从这些示例中了解如何实际获取元数据:

  • 第一个示例返回一个str,当然它没有Meta 属性
  • 第二个示例不加载text,除了html(不用于提取元数据)。

【问题讨论】:

    标签: python python-3.x markdown


    【解决方案1】:

    我找到了:md.convert() 就地工作(换句话说,修改了md)。

    代码

    data = pathlib.Path(note).read_text(encoding='utf-8')
    md = markdown.Markdown(extensions=['meta'])
    md.convert(data)
    print(md.Meta)
    

    将正确输出文件note中的元数据

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2019-10-13
      • 2019-12-14
      • 1970-01-01
      • 2023-04-01
      • 2012-06-13
      • 2015-08-24
      • 2021-07-04
      • 1970-01-01
      相关资源
      最近更新 更多