【问题标题】:String HTML with TAG to DOCX带标签的字符串 HTML 到 DOCX
【发布时间】:2019-11-18 00:10:20
【问题描述】:

是否可以读取诸如<i><b>HelloWorld</b></i> 之类的html 字符串并在字HelloWorld 上打印一个实际上是斜体和粗体的字符串? 让我更好地解释一下,我必须相信来自 html 页面的 docx 文件,并且我使用的是 textarea 编辑器,它返回用 html 标签格式化的字符串,我应该找到将它们转换为文字可读格式的方法。 现在我正在使用 python docx 库

【问题讨论】:

    标签: python html docx


    【解决方案1】:

    我不熟悉 python docx 库,但粗体和斜体是“运行”(<w:r>) 属性。它们可能是最容易更改的,因为它们是内联定义的。在您的 xml 文件中,您将需要类似

    <w:r w:rsidRPr="000E1B98">
        <w:rPr>
            <w:b/>
            <w:i/>
        </w:rPr>
        <w:t>
            HelloWorld
        </w:t>
    </w:r>
    

    您可以在该运行元素中看到粗体 &lt;w:b/&gt; 和斜体 &lt;w:i/&gt;

    那里应该有一个转换器。除非您正在做一些非常不寻常的事情,否则无需从头开始。

    【讨论】:

    • 我不会说这很不寻常,我有一个 textarea 编辑器,它给了我用 html 标签格式化的字符串,相反我必须转换它,以便它可以被单词粗体和斜体读取,我是示例希望避免翻译所有我认为已经准备好一些库可以使用的案例
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2012-01-20
    • 2011-08-25
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多