【发布时间】:2016-12-30 00:50:16
【问题描述】:
我目前正在研究一种将 wordml-xml(或者更确切地说是正文部分)转换为有效 xhtml/html 格式的方法。原因是我想在我的 WebForms-Application 中正确显示一堆中断、段落等。
在过去的几个小时里,我一直在寻找解决此问题的方法,我发现唯一与我的问题有点相似的是以下博客 (https://msdn.microsoft.com/en-us/library/ff628051(v=office.14).aspx#XHtml_Using)。问题是转换是基于 .docx 而不是 XML。我可以尝试将 XML 转换为 docx 并使用它,但这并不是处理它的有效方法。更不用说我必须先找到一种将 XML 转换为 docx 的方法。
我真的希望有人可以帮助我解决这个问题,因为我有点没有想法。
提前致谢,快点。
示例:XML 中的 w:body-Element 如下所示:
<w:body xmlns:w="http://schemas.microsoft.com/office/word/2003/wordml">
<wx:sect xmlns:wx="http://schemas.microsoft.com/office/word/2003/auxHint">
<w:p wsp:rsidR="00FF5F75" wsp:rsidRDefault="00626E80" xmlns:wsp="http://schemas.microsoft.com/office/word/2003/wordml/sp2">
<w:r wsp:rsidRPr="00EA67E2">
<w:rPr>
<w:rFonts w:fareast="Times New Roman" />
<w:sz w:val="26" />
<w:sz-cs w:val="26" />
<w:lang w:fareast="JA" />
</w:rPr>
<w:t>Leider können wir die Kosten für die Impfung gegen %</w:t>
</w:r>
<w:r wsp:rsidRPr="00EA67E2">
<w:rPr>
<w:rFonts w:fareast="Times New Roman" />
<w:sz w:val="26" />
<w:sz-cs w:val="26" />
<w:highlight w:val="yellow" />
<w:lang w:fareast="JA" />
</w:rPr>
<w:t>XY</w:t>
</w:r>
<w:r wsp:rsidRPr="00EA67E2">
<w:rPr>
<w:rFonts w:fareast="Times New Roman" />
<w:sz w:val="26" />
<w:sz-cs w:val="26" />
<w:lang w:fareast="JA" />
</w:rPr>
<w:t>% nicht übernehmen.</w:t>
</w:r>
<w:r wsp:rsidRPr="00EA67E2">
<w:rPr>
<w:rFonts w:fareast="Times New Roman" />
<w:sz w:val="26" />
<w:sz-cs w:val="26" />
<w:lang w:fareast="JA" />
</w:rPr>
<w:br />
</w:r>
<w:r wsp:rsidRPr="00EA67E2">
<w:rPr>
<w:rFonts w:fareast="Times New Roman" />
<w:sz w:val="26" />
<w:sz-cs w:val="26" />
<w:lang w:fareast="JA" />
</w:rPr>
<w:br />
<w:t>Die DAK-Gesundheit zahlt Ihnen die Impfungen, die in den Schutzimpfungs-Richtlinien des Gemeinsamen Bundesausschusses genannt sind. Die Impfung gegen %</w:t>
</w:r>
....
在常规的 word 文档中,这个东西是 Add-in word 的一部分,显示为中断等。我想要将这些元素转换为正确的 HTML/XHTML。
【问题讨论】:
-
你不能使用 MSOffice API(如果我没记错的话,通过互操作)对文件执行“导出为 HTML”吗?
-
我很确定它不会那样工作。您需要“docx”格式将其导出为 HTML,为此您需要安装 office,这在 Web 应用程序中并不是那么花哨。