【发布时间】:2014-10-23 21:33:32
【问题描述】:
我们需要导入或复制和粘贴 word 文档并将它们转换为 HTML 就绪数据。
这是我的想法:
- 用
file_get_contents收集文字 - 应用函数
nl2br
但是,它不考虑粗体和其他文本格式。
此外,还有一些我们不需要的 microsoft 字符。
将单词导入漂亮的 HTML 有什么好的策略?
【问题讨论】:
-
在您的表单上使用 CKEditor 结帐。有一个 word 功能的粘贴。
-
我同意贾斯汀的观点。甚至不要开始尝试自己清理它。底线是 word 绝不是 html。希望它是“美丽的”完全取决于开发人员在他们的单词解析中占了多少个陷阱。 word2cleanhtml 是您最好的选择。有了文字,一旦你认为你已经掌握了一切,他们要么改变他们的废话,要么有人上传另一个文件,其中包含 10 亿个其他无法预见的独特字符。