【发布时间】:2015-02-26 06:58:15
【问题描述】:
我有一个 300 多页的 word 文档,其中包含数百个“章节”(由标题格式定义),目前按单词索引。每章包含中等数量的文本(通常少于一页),可能还有一个或两个相关的图形。我想将文档拆分为数据库记录,以便在 iPhone 程序中使用 - 每章都是由标题、id # 和内容字段组成的记录。我还没有决定是否希望图片成为单独的字段(可能只包含文件名),或者内容文本中的 HTML 或类似样式的链接。无论如何,最终结果将是我可以显示一个可搜索的标题表,用户可以单击该表来提取任何给定的条目。
我目前遇到的困难是从word文档到数据库。在保持图像关联的同时,如何最轻松地将文档按章节拆分为记录?我想在每章之间插入一些独特的字符,保存为文本格式,然后编写一个脚本来根据该字符将文档解析到数据库中,但我不确定我能否在这种情况下处理图形。其他选择?
【问题讨论】: