【发布时间】:2019-10-15 04:18:16
【问题描述】:
我有一个 MediaWiki 网站,其中包含大约 1000 个附加文件,这些文件位于自动索引的 Web 目录中。我希望这些页面出现在 MediaWiki 索引中。我想出了两种方法:
- 编写一个 mediawiki 插件,为每个目录创建一个页面,每个项目都有一个项目符号列表,并带有一个下载对象的链接。
- 编写一个 python 程序,使用 mediaWiki API 为每个项目创建一个带有完整元数据的 mediawiki 页面。然后我可以提取文本并将提取的文本以及 MediaWiki 预格式化文本放在页面上。
但是,其中一些文档很长,因此我认为另一种方法是从 PDF 中提取文本并将其放入 MediaWiki 索引。对于多页 PDF,上传(自动?)PDF 第一页甚至所有页面的缩略图可能更有意义。
那么在 MediaWiki 网站上用全文引用 PDF 文件的适当方法是什么?
【问题讨论】:
标签: mediawiki mediawiki-extensions