【问题标题】:pdftron copy wrong textpdftron 复制错误的文本
【发布时间】:2021-05-29 12:19:00
【问题描述】:

我想使用pdftron,一切正常,但是当我从 pdf 复制文本时,一些字符会转换为空白正方形和问号,有什么想法吗?

here 是我的 pdf。

如下所示:

我写了这段代码:

WebViewer({
    path: '/assets/plugins/pdftron',
    initialDoc: '/practical.pdf',
    fullAPI: true,
    disableLogs: true
}, document.getElementById('pdf')).then((instance) => {
    // PDFNet is only available with full API enabled
    const { PDFNet, docViewer } = instance;

    let Feature = instance.Feature;
    instance.disableFeatures([Feature.NotesPanel]);

    docViewer.on('documentLoaded', () => {
        // call methods relating to the loaded document
    });


    instance.textPopup.add({
        type: 'actionButton',
        img: '/language.svg',
        onClick: () => {
            const quads = docViewer.getSelectedTextQuads(docViewer.getCurrentPage());
            const text = docViewer.getSelectedText();
            $("#out-pdf").html(text);
            console.log(quads);
        },
    });
});

【问题讨论】:

    标签: javascript laravel pdftron


    【解决方案1】:

    文档似乎确实导致提取不正确。 PDF 规范没有定义提取,因此每个查看器处理案例的方式都略有不同。在您的情况下,文档中可能包含格式错误或不完整的字体或 unicode 映射。我们为我们的核心组件添加了多个修复程序,并且这些修复程序可以正确提取。不幸的是,当前版本的 WebViewer 还没有包含这些修复。我们无法给出修复将在 WebViewer 上发布的确切时间表,但至少应该是我们下一个主要版本的一部分。现在我会尝试看看你是否可以重新创建文档,看看是否有帮助。我们看到和测试的大多数文档都没有提取问题。

    【讨论】:

      【解决方案2】:

      您能否通过我们的支持https://www.pdftron.com/form/request/ 创建票证并将发生这种情况的文档附在票证上,以便我仔细查看并更快地解决问题。

      【讨论】:

      • 请注意,我创建了票证。
      • 我没有收到任何答复
      • @AbolfazlMohajeri 我们无法找到您的机票。您应该已经收到来自 PDFTron 的电子邮件,确认我们收到了您的提交。该电子邮件将包含指向您的机票的链接。您可以在此处安全地发布该票号,以便我们查找。否则,我们可以通过将您的文件添加到上面的问题中来继续解决此问题。
      • @Ryan tnx 为您的回复,是的,我没有收到任何电子邮件表格 pdftron。我在我的问题中分享我的文件。
      • 谢谢@AbolfazlMohajeri。我会仔细查看文件。
      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2023-03-16
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2023-03-25
      相关资源
      最近更新 更多