【问题标题】:Where to change in source code rendering Hebrew text with dots? PDF JS源代码在哪里更改以点呈现希伯来文本? PDF JS
【发布时间】:2020-04-13 03:12:55
【问题描述】:

我必须用希伯来语展示 pdf 书籍,但希伯来字母表有 2 种文本样式(带点和不带点)。

当书的文本样式带有点时 - 出现问题:当我选择文本时 - 它在一个单词中随机包含空格并且搜索也出现问题。

所以我想改变文本渲染功能并实现它。

HTML:

Enter input text here:<br/>
<textarea id="input" rows="10" cols="60"></textarea><br/><br/>

Enter output text here:<br/>
<textarea id="output" rows="10" cols="60"></textarea><br/><br/>

<button id="convert" onClick="doStrip()">
Strip Vowels
</button>

JS/JQuery

function stripVowels(rawString)
{
    var newString = '';
    for(j=0; j<rawString.length; j++) {
        if(rawString.charCodeAt(j)<1425
             || rawString.charCodeAt(j)>1479)
        { newString = newString + rawString.charAt(j); }
    }
    return(newString);
}

/* @shimondoodkin suggested even a much shorter way to do this */
function stripVowels2(rawString) {
  return rawString.replace(/[\u0591-\u05C7]/g,"")
}

function doStrip() {
   var input = $('#input').val();
   var output = stripVowels(input);
   $('#output').val(output);
}

link to Fiddle editor

示例文本(从书中复制,似乎pdf js错误渲染空间):לּעַ,עִגוּוֵּן,רִבָּרָָ,מַבָּבָּהה,מַלְ שָ ג ִ י םׂמֻ ש

希望我什么时候能把带点的字符改成不带点的字符 在渲染功能中 - 它会解决这个问题

我也尝试更改 SPACE_FACTOR,但仍有问题

【问题讨论】:

  • pdfjs 究竟在哪里以及如何进入这个...?
  • @deceze 我正在使用 ng2 pdf 查看器 - Angular8 中 pdf js 的包装器

标签: javascript html text pdfjs


【解决方案1】:

在文件 evaluator.js 中 在函数 buildTextContentItem 用变量“glyphUnicode”做你需要的事情

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2011-09-02
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2013-09-20
    • 1970-01-01
    • 2012-08-23
    相关资源
    最近更新 更多