【发布时间】:2020-04-13 03:12:55
【问题描述】:
我必须用希伯来语展示 pdf 书籍,但希伯来字母表有 2 种文本样式(带点和不带点)。
当书的文本样式带有点时 - 出现问题:当我选择文本时 - 它在一个单词中随机包含空格并且搜索也出现问题。
所以我想改变文本渲染功能并实现它。
HTML:
Enter input text here:<br/>
<textarea id="input" rows="10" cols="60"></textarea><br/><br/>
Enter output text here:<br/>
<textarea id="output" rows="10" cols="60"></textarea><br/><br/>
<button id="convert" onClick="doStrip()">
Strip Vowels
</button>
JS/JQuery
function stripVowels(rawString)
{
var newString = '';
for(j=0; j<rawString.length; j++) {
if(rawString.charCodeAt(j)<1425
|| rawString.charCodeAt(j)>1479)
{ newString = newString + rawString.charAt(j); }
}
return(newString);
}
/* @shimondoodkin suggested even a much shorter way to do this */
function stripVowels2(rawString) {
return rawString.replace(/[\u0591-\u05C7]/g,"")
}
function doStrip() {
var input = $('#input').val();
var output = stripVowels(input);
$('#output').val(output);
}
示例文本(从书中复制,似乎pdf js错误渲染空间):לּעַ,עִגוּוֵּן,רִבָּרָָ,מַבָּבָּהה,מַלְ שָ ג ִ י םׂמֻ ש
希望我什么时候能把带点的字符改成不带点的字符 在渲染功能中 - 它会解决这个问题
我也尝试更改 SPACE_FACTOR,但仍有问题
【问题讨论】:
-
pdfjs 究竟在哪里以及如何进入这个...?
-
@deceze 我正在使用 ng2 pdf 查看器 - Angular8 中 pdf js 的包装器
标签: javascript html text pdfjs