【问题标题】:Firefox or similar application for tab browsing UTF-16Firefox 或类似的标签浏览应用程序 UTF-16
【发布时间】:2016-10-25 13:20:35
【问题描述】:

我正在使用一组 UTF-16 编码的 xml 文件。 示例文件在这里 http://tipitaka.org/sinh/cscd/

我想做的是从所有这些文件中搜索一个关键字,然后用给定的关键字打开所有文件。

我使用的脚本是这个。

#!/bin/sh
grep $1 *.xml | sed 's/ *:.*//' | uniq > list.dat

while read line; do
    gedit "$line"
done < list.dat

到目前为止我都用过;

  1. Firefox - 可以正常显示文件(firefox -new-tab 选项),但无法在选项卡中正确打开。关闭当前标签后,只会弹出第二个标签
  2. chrome - 按预期弹出标签但不显示 XML 文件
  3. gedit- 弹出并显示选项卡中的内容,但不将文本格式化为浏览器。

是否有任何应用程序或修复程序以选项卡形式打开所有格式的 xml 文件列表?

其次,一旦打开选项卡,是否有办法突出显示此搜索文本。

非常感谢。

【问题讨论】:

  • 之后你想用它做什么?就个人而言,我可能会使用像grepxmllint 这样的命令行工具...
  • 嗨,我要做的是在任何应用程序的标签中打开所有包含搜索词的文档以供阅读。突出显示是一个优点。

标签: xml utf-16


【解决方案1】:

这可能会显示您需要的一两种技术。

import requests
import webbrowser

URLtemplate = 'http://tipitaka.org/sinh/cscd/abh02m.mul%s.xml'

unencodedWord = 'වත්‌ථු'
word = bytearray(unencodedWord.encode('utf-16be'))

for k in range(0,18):
    URL = URLtemplate % k
    r = requests.get(URL)
    print ( r. apparent_encoding, end = '' )
    if r. apparent_encoding != 'UTF-16BE':
        print ( "can't process" )
        continue
    else:
        print ()
    if r.content.find(word) > -1:
        webbrowser.open(URL)
        input ('tap enter when ready for next page (if any):')

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2012-02-16
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2012-02-07
    相关资源
    最近更新 更多