【问题标题】:encoding ÆØÅ Danish language read and write it correct UTF8编码 ÆØÅ 丹麦语 读写正确 UTF8
【发布时间】:2018-04-05 12:57:25
【问题描述】:

我正在尝试编辑带有 ÆØÅ 字母的丹麦语文件。

但我做错了,我可以用正确的字母添加一行,但它看起来好像我没有正确阅读现有的行,因此我得到“2. P�skedag” insted “2. Påskedag” "

我的代码是


    using System;
using System.IO;
using System.Text;

class Test
{
    public static void Main()
    {

        string filePath = @"C:\Users\tib5ka\Desktop\FællesVagtplan-filer\sheet001.htm";

        string[] lines  = File.ReadAllLines(filePath, Encoding.UTF8);
        for (int i = 0; i < lines.Length; i++)
        {
           // lines[i] = lines[i].Replace("INFOBAR :", "<marquee>Det er froååkosttid.</marquee>");


        }

        File.WriteAllLines(filePath, lines, Encoding.UTF8);
    }
}

【问题讨论】:

  • 文件不是utf8编码的。将其从您的机器中删除,以免造成进一步的伤害。

标签: c# encoding utf-8


【解决方案1】:

经过数小时的搜索,我终于找到了解决方案,就像我在这里发布的问题一样。

是我在读取行中的编码错误。

应该是System.Text.Encoding.Default

using System;
using System.IO;
using System.Text;

class Test
{
    public static void Main()
    {

        string filePath = @"C:\Users\tib5ka\Desktop\FællesVagtplan-filer\sheet001.htm";

        string[] lines  = File.ReadAllLines(filePath, System.Text.Encoding.Default);
        for (int i = 0; i < lines.Length; i++)
        {
           lines[i] = lines[i].Replace("INFOBAR :", "<marquee>Det er froååkosttid.</marquee>");


        }

        File.WriteAllLines(filePath, lines, Encoding.UTF8);
    }
}

【讨论】:

  • 不完全。它必须匹配输入文件的任何编码。在您的情况下,这可行,但请注意,如果输入文件的编码与您系统的默认编码不同,那么您的问题中就会出现 mojibake 问题。
  • 除非您需要代码在运行它的系统上使用默认编码,否则最好识别文件的编码并使用它。更好的是,如果您正在阅读 HTML 文档,请使用 HTML 库。它可能会找到一个元字符集声明并使用它。而且,它肯定会帮助您解析 HTML。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2012-11-20
  • 1970-01-01
  • 1970-01-01
  • 2023-02-14
  • 1970-01-01
  • 2016-03-12
相关资源
最近更新 更多