【问题标题】:Cyrillic encoding in C#C# 中的西里尔文编码
【发布时间】:2012-08-17 21:53:32
【问题描述】:

我在 MSSQL 数据库中有一堆类似西里尔文的文本,需要在 C# 中将其转换为西里尔文。

所以... Ðàáîòà âåðìàíèè

应该变成

Работа в германии

有什么建议吗?

我应该补充一点,我得到的最接近的是 ?aaioa aaa?iaiee

这是我正在使用的代码:

 str = Encoding.UTF8.GetString(Encoding.GetEncoding("Windows-1251").GetBytes(drCurrent["myfield"].ToString()));
 str = Encoding.GetEncoding(1251).GetString(Encoding.Convert(Encoding.UTF8, Encoding.GetEncoding(1251), Encoding.UTF8.GetBytes(str)));

【问题讨论】:

  • 什么是数据库编码?我认为 DataSource 会为你做这个转换......
  • 也许这会有所帮助Universal Cyrillic decoder
  • 我会支持 Srdjan 的问题:您的数据是如何存储在数据库中的? MSSQL 有两种不同的字符串数据类型:charnchar,您使用哪一种?

标签: c# sql-server encoding


【解决方案1】:
// To find out source and target
const string source = "Ðàáîòà â ãåðìàíèè";
const string destination = "Работа в германии";

foreach (var sourceEncoding in Encoding.GetEncodings())
{

    var bytes = sourceEncoding.GetEncoding().GetBytes(source);
    foreach (var targetEncoding in Encoding.GetEncodings())
    {
        if (targetEncoding.GetEncoding().GetString(bytes) == destination)
        {
            Console.WriteLine("Source Encoding: {0} TargetEncoding: {1}",sourceEncoding.CodePage,targetEncoding.CodePage);
        }

    }
}

// Result1: Source Encoding: 1252 TargetEncoding: 1251
// Result2: Source Encoding: 28591 TargetEncoding: 1251
// Result3: Source Encoding: 28605 TargetEncoding: 1251

// The code for you to use 
var decodedCyrillic = Encoding.GetEncoding(1251).GetString(Encoding.GetEncoding(1252).GetBytes(source));
// Result: Работа в германии

【讨论】:

【解决方案2】:

ADO.Net 将 SQL Server 提供程序中的所有字符串类型公开为 C# 字符串,这意味着它们已经转换为 Unicode。对于像char(n)varchar(n) 这样的非unicode 源列(显然是你的),ADO.Net SQL Server 提供程序使用源collation 信息来确定编码。因此,如果您的非 unicode SQL Server 数据在 .Net 中以错误的编码表示,则它必须以错误的排序规则呈现给提供者。为您的数据选择适当的排序规则,SQL Server 的 ADO.Net 提供程序将使用适当的编码对其进行翻译。例如,如Collation and Code Page Architecture 中所述,西里尔排序规则将产生code page 1251,这很可能是您想要的。链接的文章包含解决问题所需的所有信息。

using System;
using System.Text;
using System.Data.SqlClient;
using System.Windows.Forms;

public class Hello1
{
   public static void Main()
   {
    try
    {
        using (SqlConnection conn = new SqlConnection("server=.;integrated security=true"))
        {
            conn.Open ();

            // The .cs file must be saved as Unicode, obviously...
            //
            string s = "Работа в германии"; 

            byte[] b = Encoding.GetEncoding(1251).GetBytes (s);

            // Create a test table
            //
            SqlCommand cmd = new SqlCommand (
                @"create table #t (
                    c1 varchar(100) collate Latin1_General_CI_AS, 
                    c2 varchar(100) collate Cyrillic_General_CI_AS)", 
                conn);
            cmd.ExecuteNonQuery ();

            // Insert the same value twice, the original Unicode string
            // encoded as CP1251
            //
            cmd = new SqlCommand (
                @"insert into #t (c1, c2) values (@b, @b)", conn);
            cmd.Parameters.AddWithValue("@b", b);
            cmd.ExecuteNonQuery ();

            // Read the value as Latin collation 
            //
            cmd = new SqlCommand (
                @"select c1 from #t", conn);
            string def = (string) cmd.ExecuteScalar ();

            // Read the same value as Cyrillic collation
            //
            cmd = new SqlCommand (
                @"select c2 from #t", conn);
            string cyr = (string) cmd.ExecuteScalar ();

            // Cannot use Console.Write since the console is not Unicode
            //
            MessageBox.Show(String.Format(
                @"Original: {0}  Default collation: {1} Cyrillic collation: {2}", 
                    s, def, cyr));
        }

    }
    catch(Exception e)
    {
        Console.WriteLine (e);
    }   
   }
}

结果是:

---------------------------

---------------------------
Original: Работа в германии  Default collation: Ðàáîòà â ãåðìàíèè Cyrillic collation: Работа в германии
---------------------------
OK   
---------------------------

【讨论】:

    猜你喜欢
    • 2013-10-29
    • 1970-01-01
    • 2016-02-06
    • 1970-01-01
    • 1970-01-01
    • 2011-07-29
    • 1970-01-01
    • 2015-07-28
    • 1970-01-01
    相关资源
    最近更新 更多