【问题标题】:C#/.Net -Fast way to Parse XML / XML -> JsonC#/.Net - 快速解析 XML / XML -> Json
【发布时间】:2025-12-03 05:15:01
【问题描述】:

我是 XML 新手,因为现在我只使用过 Json:( 我有一个如下所示的 XML 文件:

<AdapterCards>
    <cards type="MCS">
        <card>
            <id>id1</id>
            <description>desc1</description>
            <mccode>code1</mccode>
        </card>
        <card>
            <id>id2</id>
            <description>desc2</description>
            <mccode>code2</mccode>
        </card>
    </cards>
    <cards type="MCM">
        <card>
            <id>id3</id>
            <description>desc3</description>
            <mccode>code3</mccode>
        </card>
        <card>
            <id>id4</id>
            <description>desc4</description>
            <mccode>code4</mccode>
        </card>
    </cards>
    <cards type="F"/>
    <cards type="B"/>
</AdapterCards>

我想把它解析成一个 json 字符串,看起来应该是这样的:

{[{'type': 'mcs', 'id': 'id1', 'description': 'desc1', 'mccode': 'code1'},
  {'type': 'mcs', 'id': 'id2', 'description': 'desc2', 'mccode': 'code2'},
  {'type': 'mcm', 'id': 'id3', 'description': 'desc3', 'mccode': 'code3'},
  {'type': 'mcm', 'id': 'id4', 'description': 'desc4', 'mccode': 'code4'}
]}

我的问题是我根本没有使用过 XML(是的,真丢脸)。 你能否给我一些关于如何快速解析 xml 的线索(我有它在一个流上,我把它上传到服务器上)。我已经搜索了一些 XML 到 Json 的转换器,但是不可能找到适合我的需要的,因为我需要一种“特殊”格式。

感谢您的回答:)!我正在使用 C#。

【问题讨论】:

  • “快”是什么意思?执行速度?您是否有大量数据或 XML->C#->JSON 是一种选择?你说的“特殊格式”在哪里?写得快吗?原始 XML 阅读器(以文本流作为输出)是我能想象到的最快方式,但它的可重用性也较低; LINQ to XMLcustom JSON 序列化程序非常简单,但性能不会很好(对于大量数据)。最后,为什么不使用 XSLT?同样,如果您没有大量数据,这是最直接、最灵活的解决方案。
  • @Adriano。 xml 不是那么大,最多 400 或 500 行。我知道,我的问题是序列化器,但是为了能够序列化,我必须知道如何解析 XML。我想使用 LINQ to XML,因为我已经使用 LINQ to SQL 进行了一些工作,但我还不知道要使用哪种方法以及如何去做(如果我阅读了一些关于它的东西,我自己做,但我需要更快,这就是为什么我要求一些线索)。是的,XML 到 Json 是我唯一的选择,因为客户端和服务器之间的通信仅基于 Json。我所指的“特殊格式”是Json字符串的结构。谢谢你:)
  • 效率不高,但文件很小:看看 XSD (msdn.microsoft.com/en-us/library/x6c1kb0s(v=vs.100).aspx)。它将生成 C# 类来读取您提供的 XML 文件。然后只需编写自己的 JSON serializer(或使用 built-in 之一)。

标签: c# xml json xml-parsing xmlconvert


【解决方案1】:

我最近不得不为同一类型的事情编写一个定制的解决方案。我是用 XSLT 做的,使用 XslCompiledTransform 类来运行 XML 输入并输出 JSON。

这需要一些工作,但应该可以帮助您了解基础知识(它是从我所做的工作中复制粘贴的,改为几乎适合您的需要):

AdapterCards.XML

<AdapterCards>
    <cards type="MCS">
        <card>
            <id>id1</id>
            <description>desc1</description>
            <mccode>code1</mccode>
        </card>
        <card>
            <id>id2</id>
            <description>desc2</description>
            <mccode>code2</mccode>
        </card>
    </cards>
    <cards type="MCM">
        <card>
            <id>id3</id>
            <description>desc3</description>
            <mccode>code3</mccode>
        </card>
        <card>
            <id>id4</id>
            <description>desc4</description>
            <mccode>code4</mccode>
        </card>
    </cards>
    <cards type="F"/>
    <cards type="B"/>
</AdapterCards>

AdapterCards.XSL

<?xml version="1.0" encoding="utf-8"?>
<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
  <xsl:output indent="no" omit-xml-declaration="yes" method="text" encoding="UTF-8" media-type="text/x-json" />

<xsl:variable name="smallcase" select="'abcdefghijklmnopqrstuvwxyz'" />
<xsl:variable name="uppercase" select="'ABCDEFGHIJKLMNOPQRSTUVWXYZ'" />

    <!-- Main template for escaping strings; used by above template and for object-properties 
       Responsibilities: placed quotes around string, and chain up to next filter, escape-bs-string -->
    <xsl:template name="escape-string">
        <xsl:param name="s"/>
        <xsl:text>"</xsl:text>
        <xsl:call-template name="escape-bs-string">
            <xsl:with-param name="s" select="$s"/>
        </xsl:call-template>
        <xsl:text>"</xsl:text>
    </xsl:template>

    <!-- Escape the backslash (\) before everything else. -->
    <xsl:template name="escape-bs-string">
        <xsl:param name="s"/>
        <xsl:choose>
            <xsl:when test="contains($s,'\')">
                <xsl:call-template name="escape-quot-string">
                    <xsl:with-param name="s" select="concat(substring-before($s,'\'),'\\')"/>
                </xsl:call-template>
                <xsl:call-template name="escape-bs-string">
                    <xsl:with-param name="s" select="substring-after($s,'\')"/>
                </xsl:call-template>
            </xsl:when>
            <xsl:otherwise>
                <xsl:call-template name="escape-quot-string">
                    <xsl:with-param name="s" select="$s"/>
                </xsl:call-template>
            </xsl:otherwise>
        </xsl:choose>
    </xsl:template>

    <!-- Escape the double quote ("). -->
    <xsl:template name="escape-quot-string">
        <xsl:param name="s"/>
        <xsl:choose>
            <xsl:when test="contains($s,'&quot;')">
                <xsl:call-template name="encode-string">
                    <xsl:with-param name="s" select="concat(substring-before($s,'&quot;'),'\&quot;')"/>
                </xsl:call-template>
                <xsl:call-template name="escape-quot-string">
                    <xsl:with-param name="s" select="substring-after($s,'&quot;')"/>
                </xsl:call-template>
            </xsl:when>
            <xsl:otherwise>
                <xsl:call-template name="encode-string">
                    <xsl:with-param name="s" select="$s"/>
                </xsl:call-template>
            </xsl:otherwise>
        </xsl:choose>
    </xsl:template>

    <!-- Replace tab, line feed and/or carriage return by its matching escape code. Can't escape backslash
       or double quote here, because they don't replace characters (&#x0; becomes \t), but they prefix 
       characters (\ becomes \\). Besides, backslash should be seperate anyway, because it should be 
       processed first. This function can't do that. -->
    <xsl:template name="encode-string">
        <xsl:param name="s"/>
        <xsl:choose>
            <!-- tab -->
            <xsl:when test="contains($s,'&#x9;')">
                <xsl:call-template name="encode-string">
                    <xsl:with-param name="s" select="concat(substring-before($s,'&#x9;'),'\t',substring-after($s,'&#x9;'))"/>
                </xsl:call-template>
            </xsl:when>
            <!-- line feed -->
            <xsl:when test="contains($s,'&#xA;')">
                <xsl:call-template name="encode-string">
                    <xsl:with-param name="s" select="concat(substring-before($s,'&#xA;'),'\n',substring-after($s,'&#xA;'))"/>
                </xsl:call-template>
            </xsl:when>
            <!-- carriage return -->
            <xsl:when test="contains($s,'&#xD;')">
                <xsl:call-template name="encode-string">
                    <xsl:with-param name="s" select="concat(substring-before($s,'&#xD;'),'\r',substring-after($s,'&#xD;'))"/>
                </xsl:call-template>
            </xsl:when>
            <xsl:otherwise>
                <xsl:value-of select="$s"/>
            </xsl:otherwise>
        </xsl:choose>
    </xsl:template>


    <xsl:template match="card">
        <xsl:text>{</xsl:text>

        <xsl:text>"type":</xsl:text>
        <xsl:call-template name="escape-string">
            <xsl:with-param name="s" select="translate(../@type, $uppercase, $smallcase)"/>
        </xsl:call-template>

        <xsl:text>,"id":</xsl:text>
        <xsl:call-template name="escape-string">
            <xsl:with-param name="s" select="id"/>
        </xsl:call-template>

        <xsl:text>,"description":</xsl:text>
        <xsl:call-template name="escape-string">
            <xsl:with-param name="s" select="description"/>
        </xsl:call-template>

        <xsl:text>,"mccode":</xsl:text>
        <xsl:call-template name="escape-string">
            <xsl:with-param name="s" select="mccode"/>
        </xsl:call-template>

        <xsl:if test="following::card">},</xsl:if>
        <xsl:if test="not(following::card)">}</xsl:if>
    </xsl:template>


    <xsl:template match="/AdapterCards">
        <xsl:text>{[</xsl:text>

        <xsl:apply-templates select="cards/card" />

        <xsl:text>]}</xsl:text>
  </xsl:template>
</xsl:stylesheet>

C#

// Load XML document
XmlDocument xmlDoc = new XmlDocument();
xmlDoc.Load("AdapterCards.XML");

// Transform the XML into JSON
XslCompiledTransform transformer = new XslCompiledTransform();
using (var xslStylesheetFile = File.Open("AdapterCards.XSL", FileMode.Open))
{
    using (var xmlReader = new XmlTextReader(xslStylesheetFile))
    {
        transformer.Load(xmlReader);
    }
}
var sourceNavigator = xmlDoc.CreateNavigator();
using (MemoryStream ms = new MemoryStream())
{
    transformer.Transform(sourceNavigator, null, ms);
    ms.Position = 0;
    using (var sr = new StreamReader(ms))
    {
        return sr.ReadToEnd(); // <-- this is your JSON
    }
}

我在 Notepad++ 中执行了上面的 XSL,得到了以下结果:

{[{"type":"mcs","id":"id1","description":"desc1","mccode":"code1"},
{"type":"mcs","id":"id2","description":"desc2","mccode":"code2"},
{"type":"mcm","id":"id3","description":"desc3","mccode":"code3"},
{"type":"mcm","id":"id4","description":"desc4","mccode":"code4"}]}

如您所见,在需要的地方缺少逗号。但它几乎就在那里!

更新了 XSL 和现在在正确位置使用逗号的输出。接下来要解决的是“类型”的情况。我想您可能需要使用 XSL 2.0 来访问 xpath function fn:lower-case()

EDIT3:完成 - 现在将大小写转换为较低的 with the help of this answer

参考资料:

【讨论】:

    【解决方案2】:

    使用包含辅助方法的 JsonConvert 类来实现此精确目的:

    // To convert an XML node contained in string xml into a JSON string   
    XmlDocument doc = new XmlDocument();
    doc.LoadXml(xml);
    string jsonText = JsonConvert.SerializeXmlNode(doc);
    
    // To convert JSON text contained in string json into an XML node
    XmlDocument doc = (XmlDocument)JsonConvert.DeserializeXmlNode(json);
    

    此处的文档:Converting between JSON and XML with Json.NET

    【讨论】:

    【解决方案3】:

    这是使用开源库Cinchoo ETL 将 xml 转换为 json 文件的另一种简单方法

    using (var r = new ChoXmlReader("*** Xml file path ***")
           .WithXPath("//cards")
           )
    {
        using (var w = new ChoJSONWriter("*** Json file path ***")
              )
            w.Write(r.SelectMany(r1 => ((dynamic[])r1.cards??new dynamic[]{}).Select(c => new { r1.type, c.id, c.description, c.mccode })));
    }
    

    小提琴样例:https://dotnetfiddle.net/Yzcaiw

    【讨论】:

      【解决方案4】:
      XDocument xDoc = XDocument.Load(queryURL);                               
      var x1 = from el in xDoc.Root.Descendants("results").Descendants("div").Descendants("div").Descendants("span").Attributes("class")
      where el.Value == "pr"
        select el.Parent.Value;                
         stockFeed.Price = Decimal.Parse(x1.First().ToString());
      

      LINQ 是提取数据的最佳方式。

      【讨论】: