【发布时间】:2010-10-26 02:48:01
【问题描述】:
我有一个这样的 XML 结构,一些学生项目包含无效的 UTF-8 字节序列,这可能导致整个 XML 文档的 XML 解析失败。
我想要做的是,过滤掉包含 UTF-8 字节序列的 Student 项目,并保留有效的字节序列。有关如何在 .Net 中执行此操作的任何建议或示例(首选 C#)?
顺便说一句:我的意思是无效的字节序列 => http://en.wikipedia.org/wiki/UTF-8#Invalid_byte_sequences
<?xml version="1.0" encoding="utf-8"?>
<AllStudents>
<Student>
Mike
</Student>
<Student>
(Invalid name here)
</Student>
</AllStudents>
提前致谢, 乔治
【问题讨论】:
标签: c# .net xml validation utf-8