C# xsd 验证 XML数据有效性 问题

使用XSD进行批量数据导入时生成的XML数据有效性这样的功能已经不是第一次做了,之前做的时候都没有碰到什么问题,这些天在开发中遇到了一个很头痛的问题就是无论XSD文件规则怎么写,验证都是通过的。

下面是具体的代码:

C#验证部分:

        /// <summary>
        /// 对已转换成映射XML文件使用指定架构文件进行验证
        /// </summary>
        /// <param name="mappingXmlFile">映射XML文件</param>
        /// <param name="schemaFile">架构文件</param>
        /// <returns>返回空字符串表示验证成功,否则返回错误信息</returns>
        public string ValidateMappingXMLFile(string mappingXmlFile, string schemaFile)
        {
            string namespaceUrl = "http://tempuri.org/MsisdnSchema.xsd";
            XmlReaderSettings settings = new XmlReaderSettings();
            settings.ValidationType = ValidationType.Schema;
            settings.Schemas.Add(namespaceUrl, schemaFile);
            settings.ValidationEventHandler += new System.Xml.Schema.ValidationEventHandler(settings_ValidationEventHandler);

            sb = new StringBuilder();

            XmlReader reader = XmlReader.Create(mappingXmlFile, settings);
            try
            {
                reader.MoveToContent();
                while (reader.Read())
                {
                    if (reader.NodeType == XmlNodeType.Document && reader.NamespaceURI != namespaceUrl)
                    {
                        return "Data does not match the specifications!";
                    }
                }
            }
            catch (XmlException ex)
            {
                sb.AppendFormat(ex.Message + "\n");
            }
            finally
            {
                reader.Close();
            }
            if (String.IsNullOrEmpty(sb.ToString()))
            {
                return string.Empty;
            }
            else
            {
                return "Validation Faild,Please check the validity of the data:" + sb.ToString();
            }
        }

        public void settings_ValidationEventHandler(object sender, System.Xml.Schema.ValidationEventArgs e)
        {
            sb.Append(e.Message + "\n");
        }

XML数据:

 <?xml version="1.0" encoding="utf-8"?>
 <MSISDN>
  <List>
     <BATCH_IMPORT_ID>6adbca51-c55f-4022-bcc0-84b209a78a38</BATCH_IMPORT_ID>
     <BATCH_NO>20131027172271517</BATCH_NO>
     <PORT_IN_MSISDN>31632000000</PORT_IN_MSISDN>
     <CUSTOMER_TYPE>Business</CUSTOMER_TYPE>
     <ID_TYPE>Passport</ID_TYPE>
     <ID_NUMBER>1234567</ID_NUMBER>
     <NATIONALITY>Netherlands</NATIONALITY>
     <DAY_OF_BIRTH>2013-10-27</DAY_OF_BIRTH>
     <COUNTRY_ID>Netherlands</COUNTRY_ID>
     <LANGUAGE>Dutch - The Netherlands</LANGUAGE>
     <COMPANY>ET.</COMPANY>
     <STATUS_ID>Active</STATUS_ID>
     <TITLE_ID>Mr.</TITLE_ID>
     <FIRST_NAME>Mark</FIRST_NAME>
     <MIDDLE_NAME>
     </MIDDLE_NAME>
     <LAST_NAME>Mulder</LAST_NAME>
     <EMAIL>654645</EMAIL>
     <ADDRESS>Schipholboulevard</ADDRESS>
     <HOUSE_NO>249</HOUSE_NO>
     <HOUSE_EXTENTION>
     </HOUSE_EXTENTION>
     <ZIP_CODE>4324</ZIP_CODE>
     <CITY>Schipholboulevard</CITY>
     <PACKAGE_NAME>88 mobile prepaid 2.5.0</PACKAGE_NAME>
     <BILLING_EMAIL>martin.mulder@elephanttalk.com</BILLING_EMAIL>
     <CUSTOMER_ID_DONOR>56346546</CUSTOMER_ID_DONOR>
     <WISHDATE_PORTING>2013-10-27</WISHDATE_PORTING>
     <NETWORK_OPERATOR>BEN</NETWORK_OPERATOR>
     <SERVICE_PROVIDER>Atlantic Telecom</SERVICE_PROVIDER>
   </List>
 </MSISDN>

XSD验证架构

 <?xml version="1.0" encoding="utf-8"?>
 <xs:schema
           id="MSISDNSchema"
           targetNamespace="http://tempuri.org/MsisdnSchema.xsd"
           elementFormDefault="qualified"
           attributeFormDefault="unqualified"
           xmlns="http://tempuri.org/MsisdnSchema.xsd"
           xmlns:mstns="http://tempuri.org/MsisdnSchema.xsd"
           xmlns:xs="http://www.w3.org/2001/XMLSchema">
   <xs:element name="MSISDN">
     <xs:complexType>
       <xs:sequence>
         <xs:element maxOccurs="unbounded" name="List">
           <xs:complexType>
             <xs:sequence>
               <xs:element name="BATCH_IMPORT_ID" minOccurs="0">
                 <xs:simpleType>
                   <xs:restriction base="xs:string">
                     <xs:maxLength value="36"/>
                   </xs:restriction>
                 </xs:simpleType>
               </xs:element>
               <xs:element name="BATCH_NO" minOccurs="0">
                 <xs:simpleType>
                   <xs:restriction base="xs:string">
                     <xs:maxLength value="50"/>
                   </xs:restriction>
                 </xs:simpleType>
               </xs:element>
               <xs:element name="PORT_IN_MSISDN">
                 <xs:simpleType>
                   <xs:restriction base="xs:string">
                     <xs:maxLength value="50"/>
                   </xs:restriction>
                 </xs:simpleType>
               </xs:element>
               <xs:element name="CUSTOMER_TYPE" minOccurs="0" default="Business">
                 <xs:simpleType>
                   <xs:restriction base="xs:string">
                     <xs:maxLength value="50"/>
                   </xs:restriction>
                 </xs:simpleType>
               </xs:element>
               <xs:element name="ID_TYPE" minOccurs="0" default="Passport">
                 <xs:simpleType>
                   <xs:restriction base="xs:string">
                     <xs:maxLength value="50"/>
                   </xs:restriction>
                 </xs:simpleType>
               </xs:element>
               <xs:element name="ID_NUMBER" default="1234567">
                 <xs:simpleType>
                   <xs:restriction base="xs:string">
                     <xs:maxLength value="20"/>
                   </xs:restriction>
                 </xs:simpleType>
               </xs:element>
               <xs:element name="NATIONALITY" minOccurs="0" default="Netherlands">
                 <xs:simpleType>
                   <xs:restriction base="xs:string">
                     <xs:maxLength value="20"/>
                   </xs:restriction>
                 </xs:simpleType>
               </xs:element>
               <xs:element name="DAY_OF_BIRTH" minOccurs="0">
                 <xs:simpleType>
                   <xs:restriction base="xs:date">
                   </xs:restriction>
                 </xs:simpleType>
               </xs:element>
               <xs:element name="COUNTRY_ID" minOccurs="0" default="Netherlands">
                 <xs:simpleType>
                   <xs:restriction base="xs:string">
                     <xs:maxLength value="50"/>
                   </xs:restriction>
                 </xs:simpleType>
               </xs:element>
               <xs:element name="LANGUAGE" minOccurs="0" default="Netherlands">
                 <xs:simpleType>
                   <xs:restriction base="xs:string">
                     <xs:maxLength value="50"/>
                   </xs:restriction>
                 </xs:simpleType>
               </xs:element>
               <xs:element name="COMPANY" minOccurs="0" fixed="ET.">
                 <xs:simpleType>
                   <xs:restriction base="xs:string">
                     <xs:maxLength value="100"/>
                   </xs:restriction>
                 </xs:simpleType>
               </xs:element>
               <xs:element name="STATUS_ID" minOccurs="0" fixed="Active">
                 <xs:simpleType>
                   <xs:restriction base="xs:string">
                     <xs:maxLength value="20"/>
                   </xs:restriction>
                 </xs:simpleType>
               </xs:element>
               <xs:element name="TITLE_ID" minOccurs="0">
                 <xs:simpleType>
                   <xs:restriction base="xs:string">
                     <xs:maxLength value="20"/>
                   </xs:restriction>
                 </xs:simpleType>
               </xs:element>
               <xs:element name="FIRST_NAME" minOccurs="0">
                 <xs:simpleType>
                   <xs:restriction base="xs:string">
                     <xs:maxLength value="100"/>
                   </xs:restriction>
                 </xs:simpleType>
               </xs:element>
               <xs:element name="MIDDLE_NAME" minOccurs="0">
                 <xs:simpleType>
                   <xs:restriction base="xs:string">
                     <xs:maxLength value="100"/>
                   </xs:restriction>
                 </xs:simpleType>
               </xs:element>
               <xs:element name="LAST_NAME" minOccurs="0">
                 <xs:simpleType>
                   <xs:restriction base="xs:string">
                     <xs:maxLength value="100"/>
                   </xs:restriction>
                 </xs:simpleType>
               </xs:element>
               <xs:element name="EMAIL" minOccurs="0">
                 <xs:simpleType>
                   <xs:restriction base="xs:string">
                     <xs:maxLength value="100"/>
                     <xs:pattern value="([a-zA-Z0-9_\-\.]+)@((\[[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.)|(([a-zA-Z0-9\-]+\.)+))([a-zA-Z]{2,4}|[0-9]{1,3})(\]?)"/>
                   </xs:restriction>
                 </xs:simpleType>
               </xs:element>
               <xs:element name="ADDRESS" minOccurs="0">
                 <xs:simpleType>
                   <xs:restriction base="xs:string">
                     <xs:maxLength value="100"/>
                   </xs:restriction>
                 </xs:simpleType>
               </xs:element>
               <xs:element name="HOUSE_NO" minOccurs="0">
                 <xs:simpleType>
                   <xs:restriction base="xs:string">
                     <xs:maxLength value="25"/>
                   </xs:restriction>
                 </xs:simpleType>
               </xs:element>
               <xs:element name="HOUSE_EXTENTION" minOccurs="0">
                 <xs:simpleType>
                   <xs:restriction base="xs:string">
                     <xs:maxLength value="100"/>
                   </xs:restriction>
                 </xs:simpleType>
               </xs:element>
               <xs:element name="ZIP_CODE" minOccurs="0">
                 <xs:simpleType>
                   <xs:restriction base="xs:string">
                     <xs:maxLength value="25"/>
                   </xs:restriction>
                 </xs:simpleType>
               </xs:element>
               <xs:element name="CITY" minOccurs="0">
                 <xs:simpleType>
                   <xs:restriction base="xs:string">
                     <xs:maxLength value="100"/>
                   </xs:restriction>
                 </xs:simpleType>
               </xs:element>
               <xs:element name="PACKAGE_NAME" minOccurs="0">
                 <xs:simpleType>
                   <xs:restriction base="xs:string">
                     <xs:maxLength value="50"/>
                   </xs:restriction>
                 </xs:simpleType>
               </xs:element>
               <xs:element name="BILLING_EMAIL" minOccurs="0">
                 <xs:simpleType>
                   <xs:restriction base="xs:string">
                     <xs:maxLength value="100"/>
                   </xs:restriction>
                 </xs:simpleType>
               </xs:element>
               <xs:element name="CUSTOMER_ID_DONOR" minOccurs="0">
                 <xs:simpleType>
                   <xs:restriction base="xs:string">
                     <xs:maxLength value="100"/>
                   </xs:restriction>
                 </xs:simpleType>
               </xs:element>
               <xs:element name="WISHDATE_PORTING" minOccurs="0">
                 <xs:simpleType>
                   <xs:restriction base="xs:date">
                   </xs:restriction>
                 </xs:simpleType>
               </xs:element>
               <xs:element name="NETWORK_OPERATOR" minOccurs="0">
                 <xs:simpleType>
                   <xs:restriction base="xs:string">
                     <xs:maxLength value="10"/>
                   </xs:restriction>
                 </xs:simpleType>
               </xs:element>
               <xs:element name="SERVICE_PROVIDER" minOccurs="0">
                 <xs:simpleType>
                   <xs:restriction base="xs:string">
                     <xs:maxLength value="50"/>
                   </xs:restriction>
                 </xs:simpleType>
               </xs:element>
             </xs:sequence>
           </xs:complexType>
         </xs:element>
       </xs:sequence>
     </xs:complexType>
   </xs:element>
 </xs:schema>

可见,<EMAIL>654645</EMAIL>项是一个不符合Email正则表达式验证的Email地址,可是执行的结果依然是没有进行验证。

在园子里的另一篇文章http://q.cnblogs.com/q/38157/ 给了我启发,我把XML数据的对XSD命名空间的引用,<MSISDN xmlns="http://tempuri.org/MsisdnSchema.xsd" >

发现这次验证是可以正常进行的,说明问题出在了XML数据上。

“XmlReader 在执行验证的时候不光需要xsd文件,还需要xml文件显示的引用xsd的NameSpaces,这样才就可以去匹配验证每个元素。”果然如帖子中说的一样。

可这样格式的XML数据,在进行校验过后,要转换成Dataset进行再次处理会比较麻烦,需要先获取XML架构再取数据,那么能不能不修改XML数据就验证成功呢?

我对代码和XSD数据进行了如下修改:

xsd里面
去掉

targetNamespace="http://tempuri.org/MsisdnSchema.xsd"

代码里面(写出的部分为替换注释掉部分的代码)

//string namespaceUrl = "http://tempuri.org/MsisdnSchema.xsd";

//settings.Schemas.Add(namespaceUrl, schemaFile);

settings.Schemas.Add(null, schemaFile);

//if (reader.NodeType == XmlNodeType.Document && reader.NamespaceURI != namespaceUrl)

if (reader.NodeType == XmlNodeType.Document && reader.NamespaceURI !=null)

再运行程序,代码就通过了,验证可以正常运行。

可能有不少同学在学习XSD验证XML的时候,会参考园子里的一篇博客

http://www.cnblogs.com/chenxizhang/archive/2009/06/19/1507121.html

我想指出的是,

如果XML数据文件没有引用任何XSD的命名空间,那么在代码中,是不需要设置XmlReader的namespaceUrl的,并且XSD中也不需要设置targetNamespace项的值,否则验证是不会进行的,验证结果永远都是成功。

上一篇:SequoiaDB创始人:比MongoDB领先一到两年 打造企业级NoSQL数据库


下一篇:java多线程面试题整理及答案(2018年)