2011-01-05 67 views
3

目前我正在使用XML存储许多数据,并且在创建这些XML文件时,我想将其大小降至最小。删除结束元素的空间?

我怎么能覆盖的XmlWriter功能(对writeEndElement),因此而不是保存它喜欢:

<thisElement someAttribute="blabla" /> 

它将被保存,如:

<thisElement someAttribute="blabla"/> 

UPDATE:

我我试图找到一种方法来实现这一点,使用:

public override void WriteEndElement() 

但是我不能使用当前的WriteEndElement函数来知道我必须改变它,如果它甚至是可能的。

+0

标准压缩将无法正常工作?如果没有,我会想出一个答案。 – Amy 2011-01-05 05:49:23

+0

将使用xml的应用程序不是由我们制作的,我们已经要求对其进行更改,但它不是计划很快就会更改,所以我们正在尽我们所能将其最小化:(并且该空间的更改为其中一个是有百万条目的文件,200MB的文件,300MB的一些文件,但这是目前的平均值 – Guapo 2011-01-05 09:47:06

+0

我知道这是一个完整的黑客想法,但是你可以用字符串替换它,把整个文件放在一个字符串中' strXML'。运行'strXML.Replace(“\”/>“,”\“/>”)''然后'XElement.Parse(strXML)'。 – 2011-01-06 02:08:58

回答

1

恐怕没有重写代码的重要部分是不可能的。该空间在内部类中是硬编码的,不可配置。

例如,内部XmlEncodedRawTextWriter.WriteEndElement()方法的代码片段。

internal override void WriteEndElement(string prefix, string localName, string ns) 
{ 
    // snip... 
    else 
    { 
     this.bufPos--; 
     this.bufChars[this.bufPos++] = ' '; // the space is hard coded 
     this.bufChars[this.bufPos++] = '/'; 
     this.bufChars[this.bufPos++] = '>'; 
    } 
} 

,你有,我能想到的一些选项来解析XML输出到搜索结束标记手动删除空间,实现自己的XML作家所以它不包括这个空间里,或编写一个包装类,以便在写入结束元素时使用反射来修改内部缓冲区。


这里有一个扩展方法可以做到这一点。只是要警告,这不是便携式的。它也不能保证适用于所有情况,尽管它似乎适用于简单情况。我不认为在这里做什么会破坏作者的状态,但使用您自己的风险

public static class XmlWriterExtensions 
{ 
    private static readonly Func<XmlWriter, object> get_writer; 
    private static readonly Func<object, char[]> get_bufChars; 
    private static readonly Func<object, int> get_bufPos; 
    private static readonly Action<object, int> set_bufPos; 

    static XmlWriterExtensions() 
    { 
     var asm = Assembly.GetAssembly(typeof(XmlWriter)); 
     var xmlWellFormedWriterType = asm.GetType("System.Xml.XmlWellFormedWriter"); 
     var flags = BindingFlags.NonPublic | BindingFlags.Instance; 
     var writerField = xmlWellFormedWriterType.GetField("writer", flags); 
     get_writer = w => writerField.GetValue(w); 
     var xmlEncodedRawTextWriterType = asm.GetType("System.Xml.XmlEncodedRawTextWriter"); 
     var bufCharsField = xmlEncodedRawTextWriterType.GetField("bufChars", flags); 
     var bufPosField = xmlEncodedRawTextWriterType.GetField("bufPos", flags); 
     get_bufChars = w => (char[])bufCharsField.GetValue(w); 
     get_bufPos = w => (int)bufPosField.GetValue(w); 
     set_bufPos = (w, i) => bufPosField.SetValue(w, i); 

    } 

    public static void TrimElementEnd(this XmlWriter writer) 
    { 
     var internalWriter = get_writer(writer); 
     char[] bufChars = get_bufChars(internalWriter); 
     int bufPos = get_bufPos(internalWriter); 
     if (bufPos > 3 && bufChars[bufPos - 3] == ' ' && bufChars[bufPos - 2] == '/' && bufChars[bufPos - 1] == '>') 
     { 
      bufChars[bufPos - 3] = '/'; 
      bufChars[bufPos - 2] = '>'; 
      bufPos--; 
      set_bufPos(internalWriter, bufPos); 
     } 
    } 
} 

// usage: 
Console.OutputEncoding = Encoding.UTF8; 
using (var writer = XmlWriter.Create(Console.Out)) 
{ 
    writer.WriteStartElement("Foo"); 
    writer.WriteElementString("Bar", null); 
    writer.TrimElementEnd(); 
    writer.WriteElementString("Baz", null); 
    writer.WriteEndElement(); 
} 

 

<?xml version="1.0" encoding="utf-8"?><Foo><Bar/><Baz /></Foo> 
+0

这是什么我目前正在解析输出的XML来搜索结束标签,以删除空间' – Guapo 2011-01-06 02:04:39

+0

@Guapo:敬请期待,我会努力写下最后一个选项。这是可能的,但非常黑客。 – 2011-01-06 02:21:33

+0

@Jeff我期待着它的实施将是一个保佑。 – Guapo 2011-01-06 02:30:15