我有一个150 MB的XML文件,在我的项目中用作数据库。目前,我正在使用XmlReader
从中读取内容。我想知道在这种情况下最好使用XmlReader
或LINQ to XML。性能:XmlReader或LINQ到XML
请注意,我正在搜索此XML中的项目并显示搜索结果,因此可能需要很长时间或仅需一小会儿。
我有一个150 MB的XML文件,在我的项目中用作数据库。目前,我正在使用XmlReader
从中读取内容。我想知道在这种情况下最好使用XmlReader
或LINQ to XML。性能:XmlReader或LINQ到XML
请注意,我正在搜索此XML中的项目并显示搜索结果,因此可能需要很长时间或仅需一小会儿。
如果您希望性能使用XMLReader。它不会读取整个文件并在内存中构建DOM树。而是从磁盘读取文件,并将其返回到找到的每个节点。
通过快速的谷歌搜索,我发现了XMLReader,LinqToXML和XDocument.Load的性能比较。
写了几个基准测试,以确定情况到底是什么给你,并把它从那里... Linq2XML引入了很大的灵活性...
我会亲自看看使用LINQ to XML利用微软的帮助文件中列出的流媒体技术: http://msdn.microsoft.com/en-us/library/system.xml.linq.xstreamingelement.aspx#Y1392
这里有一个快速的基准测试由一个200MB的XML文件中读取一个简单的过滤器:
var xmlFilename = "test.xml";
//create test xml file
var initMemoryUsage = GC.GetTotalMemory(true);
var timer = System.Diagnostics.Stopwatch.StartNew();
var rand = new Random();
var testDoc = new XStreamingElement("root", //in order to stream xml output XStreamingElement needs to be used for all parent elements of collection so no XDocument
Enumerable.Range(1, 10000000).Select(idx => new XElement("child", new XAttribute("id", rand.Next(0, 1000))))
);
testDoc.Save(xmlFilename);
var outStat = String.Format("{0:f2} sec {1:n0} kb //linq to xml ouput streamed", timer.Elapsed.TotalSeconds, (GC.GetTotalMemory(false) - initMemoryUsage)/1024);
//linq to xml not streamed
initMemoryUsage = GC.GetTotalMemory(true);
timer.Restart();
var col1 = XDocument.Load(xmlFilename).Root.Elements("child").Where(e => (int)e.Attribute("id") < 10).Select(e => (int)e.Attribute("id")).ToArray();
var stat1 = String.Format("{0:f2} sec {1:n0} kb //linq to xml input not streamed", timer.Elapsed.TotalSeconds, (GC.GetTotalMemory(false) - initMemoryUsage)/1024);
//xmlreader
initMemoryUsage = GC.GetTotalMemory(true);
timer.Restart();
var col2 = new List<int>();
using (var reader = new XmlTextReader(xmlFilename))
{
while (reader.ReadToFollowing("child"))
{
reader.MoveToAttribute("id");
int value = Convert.ToInt32(reader.Value);
if (value < 10)
res2.Add(value);
}
}
var stat2 = String.Format("{0:f2} sec {1:n0} kb //xmlreader", timer.Elapsed.TotalSeconds, (GC.GetTotalMemory(false) - initMemoryUsage)/1024);
//linq to xml streamed
initMemoryUsage = GC.GetTotalMemory(true);
timer.Restart();
var col3 = StreamElements(xmlFilename, "child").Where(e => (int)e.Attribute("id") < 10).Select(e => (int)e.Attribute("id")).ToArray();
var stat3 = String.Format("{0:f2} sec {1:n0} kb //linq to xml input streamed", timer.Elapsed.TotalSeconds, (GC.GetTotalMemory(false) - initMemoryUsage)/1024);
//util method
public static IEnumerable<XElement> StreamElements(string filename, string elementName)
{
using (var reader = XmlTextReader.Create(filename))
{
while (reader.Name == elementName || reader.ReadToFollowing(elementName))
yield return (XElement)XElement.ReadFrom(reader);
}
}
而这里的处理时间和内存使用我的机器上:
11.49 sec 225 kb // linq to xml ouput streamed
17.36 sec 782,312 kb // linq to xml input not streamed
6.52 sec 1,825 kb // xmlreader
11.74 sec 2,238 kb // linq to xml input streamed
我觉得你在这里误用XML。不要将它用作数据库。 150 MB? :o相关:http://stackoverflow.com/questions/1154499/linq-to-xml-vs-xmlreader – nawfal 2015-08-20 06:11:54