我有一个包含大约100000篇文章的文本文件。 文件的结构是:如何在C#中打开一个大文本文件
.Document ID 42944-YEAR:5 .Date 03\08\11 .Cat political Article Content 1 .Document ID 42945-YEAR:5 .Date 03\08\11 .Cat political Article Content 2
我想开在C#这个文件通过行处理它行。 我试过这段代码:
String[] FileLines = File.ReadAllText(
TB_SourceFile.Text).Split(Environment.NewLine.ToCharArray());
但它说:
型 '的System.OutOfMemoryException' 的异常被抛出 。
问题是如何打开此文件并逐行读取它。
- 文件大小:564 MB(591886626个字节)
- 文件编码:UTF-8
- 文件包含Unicode字符。