我正在处理巨大的字符串(100MB的文件 - 文本)。文件文本存储在StringBuilder中。StringBuilder - 读取N个字符
出于某种原因,我需要更改此文本的编码,不能期待这一点,从CURRENT-Encoding到NEW-Encoding。所以,我需要使用
Encoding.Convert(...)
函数。由于这个文件是HUGH,我想把它分解成几部分。例如,每次有1024个字符。打破StringBuilder的子串的似乎是一个问题,对我来说,因为我不想使用
.ToString()
功能(性能原因)。
你如何推荐我这样做,而不需要把整个文本放到一个单独的字符串中?
你可以使用['StringReader'](http://msdn.microsoft.com/en-us/library/system.io.stringreader.aspx)。 – Styxxy 2014-11-01 18:26:22
你看到在分块中分割字符串的性能方面有什么好处?你仍然需要转换整个字符串,对吧? – Yogu 2014-11-01 18:26:43
你在说什么样的编码?字符的长度是否可变(例如,UTF-8的字符超出ASCII或UTF-16的字符超出BMP范围)? – svick 2014-11-01 18:28:44