语言: vb.net 文件大小:1GB和东西。如何确保文件在vb.net中具有唯一的行如果文件的大小非常大
文本文件的编码: UTF8(因此每个字符由不同数量的字节表示)。
整理: UnicodeCI(当几个字符基本相同时,最流行的版本将是唯一的版本。)。我想我知道如何处理他的问题。
由于每个字符都由不同数量的字节表示,并且每行的字符数不同,因此每行中的字节数也各不相同。
我想我们必须为每一行计算哈希。我们还需要将缓冲区的位置存储在每行的位置。然后我们必须比较缓冲区。然后我们将检查是否显示同一行。
是否有最适合此功能的特殊功能?
什么是MD5的大小?一个不完美的方法是使用压缩内存的整数散列。但是再次,几条不同的线必须具有相同的散列。这就是为什么我们也需要存储缓冲区位置。 – 2012-04-04 04:46:14
+1我也大量修改了你的代码。该退出虽然是一个bug,等等。 – 2012-04-04 05:57:54
sr.BaseStream.Position
2012-04-04 06:40:02