2015-04-01 71 views
0

如果缓冲区大小小于文件大小,如何合并两个文件? 例如,我有两个文件与排序整数如果缓冲区大小小于文件大小,如何合并两个文件?

的1.txt和2.txt

​​

我有一个排序的文件进行合并他们,但我无法读取从每超过两个号码文件(这是任务)。我无法同时在内存中存储超过4个数字。

这里是我的代码

#include <iostream> 
#include <fstream> 
#include <vector> 
#include <iterator> 
#include <algorithm> 

using namespace std; 

const int bufferSize = 2; 

bool readSortFile(ifstream &file, vector<int> &data) { 
    int tmp; 
    for (int i = 0; (i < bufferSize && file >> tmp); i++) 
     data.push_back(tmp); 

    return file.good(); 
} 

int main() { 
    ifstream file1("1.txt"); 
    ifstream file2("2.txt"); 
    ofstream out; 
    vector<int> data1, data2; 
    bool fileGood1, fileGood2; 

    fileGood1 = true; 
    fileGood2 = true; 

    while(fileGood1 || fileGood2) { 
     if(data1.size() == 0) 
      fileGood1 = readSortFile(file1, data1); 
     if (data2.size() == 0) 
      fileGood2 = readSortFile(file2, data2); 

     out.open("temp", ios::app); 
     merge(data1.begin(), 
       data1.end(), 
       data2.begin(), 
       data2.end(), 
       ostream_iterator<int>(out, "\n")); 

     data1.clear(); 
     data2.clear(); 
     out.close(); 
    } 
    rename("temp", "result.txt"); 
    file1.close(); 
    file2.close(); 

    return 0; 
} 

输出为1 2 5 7 6 7 8 9

+0

你看过外部排序:http://en.wikipedia.org/wiki/External_sorting? – NathanOliver 2015-04-01 19:47:46

+1

你是否尝试过实施'合并'?该算法不要求将源保存在内存中,事实上它只能对每个序列的一个值进行操作......或者,您可以直接在输入中使用算法,方法是使用'std :: istream_iterator'和'std :: ostream_iterator' ...只是说 – 2015-04-01 19:53:48

+0

输入文件是否应该已经排序? – Christophe 2015-04-01 19:54:19

回答

0

正如在注释中,你只需要从每个文件1号实施合并,但你可能会需要编写你自己的合并逻辑,而不是使用std :: merge。伪代码示例,您需要添加eof检查(如果1.txt结束,则复制2.txt的其余部分,反之亦然)。

num1 = get number from "1.txt" 
    num2 = get number from "2.txt" 
    loop(...){ 
     if(num1 <= num2){ 
      write num1 
      num1 = get number from "1.txt" 
     } else { 
      write num2 
      num2 = get number from "2.txt" 
     } 
    }