我一直在尝试为从文件中读取的数据集编写插入和合并排序。在测试我的代码时,我使用了一个小数据集(包含6个数字),并且我的程序完美运行。但是当我用一个更大的数据集与1000000输入代码不工作,我不明白为什么。我试图改变向量的类型来加倍,但它不能解决问题。 非常感谢您的帮助。插入和合并排序不适用于大数据集C++
我的数据集包括像数字:512069,12823,11628
这里是我的代码:
vector<int> readFile(string fileName);
void display(vector<int> &vector);
void insertionSort(vector<int> &vec);
vector<int> merge(vector<int> left, vector<int> right);
vector<int> mergeSort(vector<int> &m);
int main(int argc, const char * argv[]) {
string fileName;
cout<<"Enter input file name :";
cin>>fileName;
vector<int> numbersVec = readFile(fileName);
display(numbersVec);
cout<<"INSERTION SORT"<<"\n";
insertionSort(numbersVec);
display(numbersVec);
cout<<"MERGE SORT"<<"\n";
vector<int> neu = mergeSort(numbersVec);
display(neu);
return 0;
}
vector<int> readFile(string fileName){
vector<int> numbers;
ifstream in(fileName,std::ios::in);
if(!in.is_open())
{
cout << "File Cannot be Opened" << endl;
}
else{
int number;
while (in >> number) {
numbers.push_back(number);
}
}
in.close();
return numbers;
}
void display(vector<int> &vec) {
for(int i = 0; i < vec.size(); i++)
{
cout << vec[i] << " ";
}
cout << "\n" << endl;
}
void insertionSort(vector<int> &vec) {
long double i, j, tmp;
for (i = 1; i < vec.size(); i++) {
j = i;
while (j > 0 && vec[j - 1] > vec[j]) {
tmp = vec[j];
vec[j] = vec[j - 1];
vec[j - 1] = tmp;
j--;
}
}
}
vector<int> merge(vector<int> tmpl, vector<int> tmpr){
vector<int> res;
while ((int)tmpl.size() > 0 || (int)tmpr.size() > 0) {
if ((int)tmpl.size() > 0 && (int)tmpr.size() > 0) {
if ((int)tmpl.front() <= (int)tmpr.front()) {
res.push_back((int)tmpl.front());
tmpl.erase(tmpl.begin());
}
else {
res.push_back((int)tmpr.front());
tmpr.erase(tmpr.begin());
}
}
else if ((int)tmpl.size() > 0) {
for (int i = 0; i < (int)tmpl.size(); i++)
res.push_back(tmpl[i]);
break;
}
else if ((int)tmpr.size() > 0) {
for (int i = 0; i < (int)tmpr.size(); i++)
res.push_back(tmpr[i]);
break;
}
}
return res;
}
vector<int> mergeSort(vector<int> &vec)
{
if (vec.size() <= 1)
return vec;
vector<int> tmpl, tmpr, res;
int mid = ((int)vec.size()+ 1)/2;
for (int i = 0; i < mid; i++) {
tmpl.push_back(vec[i]);
}
for (int i = mid; i < (int)vec.size(); i++) {
tmpr.push_back(vec[i]);
}
tmpl = mergeSort(tmpl);
tmpr = mergeSort(tmpr);
res = merge(tmpl, tmpr);
return res;
}
大数据集有哪些错误?永远循环或别的东西?在'insertionSort'中,'i','j','tmp'应该有'int'类型,但不是'long double'。你的'mergeSort'函数似乎效率低下(多个向量拷贝:合并可能就位)。 – Franck
它打印出INSERTION SORT后进入无限循环,我试图使用调试器,几乎不可能跟踪这么大的设置。我也将i,j,tmp更改为int,但它仍然没有脱离循环。 – Valentino
这是一个复杂性问题。您的插入排序是n(n-1)/ 2,其中n是您的矢量的大小。即使你的矢量只有100万个数据,你也要等很长时间。 – Franck