我有一个非常大的.txt文件(9 MB)。在它的字存储这样的:如何从一个大的txt文件中仅有效地读取字符串
да 2337093
е 1504540
не 1480296
се 1212312
在.txt文件每行包括一个字符串,后跟一个空格和一个数字。
我想只获取单词并将它们存储在一个字符串数组中。我看到一个正则表达式在这里会过度杀伤,但是由于我对C++中的流不熟悉,却没有想到另一种方式。
我有一个非常大的.txt文件(9 MB)。在它的字存储这样的:如何从一个大的txt文件中仅有效地读取字符串
да 2337093
е 1504540
не 1480296
се 1212312
在.txt文件每行包括一个字符串,后跟一个空格和一个数字。
我想只获取单词并将它们存储在一个字符串数组中。我看到一个正则表达式在这里会过度杀伤,但是由于我对C++中的流不熟悉,却没有想到另一种方式。
以下样本
#include <bits/stdc++.h>
using namespace std;
int main() {
vector<string> strings;
ifstream file("path_to_file");
string line;
while (getline(file, line))
strings.push_back(line.substr(0, line.find(" ")));
// Do whatever you want with 'strings' vector
}
[不要使用bits/stdC++](http://stackoverflow.com/questions/31816095/why-should-i-not-include-bits-stdc-h)。 –
您应该逐行读取文件,并且对于每行使用字符串的substr()
方法根据空间位置解析一行,并且您可以使用find()
方法查找分隔符的位置。采取空间之前的词部分,而忽略休息。
例如,您可以查看here。
没有分割功能。 – DogeAmazed
我错过了C++的问题,但仍然有很多可用的API用于字符串方法,或者您可以使用'substr()'方法自己创建。查看更新后的答案。 –
九兆类似不是很大。只需打开它,使用'std :: getline()'来读取每一行,'find()'来定位分隔空间。如果你保证文件的内容总是正确的,那么你可以使用'operator >>' –