我需要解析非常大的日志文件(> 1Gb,< 5Gb) - 实际上我需要将数据剥离到对象中,以便将它们存储在数据库中。日志文件是连续的(没有换行符),如:解析真的很大的日志文件(> 1Gb,<5Gb)
TIMESTAMP = 20090101000000; PARAM1 = Value11; PARAM2 = Value21; PARAM3 = Value31; TIMESTAMP = 20090101000100; PARAM1 = Value11; PARAM2 = Value21; PARAM3 = Value31; TIMESTAMP = 20090101000152; PARAM1 = Value11; PARAM2 = Value21;参数3 = Value31; ...
我需要剥离到表这样的:
TIMESTAMP | PARAM1 | PARAM2 | PARAM3
该过程需要尽可能快。我正在考虑使用Perl,但任何使用C/C++的建议都会非常受欢迎。有任何想法吗?
最好的问候,
亚瑟
我添加了一个工作脚本了这个问题。 – 2009-05-29 21:50:20