我想提取从日志文件中访问的唯一文件。即"GET /socview/svspring01D.htm HTTP/1.1"*
日志文件的正则表达式
因为我知道我想写一个正则表达式来提取所有这些文件的格式。我已经完成了这一个,但我对此并不满意。我将不胜感激这方面的一些帮助(我是编程新手) 另外,因为我可以使用GET
作为出发点,所以我不希望将其提取为字典,是否有任何方法可以做到这一点?我使用字典来计算每个文件被访问的次数。
match = re.search (r'^GET.*\.1' ,logfile)
你想只有文件名?你使用哪种编程语言? – Jan
python,只是文件名而已 – Deirdre