2011-02-18 104 views
0


我有一个文本文件,里面有一些电子邮件。我需要删除所有没有关键字的电子邮件(即:Gmail,雅虎......)。
有没有办法做到这一点?
在此先感谢。如何只保留文本文件中的一些关键字

+0

该文件有多大,它是否适合内存。你如何分离文件中的电子邮件? – 2011-02-18 08:25:05

+0

该文件是关于1Mb和电子邮件。我用分行符分隔电子邮件。 – Vinzgore 2011-02-18 13:42:06

回答

0

是的。你想用哪种语言?

例如在Smalltalk:

((FileStream fileNamed: 'emails.txt') 
    substrings: eMailSeparatorChar) 
    reject: [:a|a includesSubString: aKeyWord] 
0

假设每个电子邮件是在单线

grep -wEi 'gmail|yahoo|aol' emailFile 

-w单词

-i不区分大小写

emailFile是包含该文件电子邮件。

以下更改输入文件。

grep -wEi 'gmail|yahoo|aol' emailFile > tempFile && cp tempFile emailFile && rm tempFile 

如果你想添加更多的列表只需添加'|' serviceProvide

相关问题