2011-01-31 97 views
1

我正在考虑对包含大于4年的通信的一组大型个人.pst文件执行一些文本挖掘。文本挖掘Outlook电子邮件存档

最初,我想提取标题信息以识别社交网络,但最终希望开始根据关键词对电子邮件进行分类或创建一些结构化输出以支持进一步的分析。

有没有人有什么建议从哪里开始?

回答

2

您应该检查在公开可用的Enron Email Dataset上完成的研究 - >该页面链接到一些有趣的论文