2017-03-03 179 views
3

现在我建立一个功能来确定电子邮件地址是否邮件列表地址/组电子邮件地址或个人电子邮件地址。我目前的策略是使用人工手动注释,然后使用这些数据来确定传入的邮件地址。例如[email protected],是邮寄地址,所以我保存这个电子邮件地址recruitment和标记作为组的名称,所以在将来如果有名字recruitment接收电子邮件,我忽略它。如果没有使用手动注释构建的数据集,您是否有任何其他解决方案来构建此功能?任何帮助会感激确定是否电子邮件地址的邮件列表地址或个人电子邮件地址

回答

0

这可能是有意义的使用域地址为特征,或为此事两个名字。很多邮件列表都是企业公司,许多个人地址来自诸如Yahoo,Gmail等网站。具有附加功能可以为您提供更多的数据,以创建学习算法来对邮件进行分类,例如Perceptron( https://en.wikipedia.org/wiki/Perceptron)。这种方法仍然会涉及手动更新,但它会使您的功能随着时间的推移变得更加智能。