2011-04-06 86 views
0

我有客户数据库,他们具有某些属性和客户类型。属性的集合可能会有所不同(它们确实来自有限集合),而当我查看未知类型的新客户并给定属性时,我想确定他/他属于哪种类型。例如,假设我在DB有这些客户已经,基于任意分类和相似性度量的匹配

Customer | Type | Attributes 

1   A  44,32,5,'X' 
2   A  3,32,66,'A' 
3   B  6,32,'A', 'B'   
4   C  47,31,2,'H'   
5   C  14,32,2,'O' 
6   C  2,'C' 
7   A  44 

当我收到一个新的客户谁拥有的属性,例如,3,32,2,我想确定这个客户属于哪个类型,并且代码应该报告其匹配的信心(以百分比表示)。

什么是最好的方法在这里使用?统计的东西,还是基于某种亲和度矩阵的方法,还是推荐引擎风格的基于Pearson相关系数的方法?示例中,pseude代码将是最受欢迎的,但任何所有想法都很好。

感谢,

回答

0

来解决这个问题是使用朴素贝叶斯的方式。