基于任意分类和相似性度量的匹配

我有客户数据库，他们具有某些属性和客户类型。属性的集合可能会有所不同（它们确实来自有限集合），而当我查看未知类型的新客户并给定属性时，我想确定他/他属于哪种类型。例如，假设我在DB有这些客户已经，基于任意分类和相似性度量的匹配

Customer | Type | Attributes 

1   A  44,32,5,'X' 
2   A  3,32,66,'A' 
3   B  6,32,'A', 'B'   
4   C  47,31,2,'H'   
5   C  14,32,2,'O' 
6   C  2,'C' 
7   A  44

当我收到一个新的客户谁拥有的属性，例如，3,32,2，我想确定这个客户属于哪个类型，并且代码应该报告其匹配的信心（以百分比表示）。

什么是最好的方法在这里使用？统计的东西，还是基于某种亲和度矩阵的方法，还是推荐引擎风格的基于Pearson相关系数的方法？示例中，pseude代码将是最受欢迎的，但任何所有想法都很好。

感谢，

来源

2011-04-06 user423805

来解决这个问题是使用朴素贝叶斯的方式。

来源

2011-04-06 12:55:48 user423805

基于任意分类和相似性度量的匹配

回答

相关问题