0
我有客户数据库,他们具有某些属性和客户类型。属性的集合可能会有所不同(它们确实来自有限集合),而当我查看未知类型的新客户并给定属性时,我想确定他/他属于哪种类型。例如,假设我在DB有这些客户已经,基于任意分类和相似性度量的匹配
Customer | Type | Attributes
1 A 44,32,5,'X'
2 A 3,32,66,'A'
3 B 6,32,'A', 'B'
4 C 47,31,2,'H'
5 C 14,32,2,'O'
6 C 2,'C'
7 A 44
当我收到一个新的客户谁拥有的属性,例如,3,32,2,我想确定这个客户属于哪个类型,并且代码应该报告其匹配的信心(以百分比表示)。
什么是最好的方法在这里使用?统计的东西,还是基于某种亲和度矩阵的方法,还是推荐引擎风格的基于Pearson相关系数的方法?示例中,pseude代码将是最受欢迎的,但任何所有想法都很好。
感谢,