2009-12-04 76 views
0

我有一个有订单号,取消日期和原因的表。 原因字段是varchar(255)字段,它由许多不同的销售代表编写,并且很难根据我需要生成报告以对取消原因进行分类的原因类别进行分组。使用TSQL分析原因的最佳方法是什么?TSQL用于分析文本的查询

样品由销售代表

cust already has this order going out 
cust can not hold for item Called to cancel order 
cust doesn't want to pay for shipping 
wife ordered same item from different vendor, sent email 
cst made a duplicate order, sent email 
cst can't hold 
Cust doesn't want to go through verification process so is cancelling order 
doesn't ant to hold for Bo 
doesn't want 
Cust called to cancel the order He can no longer get the product he wants 
cnt hld 
will not comply with export req 
cant' hold 
Custs request 
Cust will not hold for BO 
per. cust. request. 

进入的原因BTW我有SQL Server的问题,2005年

回答

4

的部分是,这这些都不是真正的原因代码。听起来像是你的模式给我的问题。如果没有预先确定的原因代码来引用,并且您允许为每个原因自由输入文本,那么除了将不同的原因带回来之外,没有办法直接执行此操作,这可能不会很有用。

只是一个想法,即使它在临时或测试环境中,您是否可以在表中添加另一列,然后赋予业务用户分配代码的能力(例如,1代表错误,2代表重复订单,3为错误的项目等)到每个订单取消。然后对此进行分析。

我认为这就是他们对你的期望,但我不知道我看到了更好的方式。如果你有权威/知识,你可以自己进行分析,但如果你有大量的取消,这可能会很痛苦。

编辑 - 我现在看到你已经用正则表达式标记了这个...它可以设置指定的关键字来提取条目,但是必须有一些宽容内置,然后手动分析对于由于拼写错误等原因不属于任何指定类别的商品/编辑

+0

谢谢。我虽然这样。但问题是我们使用第三方订单处理应用程序,我们将无法设置原因列表。但我可以在桌面上添加额外的列,但问题仍然保持不变。 – THEn 2009-12-04 20:39:01

1

+1 to @jmatthews,您确实需要选择原因代码,然后可能允许自由格式输入。

如果这不是一个选项,你可以看看text clustering。尽管如此,不要期望它快速简单,它仍然是一个开放的研究课题,与人工智能和机器学习有关。