问题:给定一组手工分类的字符串(或一组有序的字符串向量)生成一个分类函数,以对更多输入进行分类。就我而言,这些数据(或大部分数据)不是自然语言。字符串中的机器学习和代码生成器
问题:是否有任何工具可以做到这一点?我正在考虑一些合理的打磨,下载,安装和类似的事情,而不是一些图书馆或一个脆弱的学术计划。
(不要停留在细节,请尽快与真正细节将限制答案通常较少有用的答复,并签署保密协议。)
由于我正在寻找一个例子;我想要过滤的输入是从日志中提取的计算机生成的状态字符串。根据需要通知谁或需要采取什么操作来过滤错误消息(作为示例)。
您可能想更多地谈谈要分类的字符串。例如,它们是由自然语言数据(例如,电子邮件或其他文件)组成的吗? – dmcer 2010-05-14 18:18:03
您是否有权访问源代码,即您是否拥有所有可能的状态字符串列表? – 2010-05-15 01:02:50
错误消息是一个例子。 OTOH我无法访问生成输入的东西。 – BCS 2010-05-16 00:31:05