我已经设置像这样火车带文本的,估计拥有
X = [tag, design_version, runtime, error_msg], Y = 'PASS'/'FAIL'
'tag' = string
'design_version' = string
'runtime' = number
'error_msg' = string
还有更多的功能(字符串,数字),我可以访问,但没有列在这里为简便起见标记的训练数据。数据实际上是一组用于模拟的属性,标签是模拟通过还是失败。我想用这些输入来训练一个估计器;并使其在一组新属性上预测“通过”或“失败”。
我一直在阅读Working with Text Data with sklearn。但是,如何使用文本和数字特征的组合来适合估算人员并不十分清楚。什么算法使用等
任何指针会真的很有帮助!
这几乎是我希望找到的!虽然它可能需要我花一些时间才能真正尝试并实现它,但我确信这就是我需要的。谢谢大家! – shikhanshu