2012-04-11 162 views
5

我是一名在我的主要项目工作的最后一年的学生。我的项目基本上是从自然场景中提取文本,并将其识别出来,然后将它们显示在记事本等中。如何训练matlab中的SVM用于字符识别?

我已经提取了文本形式的图像,并且还为每个提取的字符获得了85个特征。

对于识别部分,对于如何在matlab中训练或使用SVM(支持向量机)我没有任何线索,所以我可以得到一个匹配。

请帮我,因为这是谈到了费尽周折困难

+0

你知道的SVM是什么?你唯一执行的问题是? – Squazic 2012-04-11 05:48:56

+0

http://www.csie.ntu.edu.tw/~cjlin/libsvm/看看这个....它将是非常有用的... – lakesh 2012-04-11 10:31:09

回答

9

如果你满意的使用现有的SVM实现,那么应该使用生物信息学工具箱svmtrain,或下载的libsvm Matlab的版本。如果您想自己实施SVM,那么您应该了解SVM theory,并且您可以使用quadprog来解决适当的优化问题。

有了您的数据,您需要有一个N乘85的特征矩阵,其中N是一些字符,以及手动提供的N-1阵列的“真实标签”。根据您用来训练SVM的工具,svmtrain的参数略有不同 - 请检查文档。

如果你要评估你的SVM表明一切正常,你可能需要组织数据,这样你可以估算分类器的泛化误差 - 见cross-validation

+0

+1:很好的答案。 – 2012-04-11 09:01:23