2016-03-04 177 views
1

我读了一些教程和介绍,但我不知道我得到了它的窍门,最重要的是,我不知道我的理解ML VS NN完全。机器学习在Python:scikit学习/ Pybrain

假设我想指示程序(像scikit学习),使其作为其输入设置一些语言词典。例如,我有一个大词典的意大利话,我可以输入作为数组的数组(数组是单个字,并且每个字的每个产品的ASCII值的阵列,一个用于世界的每个字符):

[ 
    [112, 105, 122, 122, 97], // pizza 
    [109, 097, 109, 109, 97], // mamma 
    ... 
] 

难道不可能性/什么是最好的图书馆/如何做到这一点:

  1. 给出一个单词,让程序推断,如果它可能是一个意大利词,让“黑手党”是公认作为一个潜在的实际的意大利词,但“Eichhörnchen”不是(它比意大利的普通世界更长,它包含了像“rnch”这样的序列,它们在最初的集合中没有找到,它包含了“ö”在意大利使用)
  2. 基于初始设置其他(可能)意大利语单词。例如,“potomo”不是实际的意大利词,但据意大利正字它可能

回答

0

我觉得朴素贝叶斯分类和KNN可以used.Naive贝叶斯分类被证明可以过滤垃圾邮件,但在此之前你需要一本词库。