Q

在Python中是否有推荐的机器学习包？

2009-08-17 203 views 76 likes

76

在Python中是否有推荐的机器学习包？我有以前在C++和MATLAB中实现各种机器学习和统计算法的经验，但在Python中完成了一些工作，我对Python的可用包感到好奇。在Python中是否有推荐的机器学习包？

2009-08-17 Ori Folger

+2

可能相关： http://stackoverflow.com/questions/1605854/what-is-the-best-artificial-library-for-python http://stackoverflow.com/questions/1798091/artificial -intelgence-library-in-python – sastanin 2009-12-27 16:21:49

+4

@ will，below：you are wrong ...没有违法，关闭此项目的决定既不具有建设性也不有用。 – lmsasu 2012-02-10 13:38:57

+0

@lmsasu：没有冒犯。如果我是社区，可以投票重新开放。或者更直接的行动是请求在Meta上重新开放。然而，我不认为它会得到任何结果，因为阻止这样的问题一直是一个长期的做法（当然，只要问题已经出现，当然，但你明白）。主要由非现场链接回答的列表/自行车/购物问题现在几乎立即关闭。 – Will 2012-02-10 14:08:39

A

回答

43

AFAIK，Orange可能是目前的最佳选择。
PyML也不错。
PyMC贝叶斯估计。
，还有一本书“Machine Learning：An Algorithmic Perspective”，There are lots of Python code examples in the book，可能值得一读。
并且有一篇博文：Pragmatic Classification with Python。
只是我的两分钱。

2009-08-17 23:04:27 sunqiang

+1

看起来像PyMC已经搬到这里：https://github.com/pymc-devs/pymc – cbednarski 2012-09-03 02:33:42

7

你可能想看看：

http://www.shogun-toolbox.org/，这对多国语言，包括Python接口。也有http://www.pybrain.org/，这是（我相信）ML算法的本地实现。希望有所帮助。

2009-08-17 19:36:21 oort

+0

PyBrain专注于神经网络。 – 2014-05-19 17:00:22

2

我不确定你是否确切地称这台机器学习，但nltk package贝叶斯风格的文本分类。您可以使用学习数据和测试数据来查看它是推断有关数据的规则。

2009-08-17 19:42:03 hughdbrown

+0

NLTK对文本挖掘更有用。 – riza 2009-08-18 04:29:52

1

查看Modular toolkit for Data Processing (MDP)。它实现了机器学习和统计学中的几个算法，并且它已经成熟并且有据可查。

2009-08-17 20:55:30 nikow

10

一般的用户友好包是Orange - 有点像Weka或RapidMiner，如果你熟悉这些包的话。

除此之外，还有各种各样的包和工具包用于各种任务。您应该参考mloss上列出的Python包作为起点。

2009-08-17 21:07:58 ars

5

对于支持向量机，看看LibSVM，其中包括Python接口。

2009-08-19 19:24:48

2

这是SciPy的做了伟大的名单，众多知名Python包的，除其他外，机器学习相关：Artificial intelligence & machine learning

2009-08-29 17:05:35

4

我给Orange一试。

它功能强大，但如果你仔细阅读文档，你会意识到作者有自己疯狂的Python编写风格。如果你对Python比较陌生，他的代码确实会变得很神秘，所以除非你熟悉Python，否则我不会推荐Orange。

2009-12-27 15:41:32 4cents

4

在Stack Overflow或许相关的问题：

Artificial Inteligence library in python。

What is the best artificial-intelligence library for Python?

2009-12-27 16:23:50 sastanin

0

如果您正在寻找神经网络，蟒蛇为fann结合是很容易使用，并配有工具来训练你的网络

2009-12-27 23:34:54 chub

3

http://www.pymvpa.org可以正常工作。

2010-02-09 15:32:24 Mike

5

Deep Learning Tutorials描述如何开发和训练深度神经网络。即使使用Nvidia GPU，也可以使用used library。

2010-04-21 21:05:54

94

还有scikit-learn（BSD，只依赖于numpy & scipy）。它包括各种监督学习算法，例如：基于libsvm的和线性与scipy.sparse绑定宽特征的数据集

贝叶斯方法

的HMM

L1和L1 + L2正规化回归方法

SVM又名Lasso和Elastic Net模型，用LARS和坐标下降算法实现

它还具有无监督聚类算法，如：

k均值++
均值漂移
亲和力传播
谱聚类

以及其他工具如：

文本内容特征提取器（令牌和焦炭n元语法+哈希矢量化器）
单变量功能选择
一个简单的管道工具
的交叉验证策略，大量的实现
性能指标评测和ploting（ROC曲线，AUC，混淆矩阵，...）
网格搜索工具使用并行交叉验证执行超参数调整
与joblib集成以在交互环境中工作时缓存部分结果（例如，使用ipython）

每个算法的实现都附带sample programs，演示其在玩具数据或真实生活数据集上的用法。

另外，官方的源代码库是hosted on github，所以请随时用交互式代码审查的常规拉取请求功能来贡献错误修正和改进。

2010-09-06 13:31:50 ogrisel

0

SVMlight有时是LibSVM的方便替代品！不过，LibSVM也很棒。

2011-05-13 21:50:35

相关问题