如果我想要使用太大而不适合内存的矩阵进行大量数据拟合,我会查看哪些工具/库?具体来说,如果我通常使用php + mysql在网站上运行数据,那么如何建议在合理的时间内执行大型矩阵操作的离线进程?Web数据上的大型机器学习
可能的答案可能就像“你应该用这种语言和这些分布式矩阵算法来映射许多机器上的减少量”。我认为php不是最好的语言,所以流程更像是其他离线进程从数据库中读取数据,进行学习,并将规则存储回php中可以使用的格式(因为该网站的其他部分是建立在PHP)。
不知道这是否是正确的地方问这个问题(在机器学习SE中会问这个问题,但它从来没有超出测试版)。
机器学习已被交叉验证合并。 – 2012-04-27 08:52:58