2011-06-06 63 views
0

我完全不熟悉数据分析,并想知道是否有人对如何启动有任何建议?分析mysql数据

这是我想解决的问题。我有一个mysql数据库,每天从20行到每天增加数百万行(取决于数据源),我想分析它的关系。基本上它是数据组合的可能性(红色= 2,蓝色= 5,黑色= 5等),我想要一个工具来日常分析它,看哪些是最有可能的(即如果我把约束只有5%的总价值可以改变或只有5种颜色可以选择)。

我认为这将会很复杂,但我是新的,完全愿意学习。对于上述问题(以及相关类型的分析问题),您建议我做什么?我正在寻找一个工具(开源请...我是一个可怜的学生),一本书的建议,howto doc等。我想要一个良好的基础,这不是生产(这是一个学习环境,我设置所以我可以试验)。

我正在学习python和java,并且正在考虑使用这些工具进行分析,但朋友建议可能使用为其设计的工具或遵循经过验证的方法来做到这一点。

回答

1

你对实际的细节很轻。但是如果你正在寻找开源统计分析软件包,我会建议从r,wekaknime开始。当然,这是一个非常重要的主题。

根据你的理解水平,人们可以使用SQL来做很多事情,但不知道你的数据结构,它代表什么以及你想要完成什么,没有任何东西试图解释你能做什么。

对于你提到的学习Python和Java,这也将是有益的。两者都有几个可用的开源统计软件包,并且/或者可以与我上面列出的程序捆绑在一起。