2011-03-02 35 views
4

我们一直在我们的网站上收集用户数据一段时间,现在我们想以一种可访问的方式呈现数据。我们有一个数据库充满了数据,我们只是在寻找一个框架,我们可以将所有的数据转储并可视化。用户数据有哪些好的统计可视化框架/库?

一些要求:

  • 必须能够排序&过滤器由多个维度(如:按用户,按操作类型,按日期,元数据)
  • 必须能够出口的意见数据导入CSV/XML文件
  • 必须通过一个网络接口(没有桌面应用程序)
  • 应符合任一斯卡拉,使用Java,Python或Ruby
可用呈现

我们已经研究过使用Vaadin,并且我们享有可以控制的数量,但是我想探索其他可能的解决方案。

对于可能帮助我们显示我们的统计数据的框架有任何建议吗?

回答

4

我有很多快乐与谷歌visualisations和谷歌提供的Java库工作。我甚至为它写了一个适配器 - 在Scala中 - 与LucidDb一起工作,因为默认提供的数据库适配器仅适用于MySQL。

运动图尤其是一件很美的事情。

更新

清醒是处理数据的质量,以超过1Tb的大小愉快工作的好方法。它是面向列的(如vertica或SybaseIQ),所以您不会承担获取整行数据的I/O成本,只需选择几列。

Lucid可通过SQL进行查询,并具有jdbc客户端驱动程序,加上google可视化Java库,这是一个理想的匹配,该库能够将大部分自己的查询格式转换为SQL ,所以最小化后处理的处理量。

我在Scalate框架内部运行这个,构建所有的javascript来动态地显示图表。通过这种方式,我可以轻松地根据页面中的其他控件更改查询参数,并将新数据推入图表,而无需重新加载页面。取决于你的网站的重量是多少,Lift可能更适合你。

整个事情花了我一个星期的时间来设置,虽然我确实有过使用谷歌库的经验。

+0

看起来很酷,不知道它:http://code.google.com/intl/pt-BR/apis/visualization/documentation/gallery.html – pedrofurla 2011-03-03 01:08:06

1

Infobright也是存储海量数据并将其用于分析的流行选择。它以列为导向,利用知识网格架构快速轻松地解决查询。它可以在开源和企业版本中使用。

Infobright在他们的infobright.org网站上提供了一个虚拟机以及Pentaho,Jaspersoft和BIRT。如果你想玩这些商务智能工具,我建议你从那里开始。

相关问题