我想知道是否有一个数据结构经过优化,可以对存储在数据库表格式格式中的数据进行频率计数。例如,数据以下面的(逗号)分隔格式显示。以数据库表格式格式计数频率的数据结构
col1, col2, col3
x, a, green
x, b, blue
...
y, c, green
现在我只想计算col1 = x或col1 = x和col2 = green的频率。我一直在数据库表中存储数据,但在我的分析和经验观察中,数据库连接是一个瓶颈。我也尝试过使用内存数据库解决方案,并且工作得很好;唯一的问题是内存需求和奇怪的init/destroy调用。
另外,我主要与java工作,但与.net的经验,并想知道是否有任何API与linq方式使用java中的“表格”数据工作。
任何帮助表示赞赏。
如何使用数据库?有了正确的查询数据库应该适合你正在做的事情...... – 2011-01-13 05:01:22
我只是创建一个数据库表。我知道有很多方法可以优化查询(即使用索引),但是它们不同于数据库和数据库。此外,由于在运行时算法确定哪些列是相关的,因此无法知道要创建哪些索引(哪些列或列组合)。此外,该程序接受任何表格数据集作为输入,所以我在运行时创建数据库表。 – jake 2011-01-13 19:20:34