2015-04-23 89 views
0

我正在创建一个python模块,用于创建和操作数据结构,以存储大量来自真实实验的语义标记数据和元数据。因此,在一个实验中,你有:树的树?树木表?我创建了什么样的数据结构?

  • 科目
  • 治疗
  • 复制

围护这3类是实验,三个类别的组合是什么,我叫“单位” 。现在有3(台状)之间没有本质上正确的层次结构,但对于某些分析它是认为3作为层次结构的特定排列的有用,

例如(受试者 - >(处理 - >(重复)))

(复制 - >(处理 - >(受试者)))

此外,收集数据时,文件将被复制粘贴到桌面上的文件夹中,因此数据至少会以树的形式出现。我已经考虑了很多关于哪个层次更好的问题,但我一直在为6种可能的排列中的大多数提供用例。我希望我的模块具有灵活性,因为用户可以考虑实验或使用任何层次结构,表格,层次结构表格混合对他们有意义来收集数据。

另外,“单元”或(表条目)中的任何组织的复杂性为数据的任意数量的容器(字节到千兆字节,不管理想情况下)。这就是为什么我不认为关系数据库方法真的要走,而NoSQL类型的解决方案更有意义。但是,如果没有一个“正确”,我就会遇到如何订购这三个类别的问题。

所以我的问题是这个多层面的数据结构是什么?

是否存在某种流体数据结构或一组算法来轻松地进行相互转换或生成结构化视图?

+0

你应该选择任何方式来存储信息,并有一个接口转换为其他类型的结构。如果只有两种数据表示,那么它不应该太难。 – PepperoniPizza

+0

这就是我已经在做的事情。我问是否有API可以用来简化这个。 – salotz

回答