除CouchDB和原生XML数据库(如eXist)之外,哪些数据库可以存储和查询未结构化和半结构化数据?我已经交了许多不同格式的数据(XML,JSON,YAML,CSV,一些自定义格式),我需要合并和处理,但在关系数据库中开发模式将是时间 - 消耗和困难。可以处理半结构化数据的数据库?
主要是,我正在寻找开源解决方案。另外,在某些时候,我想让这些数据可用。
我知道将所有这些数据转换为通用格式来处理会有一些开销。 XML前端有一些很好的选择:eXist-db和BerkeleyDB-XML似乎有很好的XQuery支持。另外,虽然还很年轻,但CouchDB看起来很有希望,它具有简单的“文档”格式。
我看过的其他途径是OODBMS,如ZODB和db4o;编写一些简单的解析脚本,然后将结果记录对象“按原样”存储。之后的问题在于查询它们; OODBMS似乎没有很好的查询引擎历史。
我不喜欢的是“blobs-in-relational-db”解决方案。看起来像一个黑客,并没有真正考虑到数据的演变,FT索引等。
有没有其他解决方案我没有遇到过?
数据是半结构化的,但结构通常不匹配任何其他文档/文件。 – 2008-10-22 22:44:02