2016-04-22 64 views
0

我的实验室正在进行大量的测序工作,但序列记录的方式使得很难检索它们或记录数据。我想创建一个具有以下功能的数据库: -A允许用户上传/检索/查看数据的图形用户界面,并且可以包含链接以快速对其他在线工具进行BLAST或序列分析。
- 允许一个访问它 - 即对有一个什么样的实验室记录的GUI另一部分命令行 ,需要订购等创建生物数据库:第一步?

我想知道,如果有一般的数据库是什么我可以采用和修改模板以满足我的实验室需求?我没有数据库设计经验,但已阅读关于mySQL。

我在开始这个项目时应该采取的第一步是什么?

谢谢!

回答

1

这是一个有趣的问题和问题域(我现在有btw的expierence)。您的第一步是决定一个通用体系结构,然后为此选择技术。

对于网络/图形方面,有很多现成组件(我假设您知道AntiSMASH,JBrowse等工具)。但你需要评估这些。这是超出了数据库方面的范围。

在数据库方面,PostgreSQL在这里表现令人赞叹。我曾在一个重负载的10 + TB数据库上工作,这个数据库专门存储了测序数据,BLAST报告等等。如果你在上面添加PostBIS之类的东西,你会得到一些相当实用的东西。

然而,业界中很多较重的部分都在使用Hadoop,因为可用数据量增长非常迅速,但实现该工作所需的专业知识数量也相应较高。