什么是生物信息学参与者应该知道的一些数据结构?我想任何人都应该知道列表,哈希,平衡树等,但我期望有特定于域的数据结构。有没有专门讨论这个问题的书?生物信息学的数据结构
回答
生物信息学中使用的最基本的数据结构是字符串。还有一系列代表字符串的不同数据结构。而字符串匹配等算法则基于高效的表示/数据结构。
这一综合性工作是丹Gusfield的Algorithms on Strings, Trees and Sequences
一个生物信息学很多入门书籍将介绍一些你会使用的基本结构。我不确定标准课本是什么,但我相信你可以找到。这可能是看一些具体的语言书籍有用:我选择了这两个作为例子,因为它们是由O'Reilly出版,
其中,以我的经验,出版高质量的书籍。
我只是碰巧在我的硬盘上安装了Python书籍,其中大部分内容都是关于使用Python处理生物信息学字符串的。它似乎不像生物信息学使用任何奇特的特殊数据结构,只是现有的。
生物信息学中的许多项目涉及结合来自不同的半结构化来源的信息。 RDF和本体在很多方面都是必不可少的。例如,参见bio2RDF项目。 http://bio2rdf.org/。对标识符的理解很有价值。
许多生物信息学是探索性的,而且经常使用快速轻量级的工具。请参阅工作流程工具,例如Taverna,其中主要资源通常是一组Web服务 - 因此HTTP/REST很常见。
例如空间散列数据结构(kd-tree)通常用于任意特征向量的最近邻查询以及3d蛋白质结构分析。
您$$的最佳书籍是Understanding Bioinformatics by Zvelebil,因为它涵盖了从序列分析到结构比较的所有内容。
除了基本熟悉你所提到的结构,suffix trees(和后缀数组),de Bruijn graphs,和interval graphs被广泛使用。 The Handbook of Computational Molecular Biology写得很好。我从来没有读过所有的东西,但我用它作为参考。
我也强烈推荐这本书,http://www.comp.nus.edu.sg/~ksung/algo_in_bioinfo/
而最近,Python是更频繁地在生物信息学比Perl使用。所以我真的建议你从python开始,它在我的项目中被广泛使用。
无论您的数学或计算专业知识是什么,您都可能在计算生物学中找到应用。如果没有,请将这个另一个stackoverflow的问题,你会得到帮助:o)
正如在其他答案中提到的,在一维数据的字符串比较和模式发现有些永恒,因为序列是如此容易得到。随着对医学信息学的重新兴趣,您还可以进行二维/三维图像分析,例如运行针对基因组数据。通过分子生物化学,您还可以在3D表面和分子模拟上进行模式搜索。为了研究药物效应,您将使用基因网络并比较各种组织。大数据和信息集成的典型挑战适用。然后,您需要对偶然发现的任何特征的模式或临床关联可能性的统计描述。
- 1. 具有负面结果的生物信息学数据库?
- 2. 生物信息学资源
- 3. Linux生物信息学工具
- 4. 需要SQL数据结构信息
- 5. 生物信息学的最佳操作系统?
- 6. 学生的表结构
- 7. 生物信息学开源工具贡献
- 8. 生物信息学 - 需要得到ATOMS序列
- 9. 我需要帮助完成这个生物信息学程序
- 10. 学生考勤表结构
- 11. 学习数据结构的来源
- 12. WCF结构肥皂信息
- 13. 保存数据结构的类型信息
- 14. 保存大量状态机信息的数据结构
- 15. SQLite数据库信息的结构到ListView
- 16. 用于保存客户端信息的安全数据结构
- 17. 创建学生信息系统
- 18. 学生信息文件处理
- 19. 存储和比较生物信息
- 20. Firebase数据结构:日期上学
- 21. Java数据结构/ C++ STL等价物?
- 22. FreeBSD的数据结构和通信
- 23. 用什么数据库结构来存储GEDCOM信息?
- 24. 数据结构为网格边缘信息
- 25. 从perl数据结构中提取信息
- 26. 什么是一些信息数据结构?
- 27. 如何插入的学生详细信息列表中WP7芒果数据库
- 28. 文档库的信息体系结构
- 29. Golang结构的JSON - 错误信息
- 30. C指针数学结构
同意。古斯菲尔德的书很全面。 – awesomo 2010-11-30 07:59:06