我正在开发在线圣经搜索程序。圣经是一本相当大的书,以纯文本占用了近5MB的空间。我计划在该计划中实施API,并允许其他网站包含他们自己的圣经搜索窗口小部件和程序,而无需开发搜索查询或将自己的圣经存储在自己的服务器上。存储大量可搜索文本文件的最佳方式
考虑到这一点,我预计最终我会有一个适度的查询流程通过该程序。另外,对于那些不熟悉圣经的人,它有两种格式化文本的方法。它可以包含红色文本和斜体。我需要一种方式来存储圣经以及红色和斜体格式,但允许搜索查询忽略格式。
它还需要尽可能快速和高效(内存和CPU使用率)。只要查询可以忽略格式化,任何存储格式都将被考虑(MySQL,JSON或XML文本文件等)。文件大小和数量并不重要,因此将书籍或甚至章节分成单独的文件对我来说是很好的。
要记住的另一个重要的事情是,我想有一种搜索方法可以搜索多个经文。因此,寻找“,但有上帝的永生不送他的儿子”将返回约翰3:16,17。感谢所有想法!
你可以真正快速地使用grep进行搜索。你打算使用哪个平台? – galchen