2012-04-27 69 views
4

可能重复:创建一堆HTML的应用
Full-text search for static HTML files on CD-Rom via javascript全文搜索本地/离线网络“网站”

我开始开发本地文件然后可以在系统(包括移动设备)上的任何网络浏览器中浏览它们。 HTML文件具有许多交互功能,所以它基本上是一个离线的网络应用程序。我的问题是,对这些HTML文件实施全文搜索的最佳方式是什么?基本上,应用程序应该索引它生成的HTML文件,但我们希望能够使HTML文件和生成的索引可下载并供用户浏览和离线搜索。如果不编写实际的应用程序来管理它,最好的方法是什么?例如,我已经使用Solr为演示/概念证明实现了它,并且工作正常......但是当然需要HTTP POST和GET请求到服务器进行索引和查询。因此,由于索引实际上只是文件,我想知道是否有一种方法可以在HTML文件中仅使用Javascript离线查询它们(并且不需要为Solr启动本地Web服务器),也许使用Lucene而不是Solr?

回答

1

感谢您向我介绍一些完全用Javascript编写的文本搜索解决方案!我想查看代码进行文本搜索。


Lucene是用Java编写的,它需要一个Java(技术上JVM)进程访问。

PS1:如果您正在滚动自己的简单文本搜索,a stemmer in JS将使它更有用。

original: run running cat cats love loving crap crapping 
stemmed: run run cat cat love love crap crap 

PS2:您也可以运行另一个“Ngram-ized”指数进行拼写检查。


+0

谢谢,如果我没有记错的第一个环节是服务器端(?),但第二个看起来很有趣,我会玩它一点点,并尽快给您 – user1263226 2012-04-30 22:24:29

+0

我看到_“..你可以在浏览器中使用它”_因此我也将它包括在内 – aitchnyu 2012-05-01 05:01:41

+0

看了一下Ladders解决方案后,它不能满足我的需求,所以不是“接受”它,而是我投票支持它,因为如果我找不到现成的解决方案,它确实给了我一个如何继续使用定制解决方案的想法。 – user1263226 2012-05-07 21:47:47