是否有一个不使用搜索索引文件的开源Web搜索库？

我正在寻找一个不使用搜索索引文件的开源Web搜索库。你知道吗？是否有一个不使用搜索索引文件的开源Web搜索库？

感谢，肯尼斯

来源

2008-11-07 ksuralta

我想是没有的（至少是人气很足，在这里用户要注意的）。

我们已经开始编码我们自己的搜索系统。

来源

2009-03-26 08:50:08 ksuralta

楼主的评论澄清这个答复是什么，他正在寻找本质上是“greplike搜索，但通过HTTP”，并提到他正在寻找使用小硬盘的东西因为他正在使用嵌入式系统。

我不知道任何相关的项目，但你可能想看看你的语言选择的HTML解析器和xquery实现。你应该能够照顾前者的“现实生活”的html混乱，并写出一个几乎与后者一样详细的搜索。

我假设你将会使用一组将被提供或已经存储在本地的url，因为在嵌入式设备中实际抓取整个web，发现链接等的想法是不切实际的。

虽然具有良好的HTML/XQuery实现，你有工具来提取所有的链接..

我原来的答案，这是真的澄清要求：

不知道是什么你意思是。你如何看待没有索引的搜索工作？为每个查询检索网页？通过谷歌管道？或者你指的是你试图避免的特定类型的搜索索引文件？

来源

2008-11-07 01:54:01 SquareCog

>>你如何描述没有索引的搜索？我把它看成是像grep一样的搜索，但是通过HTTP。 >>为每个查询抓取网页？是的。 >>通过谷歌管道？否我正在避免创建索引文件，因为在嵌入式环境中磁盘空间稀缺。 – ksuralta 2008-11-07 02:11:37

你的意思是：

search.cgi

#/bin/sh 
arg=`echo $QUERY | sed -e 's/^s=//' -e 's/&.*$//'` 
cd /var/www/httpd 
find . -type f | xargs egrep -l "$arg" | awk 'BEGIN { 
     print "Content-type: text/html"; 
     print ""; 
     print "<HTML><HEAD><TITLE>Search Result</TITLE></HEAD>"; 
     print "<BODY><P>Here are your search results, sorry it took so long.</P>"; 
     print "<UL>"; 
    } 
    { print "<LI><A HREF=\"http://yourhost.com/" $1 "\">" $1 "</A></LI>"; } 
    END { 
     print "</UL></BODY>"; 
    }'

未经测试...

来源

2008-11-07 02:14:03

嗯..类似的东西..但是，更精致的版本:) 因为它会像预期的那样缓慢，所以我想在用户等待时显示部分结果。 – ksuralta 2008-11-07 02:22:54

是否有一个不使用搜索索引文件的开源Web搜索库？

回答

相关问题