2008-11-07 44 views

回答

0

我想是没有的(至少是人气很足,在这里用户要注意的)。

我们已经开始编码我们自己的搜索系统。

1

楼主的评论澄清这个答复是什么,他正在寻找本质上是“greplike搜索,但通过HTTP”,并提到他正在寻找使用小硬盘的东西因为他正在使用嵌入式系统。

我不知道任何相关的项目,但你可能想看看你的语言选择的HTML解析器和xquery实现。你应该能够照顾前者的“现实生活”的html混乱,并写出一个几乎与后者一样详细的搜索。

我假设你将会使用一组将被提供或已经存储在本地的url,因为在嵌入式设备中实际抓取整个web,发现链接等的想法是不切实际的。

虽然具有良好的HTML/XQuery实现,你有工具来提取所有的链接..

我原来的答案,这是真的澄清要求:

不知道是什么你意思是。你如何看待没有索引的搜索工作?为每个查询检索网页?通过谷歌管道?或者你指的是你试图避免的特定类型的搜索索引文件?

+0

>>你如何描述没有索引的搜索? 我把它看成是像grep一样的搜索,但是通过HTTP。 >>为每个查询抓取网页? 是的。 >>通过谷歌管道? 否 我正在避免创建索引文件,因为在嵌入式环境中磁盘空间稀缺。 – ksuralta 2008-11-07 02:11:37

1

你的意思是:

search.cgi

#/bin/sh 
arg=`echo $QUERY | sed -e 's/^s=//' -e 's/&.*$//'` 
cd /var/www/httpd 
find . -type f | xargs egrep -l "$arg" | awk 'BEGIN { 
     print "Content-type: text/html"; 
     print ""; 
     print "<HTML><HEAD><TITLE>Search Result</TITLE></HEAD>"; 
     print "<BODY><P>Here are your search results, sorry it took so long.</P>"; 
     print "<UL>"; 
    } 
    { print "<LI><A HREF=\"http://yourhost.com/" $1 "\">" $1 "</A></LI>"; } 
    END { 
     print "</UL></BODY>"; 
    }' 

未经测试...

+0

嗯..类似的东西..但是,更精致的版本:) 因为它会像预期的那样缓慢,所以我想在用户等待时显示部分结果。 – ksuralta 2008-11-07 02:22:54