search-engine

    1热度

    1回答

    我们知道,使用Lucene或着名搜索引擎Google的elasticsearch将保持索引文档中单词的偏移距离,以获得更好的结果。上述两种软件都在上执行索引和搜索,其数据量非常大()。什么是特殊的索引(或数据结构)或算法,以实现内部的高效和快速?那么成本(时间和空间)呢?是否有网页或文档解释Google或elasticsearch(lucene)使用的偏移距离算法?下面是我想要创建自己的图片。

    0热度

    2回答

    是否可以将Solr字段配置为具有多个/拆分的过滤器链?例如,我可以创建一个过滤器链,看起来像这样?: StandardTokenizer ↓ LowerCaseFilter ↙ ↘ SynonymnFilter PhoneticFilter ↓ NGramFilter 我已经做了相当多的搜索,并没有发现建立一个过

    0热度

    1回答

    我正在制作一个可以返回谷歌图片的节点应用程序,我正在使用node-google-image-search应用程序来帮助我这样做。我创建了一个名为“env.env”一个.ENV文件并导入应用程序与 const imageSearch = require('node-google-image-search'); const dotenv = require('dotenv').config({pat

    0热度

    1回答

    我正在寻找一个项目,一个简单的,我可以发送查询并通过API获取结果集的一个很好的搜索引擎API。 Google,bing,yahoo似乎都停止提供这些服务,Faroo要求我有一个实际的网站。 谢谢

    1热度

    2回答

    我想弄清楚谷歌的搜索运算符和如何工作的应用程序,我目前正在建设。 我发现这篇文章: https://supple.com.au/tools/google-advanced-search-operators/ ,指出谷歌使用AND运算符作为默认搜索操作时 但是我想一些例子,这似乎并没有成为整个故事 例如,当我搜索: 谷歌搜索词:珀斯旅游海上冲浪 它给了我比: Google搜索词:珀斯旅游海 这怎么可

    0热度

    1回答

    我正在简单搜索我的博客。我使用亚美尼亚语,当我搜索时,这些字母总是有意义的。这是我的代码的一部分。先谢谢你。 search_query = get.get('search') query_list = search_query.split() posts = post.objects.filter( reduce(operator.and_, (Q(title

    -1热度

    1回答

    我在我的网站上有大约100页的内容,我不想在google中被索引...有什么方法可以用robots.txt来阻止它。 .It'd很烦人编辑每个页面,添加noindex元标记.... 所有这一切我想阻止是这样的URL ... www.example.com/index-01 html的 www.example.com/index-02.html www.example.com/index-03.ht

    0热度

    1回答

    背景问题 大家好,我是工作在一堆根据所提供的查询文档中搜索相关文件的项目。由于这是一个小型项目,我有一个典型的内存体系结构,我假设我没有更多的100个文档,每个文档包含不超过1000个单词(一个单词不超过10个字符)。我收到很多查询,并且必须尽快处理查询(绝对不会超过一秒)。 我的第一种方法(天真和不可扩展): 由于允许用户上传文件,每当我收到一个文档,我找了“势”的关键字和存储关键字作为关键并将

    0热度

    1回答

    我将robots.txt文件添加到本地Web服务器的根目录。 服务器上的robots.txt文件的url是http://localhost/myserver/robots.txt。 robots.txt文件的内容是 User-agent: * Disallow:/ 我如何验证robots.txt文件适用于本地Web服务器? 我是否需要在本地安装一些网络爬虫或搜索引擎并运行它来验证? 谢谢。

    3热度

    2回答

    我建立一个小的搜索引擎在全世界范围内取多次往返,这里是我的旅程表看起来像: 正如你所看到的,departure_checkpoint和arrival_checkpoint是链接,这是一个完整的旅程,所有这些目的地属于同一个announce_id号码2.我现在想要做的是创建一个表格,在其中插入您的出发点和到达点,搜索引擎将返回包含这些目的地的announce_id。很容易将并排位置(如巴黎)转到伦敦