full-text-indexing

    14热度

    2回答

    想知道在elasticsearch中多语言索引和搜索中使用的最佳实践或经验是什么?我读了很多资源,尽我所能提取索引的可用选项有: 每种语言的单独索引; 多字段字段的多字段类型; 用于所有可能语言的单独字段。 所以,想知道选择这些选项(或其他一些我错过的)的副作用是什么。我想有更多的索引并不会真的减慢集群的速度(如果它不是很多的语言),所以不知道我会从选择2或3中得到什么,除非可能更容易维护。 欢迎

    1热度

    1回答

    我想知道是否有办法查看SQL Server 2012索引表中所有数据需要多长时间? 在我的示例中,我创建表格,创建索引并将人口设置为手动。然后我执行 ALTER FULLTEXT INDEX ON table_name START UPDATE POPULATION; 该查询立即执行,但据我所知,人口过程实际上是在后台执行的。我怎样才能知道索引整个表所花费的总时间是多少?

    0热度

    2回答

    目前我正在使用PostgreSQL + ElasticSearch的项目中工作。不过,我最近发现了VoltDB,而且我想知道是否仍需要使用ElasticSearch进行VoltDB搜索。 如果我没问题,elasticSearch从另一个关系数据库中获取来自PostgreSQL的数据,并且它们使用关系数据库索引对数据进行重新索引以使其更快地生成查询。这是因为ElasticSearch中存储的数据不是

    0热度

    1回答

    我正在使用orientdb,并做索引,但我的索引引擎是sBTree我想o更改为Lucene做什么? public static void main(String[] args) throws IOException { OrientGraph graph = null; try { OrientGraphFactory factory =

    1热度

    1回答

    在SQL Server 2008中,是否有可能使用全文索引语法来运行此类查询? SELECT * FROM TABLE_TO_SEARCH S, TABLE_WITH_STRINGS_TO_SEARCH SS WHERE CONTAINS(S.WHOLE_NAME,SS.FIRST_NAME) OR CONTAINS(S.WHOLE_NAME,SS.LAST_NAME) 我需

    0热度

    1回答

    我们有一个存储过程,它接受几个参数,但只有其中一个参数具有一个值,用于过滤结果集。 SELECT声明本身包含多个连接,并且有点长。 为避免多次复制粘贴查询,我希望能够在WHERE子句中使用IF或CASE语句。问题是,我们使用的全文索引和CONTAINS声明,我不是很清楚如何注入一个IF或CASE声明内/ CONTAINS条款外,这样的事情: SELECT * FROM [QUERY] WHERE

    0热度

    1回答

    我有大约500个文本文件(总共大约6 MB),我需要在我的Windows Phone应用程序中用作资源。 我的应用程序正在搜索用户在资源中给出的字符串,并返回包含要显示给用户的字符串的文件。 I'm寻找做这种搜索的正确的方式,我有3个观点: 迭代的每个搜索文件,请使用String.Contains找到指定的字符串。 将文件预加载到内存中,在每次搜索时对其进行迭代(它在内存中,但大约需要6 MB)。

    1热度

    1回答

    我有一个SQL Server 2005,我们正在我们的一个表上运行全文索引。用户经常想要搜索皮划艇2或帐篷4,基本上搜索2人皮艇或4人帐篷。 我从ENU噪声列表中删除了所有的单个数字位并重建索引。它仍然没有返回单个数字的搜索。 原来是... SELECT * FROM products WHERE CONTAINS(description, 'FORMSOF(INFLECTIONAL, kay

    0热度

    1回答

    我在我的表中添加了一个全文索引列。当我编写一个查询来执行包含在特定列上的查询时,查询将输出与包含匹配的记录以及在3-4小时之前和之后添加到表中的记录的输出。即使文本与包含文本相匹配,最近添加到表格中的那些记录也不会显示在输出中。 Create table Table1 (Id int, Name varchar(20), Message varchar(1000), CreatedAt datet

    0热度

    1回答

    我想用Lucene在一些文档中实现文本搜索。该文件是在一个表中提供已经符号化: |documentID|token|position| “documentID”是文档令牌处于 “位置”描述的ID,在该文档中的位置的标记写入 我首先尝试创建索引来搜索令牌并返回documentID。所以我为每个documentID创建了一个Lucene文档。对于每个Lucene文档,我为本文档中的每个标记添加了一个I