phrase

    2热度

    2回答

    我使用solrj作为索引solr服务器上的文档的客户端 我是solr的新手,我在solr中突出显示有问题。使用solr突出显示精确的短语不起作用。 例如,如果关键词是: “杜尔塞HOGAR” 返回: <i> dulce </i> <i> hogar </i> 它应该是: <i> dulce hogar </i> 我不明白这是问题。 我schema.xml中 <fieldType name=

    0热度

    1回答

    这是我想复制的参考pdf。 http://www.depo.com.tw/asp/pdf/R_VW_PASAT_2.pdf 我工作的PDF目录和我试图输出像红色文本区域。 正如你们可以在PDF中看到的,输出字母441-11B2-LDHEM非常简单。但是,输出441-11A7-LD/RD-EM1不是。 private void PlaceChunck(String text, int x, int

    8热度

    2回答

    我将使用Stanford Corenlp 2013来查找短语头。我看到了this thread。 但是,得到的答复是,我不清楚,我不能添加任何评论继续该线程。所以,我很抱歉重复。 我目前所面对的是什么(使用斯坦福Corenlp)一个句子解析树(我也试图与它由斯坦福Corenlp创建CONLL格式)。而我所需要的正是名词短语的头脑。 我不知道我该如何使用依赖性和解析树中提取nounphrases的头

    0热度

    2回答

    我一直在使用Stanford Parser进行CFG分析。我可以将输出显示为树状结构,但我真正想要的是标记的数量。 这样我就可以出去,例如(从another query采取堆栈溢出): (ROOT (S (NP (PRP$ My) (NN dog)) (ADVP (RB also)) (VP (VBZ likes) (NP (JJ eating) (NN sausage))) (. .)))

    0热度

    1回答

    我有一个填充了某些值的表格,例如 | CODE | NAME | NB: THIS IS A VERY BASIC EXAMPLE | zygnc | oscar alpha | | ab-cd | delta tiger | | fsdys | delta bravo | 使用MySQL全文布尔搜索我想要搜索该表包含“三角洲”的所有名称,但不包括第一个结果其独特的代码“AB-CD的基

    0热度

    1回答

    我试图提取某人曾经在网站上登陆的keyphrase。而且,由于我拥有Google Analytics脚本,因此我应该可以获取cookie名称___utmz,然后查找字符串“utmctr = ....”来查找关键字。 然而,在Firefox中,不管是什么,我总是看到(未提供) utmcsr=google|utmccn=(organic)|utmcmd=organic|utmctr=(not%20pr

    2热度

    2回答

    我有一个文本字段,用户将输入逗号分隔的关键字或关键短语,然后服务器将使用这些值来检查多个文本匹配的主体。 所以基本上我需要的是匹配一个精确的短语,不区分大小写,与文本正文中的可能空格。 我很容易匹配的关键字,通过生成如下的正则表达式: 例关键字:peanut, butter, jelly 正则表达式生成的:/peanut|butter|jelly/i 但是具有空间不工作。 peanut butte

    -1热度

    2回答

    我有一个表格,其中列出了一些iframe。问题是他们有不同的尺寸。现在我想通过它们的大小对它们进行排序: 这里有一个例子:<iframe width="576" height="432" src="iframeadress" frameborder="0" allowfullscreen></iframe> 现在我想选择这些号码,以便他们通过它们的大小之一。我想到了一个PHP网站,我将宽度的数字作

    2热度

    1回答

    我一直在尝试做一个lucene搜索查询,在输入“Foo B”时会返回“Foo Bar”,Foo Bear,Foo Build等等,但不会返回ID为“富”,并在‘酒吧’中说的‘说明’字段。 我已经调查multiphrasequery但它永远不会返回任何结果,以下是我一直在努力 Term firstTerm = new Term("jobTitle", "Entry"); Term se

    1热度

    2回答

    我试图短语我的访问日志文件,要做到这一点,我只需逐行读取访问日志文件并从每行中提取有用的信息,最后将它们添加到数据库中。 例如,一条线看起来像这样。 124.99.152.202 - naveen [22/Nov/2013:10:41:17 +1300] "GET /p/V4ZkA5d074CTy_vbFa7nLw,1385070078/IneedThisInteger/12.txt HTTP/1