2011-08-25 41 views
4

我正在使用solrj 1.4。我的solrj没有正确编制UTF-16编码文件。我猜想当它试图转换为unicode时,它用unicode可替换字符U + FFFD替换有问题的utf-16替代键。任何人都可以指导我如何配置solrj 1.4索引/搜索utf-16文件以及utf-8?Solr vs文档编码问题

回答

1

Solr索引是utf-8(Why don't International Characters Work)。为了能够使用其他编码进行搜索,您始终可以在软件接口Solr中执行翻译。

+0

从utf-16到utf-8的转换始终100%成功。有没有可用的傻瓜证明方法或API? – user911084

+0

傻瓜证明我不知道,但[CharsetEncoder](http://download.oracle.com/javase/6/docs/api/java/nio/charset/CharsetEncoder.html)通常很方便。 –