2015-01-13 32 views
0

我正在使用CXF和Spring以及Hibernate Search。在hibernate中索引文件内容的最佳实践搜索

我有一个主类有几个属性,其一个属性的类型是附件(文件)。我将存储数据库中的所有属性,除了将存储在文件系统上的附件(文件)。

所以现在我的查询是:

如果用户给出的附件(文件内容)一些字符串的话,我应该返回主类,其附件(文件)包含这些定字符串的对象。

所以我应该如何使用索引文件内容来实现我的要求。

请提示我以优化的方式做到这一点。

回答

0

如果您需要从pdf,doc等文件中提取Apache Tika您可以实现此目的。任何方式只是为你的文件写字段桥。

public class FileContentBridge implements StringBridge { 

    public String objectToString(Object object) { 

    //extract file content 
     return "extracted"; 
    } 
} 

应用桥梁

@FieldBridge(impl = FileContentBridge.class) 
private File attachment;