2014-10-11 45 views
0

在我上传数据的openrefine中,单击文本构面然后进行聚类。它创建集群。就像Aniket Ghodke和Ghodke Aniket一样,它会建议合并它们。但有什么方法可以存储这些值。如果我将“Aniket Ghodke”和“Ghodke Aniket”合并为“Aniket Ghodke”,那么我可以将这些值存储为我的更多参考。我准备好使用Python或Java库。但有可能。打开优化文本构面群集

回答

0

您可以通过GREL调用大部分群集函数,如ngram(value,4)fingerprint(value)。您可以将结果存储在一个新列或一个方面,以查看结果。

This blog post解释如何使用它们。