2011-04-26 92 views
0

我们目前正在做一个抄袭检测两个文本文档的项目。我们必须比较两份提交的文件并提供比较结果。为此我想并排展示这两个文档,并突出显示GUI中文档之间的相似点。我使用各种算法来获得两个文档(如向量空间和瓦片云算法)之间的相似度分数。但他们不提供具有相似性的部分,我必须将它们呈现给图形界面中出现相似性的用户。可视化文档相似点

感谢名单 Nuwan

+0

你的具体问题是? – MeBigFatGuy 2011-04-26 04:09:27

+0

如何以图形方式(不是在图表中但应突出显示相似区域)代表相似区域?有什么方法(用位置索引字的算法)可以这样做? – Nuwan 2011-04-26 05:22:02

回答

0

如果真的是图形?你正在比较文字。你似乎想要坚持一个文本界面。但是,您可以使用Swing快速创建一些内容。我可能会首先打印文档共享的带状疱疹以及一些上下文。我也尝试过寻找一些你可以使用的现成的差异引擎,但总结不足。也许你实际上可能会以某种方式将Unix diff工具整合到你的应用程序中?