0
我目前正在开发一个项目,在那里我需要比较两个文本文档,文档1中出现的所有文字,在文档2中重复,不管其位置如何的话。例如,如果文档1包含一个出现10个单词“in”的段落,则文档2也必须包含10个出现的“in”。如果单词放在不同的位置,没问题。我该怎么做?.....提前致谢。比较两个文档中出现的所有文字
我目前正在开发一个项目,在那里我需要比较两个文本文档,文档1中出现的所有文字,在文档2中重复,不管其位置如何的话。例如,如果文档1包含一个出现10个单词“in”的段落,则文档2也必须包含10个出现的“in”。如果单词放在不同的位置,没问题。我该怎么做?.....提前致谢。比较两个文档中出现的所有文字
建立一个Map<String,Integer>
您可以在其中计算每个单词的出现次数。如果两个文件的地图相同,则您有“匹配的文件”。
Map<String,Integer> docToMap(String[] document) {
Map<String,Integer> map = new HashMap<>();
for (String s:document) {
Integer n=map.get(s);
n= n==null?1:(n+1);
map.put(s,n)
}
}
http://mattgemmell.com/2008/12/08/what-have-you-tried/ – 2013-03-19 14:02:35