2011-09-27 95 views
3

我想制作一个程序来读取输入的文本并解析每个单词并将其存储在一个数据结构中,以便稍后可以对此有一些统计(词的频率,最常用的单词等)。Java文本阅读器

我需要两件事指导:

一个。我的“解析函数”的最佳方法,它将分割文本

b。数据结构选择的最佳方法,关注复杂性,访问时间和最适合的情况。

回答

0

根据你需要的其他统计数据,这听起来像你想要使用Map<String, Integer>。然后,对于每个键(您读入的单词),您可以存储多少次您读入它。其余的听起来像是功课...

4

一)为我的 “解析函数”

使用Scanner它有很好的功能next(字)等

二)datastruture选择

最好的方法最好的方法

从单词到统计对象的映射:Map<String, WordStatistics>

+0

字符串标记器工作得很好。很确定你可以陈述你想要标记的东西,这可能会让事情变得更容易。 – csaunders

+0

@csaunders我认为Scanner更简单,它有['next(Pattern pattern)'](http://download.oracle.com/javase/6/docs/api/java/util/Scanner.html# next(java.util.regex.Pattern))方法。 – dacwe