以下是样本文本删除文本文件中的注释
|英语停用词表。评论以竖线开始。每停止一次 |单词在一行的开头。
|下面的许多表格都非常少见(例如“你们自己”),但包括在内 |完整性。
| PRONOUNS FORMS
| 1st person sing
i |主题,当然大写当然
我|对象
我的|所有格形容词
我想删除所有出现在右侧栏的文字,包括栏本身,我在正则表达式中遇到了一点困难。
这是我一直在努力的代码
FileReader reader = new FileReader("C:\\Users\\Masood\\Desktop\\IR\\Programming\\Material\\stopwords.txt");
StringBuilder sb = new StringBuilder();
BufferedReader br = new BufferedReader(reader);
String line;
String source2 = null;
while ((line=br.readLine()) != null) {
line.replaceAll("[|(.*)]","");
sb.append(line);
}
String source = sb.toString();
System.out.println(source);
I输出是字符串“”我我我的',一切将会消失
尝试此正则表达式的表达式:|(。*)[] [\ n]的 –