问题是Conversion = "_"
。源代码在这里。我试图读取一个TXT和它的好!然后代码“标记化”这些单词并且它也可以。但是,当我尝试保存在另一个文本文件中时,出现此错误。线程“main”中的异常java.util.UnknownFormatConversionException:Conversion ='_'
但是,如果我删除“__”它保存成功,但我不想删除“_”!
这是一个用于标记一些单词的程序。
我只想知道我该怎么做。或者我可以做什么来运行我的项目没有这种例外。
Exception in thread "main" java.util.UnknownFormatConversionException: Conversion = '_'
at cugru.test.main(test.java:81)
在81行!!
下面是代码:
package cugru;
import java.io.BufferedReader;
import java.io.File;
import java.io.FileReader;
import java.io.FileWriter;
import java.io.IOException;
import java.io.PrintWriter;
import java.util.Locale;
import org.cogroo.analyzer.Analyzer;
import org.cogroo.analyzer.ComponentFactory;
import org.cogroo.text.Document;
import org.cogroo.text.impl.DocumentImpl;
public class test {
public static void main(String[] args) throws IOException {
FileReader reader = new FileReader(new File("D:/Felipe/Downloads/eclipse/workspace/java worskpace luna/Excel java/sumarios/gold sem tokens.txt"));
BufferedReader leitor = new BufferedReader(reader);
String linha = null;
int contadorTokens = 0;
FileWriter arq = new FileWriter("d:\\tabuada.txt");
PrintWriter gravarArq = new PrintWriter(arq);
//Cria procedimentos padrao do CoGrOO
ComponentFactory factory = ComponentFactory.create(new Locale("pt", "BR"));
Analyzer cogroo = factory.createPipe();
int qtde = 0;
while((linha = leitor.readLine()) != null) {
qtde++;
if(qtde >10)
break;
//linha = linha.toLowerCase(); //deixa em minusculo
//System.out.println(linha);
linha = expandirAcronimos(linha);
//System.out.println(linha);
//System.out.println("======================================");
/** for (int i = 0; i < sentenca.length; i++) {
sentenca = linha.split(" ");// separa a "linha" emdentro das aspas) e joga para o array sentenca
// System.out.println(sentenca[i]);ido acetil saliclico ");
// System.out.println(sentenca[i]);
sentenca[i] = sentenca[i].replace(" AAS "," ido acetil saliico ");
}**/
Document document = new DocumentImpl();
document.setText(linha);
cogroo.analyze(document);
for (org.cogroo.text.Sentence sentence : document.getSentences()) { // lista de sentencas
sentence.getStart(); sentence.getEnd(); // caracteres onde a sentenca comeca e termina
String texto_sentenca = sentence.getText(); // texto da sentenca
//Imprime sentenca
//System.out.println(texto_sentenca);
// Tokens
for (org.cogroo.text.Token token : sentence.getTokens()) { // lista de tokens
token.getStart(); token.getEnd(); // caracteres onde o token comeca e termina
token.getLexeme(); // o texto do token (palavra que ele separa e pega exp: "clinico"
token.getLemmas(); // um array com os possiveis lemas para o par lexeme+postag
token.getPOSTag(); // classe morfologica de acordo com o contexto("coloca "prp, adj,n(noun))
token.getFeatures(); // genero, numero, tempo etc
contadorTokens++;
System.out.println(token.getLexeme() + "_" + token.getPOSTag() + "_" + token.getFeatures());// imprime a palavra com o tag
gravarArq.printf(token.getLexeme() + "__" + token.getPOSTag() + "__" + token.getFeatures());
//System.out.println(token.getLexeme());
}
//System.out.println("Total de tokens sao: "+contadorTokens);
}
}
reader.close();
arq.close();
}
}
这篇文章有太多的错误。 – user3270760 2014-11-06 21:39:20
*“为什么我需要写很多和stackoverflow不让我发布问题?”*因为这是我们的房子,并在我们的房子,我们期望您阅读并遵循[我们的规则](http://stackoverflow.com /帮助/如何对问)。 – 2014-11-06 21:40:14
我知道...但我不得不删除一些东西,以stackoverflow让我张贴..你能帮我吗?我在第81行得到这个错误是:gravarArq.printf(token.getLexeme()+“__”+ token.getPOSTag()+“__”+ token.getFeatures()); – mightduck 2014-11-06 21:41:07