2016-10-04 44 views
-1

我在句子中间有一个带有标记的xml文件。 例如:#his/her_caps#测试完成。如何查找表达式并将其替换为某些文本?

我想在xml文件中搜索任何#(文本)#标记并将其替换为它的合适代词,因此上面的标记将替换为他或她。如何搜索#(文本)#表达式?

我不明白如何使用tokenizer,如果这是我会用,不知道如何正确的正则表达式。

我正在完成别人开始的项目,这是他们的,但他们不能让它工作。我只是想知道如何搜索XML文件的标签。

尝试之一:

File inputXML = new File("template.xml"); // creates new input file 
     DocumentBuilderFactory parser = DocumentBuilderFactory.newInstance(); // new instance of doc builder 
     DocumentBuilder dParser = parser.newDocumentBuilder(); // calls it 
     Document doc = dParser.parse(inputXML); // parses file 
     doc.getDocumentElement().normalize(); 

     NodeList pList = doc.getElementsByTagName("Verbiage"); // gets element by tag name and places into list to begin parsing 

     int gender = 1; // gender has to be taken from the response file, it is hard coded for testing purposes 
     //System.out.println("----------------------------"); // new line 

     // loops through the list of Verbiage tags 
     for (int temp = 0; temp < pList.getLength(); temp++) { 
      Node pNode = pList.item(0); // sets node to temp 

      if (pNode.getNodeType() == Node.ELEMENT_NODE) { // if the node type = the element node 
       Element eElement = (Element) pNode; 
       NodeList pronounList = doc.getElementsByTagName("pronoun"); // gets a list of pronoun element tags 

       if (gender == 0) { // if the gender is male 

        int count1 = 0; 
        while (count1 < pronounList.getLength()) { 

         if ("#resp_he/she_lc#".equals(pronounList.item(count1).getTextContent())) { 
          pronounList.item(count1).setTextContent("he"); 
         } 

         if ("#resp_he/she_caps#".equals(pronounList.item(count1).getTextContent())) { 
          pronounList.item(count1).setTextContent("He"); 
         } 

         if ("#resp_his/her_lc#".equals(pronounList.item(count1).getTextContent())) { 
          pronounList.item(count1).setTextContent("his"); 
         } 
         if ("#resp_his/her_caps#".equals(pronounList.item(count1).getTextContent())) { 
          pronounList.item(count1).setTextContent("His"); 
         } 

         if ("#resp_him/her_lc#".equals(pronounList.item(count1).getTextContent())) { 
          pronounList.item(count1).setTextContent("him"); 
         } 
         count1++; 
        } 
        pNode.getNextSibling(); 

       } else if (gender == 1) { // female 
        int count = 0; 
        while (count < pronounList.getLength()) { 

         if ("#he/she_lc#".equals(pronounList.item(count).getTextContent())) { 
          pronounList.item(count).setTextContent("she"); 
         } 

         if ("#he/she_caps#".equals(pronounList.item(count).getTextContent())) { 
          pronounList.item(count).setTextContent("She"); 
         } 

         if ("#his/her_lc#".equals(pronounList.item(count).getTextContent())) { 
          pronounList.item(count).setTextContent("her"); 
         } 
         if ("#his/her_lc#".equals(pronounList.item(count).getTextContent())) { 
          pronounList.item(count).setTextContent("Her"); 
         } 

         if ("#him/her_lc#".equals(pronounList.item(count).getTextContent())) { 
          pronounList.item(count).setTextContent("her"); 
         } 
         count++; 
        } 
        pNode.getNextSibling(); 
       } 
      } 
     } 
+0

你能帮我们解决你试过的代码吗? – Tauqir

+2

'xmlString = xmlString.replace(“## his/her_caps ##”,“她”);'? – Bohemian

+0

@Tauqir我还没有找到如何做到这一点,为什么我在这里哈哈。我不知道是否使用标记器,或者是否有其他方法来搜索表达式。 – Felicia

回答

0

使用正则表达式在记事本++

^#{0,}#$,应找出所有与#

的事情不记得了。 #需要被转义(#)。我不这么认为。

此外,如果你需要找到他或她的具体可以添加。 ^#。{0,}他的。{0,}#$

+0

如果您使用^#(。{0,})his(。{0,})#$。要找到它,你可以用#\ 1His \ 2# –

+0

替换它。我不知道如何正则表达式工作...这是我的问题的一部分哈哈。我在记事本++中使用正则表达式做什么? – Felicia

+0

使用搜索/替换功能,我认为这是在顶部编辑。 –