2016-11-15 88 views
-1

有一种正在读入RichTextBox的HTML(请参见下文)。 假设HTML中有多个<h3>标签,如下所示。我需要在c#中编写一个方法,它可以解析RichTextBox <h3>中的文本,并返回一个逗号分隔的字符串。使用C解析RichTextBox中的文本

与标签<h3>假设标题是

...<h3>Title1</h3> ... 
 
...<h3>Title2</h3> ... 
 
...<h3>Title3</h3> ...

然后,该方法应该返回 标题1,标题2,TITLE3。

我感谢你的帮助

+0

对不起,我不明白你的英语,什么是“棚标题”?你想从HTML中提取文本吗?你想以编程方式更改某些HTML的功能吗? – Jodrell

+0

我不太懂英文。我的标题除了文字html –

+2

它在皮肤上擦洗剂,或者再次得到软管 – MickyD

回答

0

也许你可以尝试这样的事情:

 string value = @"...<h3>Title1</h3> ......<h3>Title2</h3> ......<h3>Title3</h3> ..."; 

     List<string> ListOfTags = new List<string>(); 

     string[] split1 = value.Split(new string[] { "<h3>" }, StringSplitOptions.RemoveEmptyEntries); 
     foreach (var item in split1.Skip(1)) 
     { 
      string[] split2 = item.Split(new string[] { "</h3>" }, StringSplitOptions.RemoveEmptyEntries); 
      ListOfTags.Add(split2[0]); 
     } 
     var result = String.Join(", ", ListOfTags.ToArray()); 

     Console.WriteLine(result); 
     //Output => Title1, Title2, Title3