2011-04-25 87 views
1

我在HTML代码中有多个p标签。C#中的正则表达式分组#

<p class=MsoNormal><b style='mso-bidi-font-weight:normal'><span 
style='font-size:7.0pt'>PA<span style='mso-spacerun:yes'> </span>ARALIĞI</span></b><span 
style='font-size:7.0pt'> [İng. <b style='mso-bidi-font-weight:normal'>PA 
interval</b>]. (<i style='mso-bidi-font-style:normal'>Kardiyoloji</i>). 
Atriyum’un P dalgasının başlangıcını ayıran mesafe. İntraatriyal ya da 
sino-nodal iletim süresinin (35-45 milisaniye) ölçümünü verir. Uzaması ileti 
bozukluğunun göstergesidir. <o:p></o:p></span></p> 

<p class=MsoNormal><b style='mso-bidi-font-weight:normal'><span 
style='font-size:7.0pt'>PA<span style='mso-spacerun:yes'> </span>ARALIĞI</span></b>  <span 
style='font-size:7.0pt'> [İng. <b style='mso-bidi-font-weight:normal'>PA 
interval</b>]. (<i style='mso-bidi-font-style:normal'>Kardiyoloji</i>). 
Atriyum’un P dalgasının başlangıcını ayıran mesafe. İntraatriyal ya da 
sino-nodal iletim süresinin (35-45 milisaniye) ölçümünü verir. Uzaması ileti 
bozukluğunun göstergesidir. <o:p></o:p></span></p> 

我怎样才能得到他们在列表中作为不同的索引。我需要将每个p作为列表中的成员。我的代码是:

Regex Rx = new Regex(@"<p(.*)>(.*)<\/p>",RegexOptions.Multiline); 
    MatchCollection mc = Rx.Matches(yazi); 

感谢

回答

2

是一个非常糟糕的主意用正则表达式解析HTML。 HTML的语法太复杂。

改为使用HTML解析器:Looking for C# HTML parser