2010-08-14 436 views
0

我是一个PHP新手。我试图在下面的程序中使用preg_match_all函数来查找所有主题与他们的标记,但我只得到一个匹配。我一直在为此奋斗了5个小时。有人能帮我弄清楚什么是错的吗?提前致谢。preg_match_all只返回一个匹配

<?php 
$semArray="<B>STUDENTS NAME (7ab05cs001) </B><br><br><br><br><hr><table><tr><td><b>Semester:</b></td><td><b>2</b></td><td></td><td> &nbsp;&nbsp;&nbsp;&nbsp;<b> Result:&nbsp;&nbsp;FIRST CLASS </b></td></tr></table><hr><table><tr><td width=250>Subject</td><td width=60 align=center>External </td><td width=60 align=center>Internal</td><td align=center width=60>Total</td><td align=center width=60>Result</td></tr><br><tr><td width=250><i>Engineering Maths - II (06MAT21)</i></td><td width=60 align=center>51</td><td width=60 align=center>16</td><td width=60 align=center>67</td><td width=60 align=center><b>P</b></td></tr><tr><td width=250><i>Engineering Chemistry (06CHE22)</i></td><td width=60 align=center>40</td><td width=60 align=center>17</td><td width=60 align=center>57</td><td width=60 align=center><b>P</b></td></tr><tr><td width=250><i>Computer Concepts and C Programming (06CCP23)</i></td><td width=60 align=center>70</td><td width=60 align=center>23</td><td width=60 align=center>93</td><td width=60 align=center><b>P</b></td></tr><tr><td width=250><i>Computer Aided Engineering Drawing (06CED24)</i></td><td width=60 align=center>50</td><td width=60 align=center>16</td><td width=60 align=center>66</td><td width=60 align=center><b>P</b></td></tr><tr><td width=250><i>Basic Electronics (06ELN25)</i></td><td width=60 align=center>42</td><td width=60 align=center>17</td><td width=60 align=center>59</td><td width=60 align=center><b>P</b></td></tr><tr><td width=250><i>Computer Programming Lab (06CPL26)</i></td><td width=60 align=center>46</td><td width=60 align=center>24</td><td width=60 align=center>70</td><td width=60 align=center><b>P</b></td></tr><tr><td width=250><i>Engg. Chemistry Lab (06CHEL27)</i></td><td width=60 align=center>41</td><td width=60 align=center>19</td><td width=60 align=center>60</td><td width=60 align=center><b>P</b></td></tr><tr><td width=250><i>Environmental Studies (06CIV28)</i></td><td width=60 align=center>48</td><td width=60 align=center>25</td><td width=60 align=center>73</td><td width=60 align=center><b>P</b></td></tr></table><br><br><table><tr><td></td><td></td><td>Total Marks:</td><td> 545 &nbsp;&nbsp;&nbsp; </td></tr></table>"; 
function get_result_for_this_sem($semArray) 
{ 

preg_match("/Semester:<\/b><\/td><td><b>(.)<\/b>/",$semArray,$temp1); 
$sem_no=$temp1[1]; 
preg_match("/Result:&nbsp;&nbsp;(.+)<\/b><\/td><\/tr><\/table><hr><table>/U",$semArray,$temp2); 
$sem_final_result=$temp2[1]; 
preg_match_all("/<i>((.+?)\((.+?)\))<\/i><\/td><td width=60 align=center>([0-9]{1,3})<\/td><td width=60 align=center>([0-9]{1,2})<\/td><td width=60 align=center>([0-9]{1,3})<\/td><td width=60 align=center><b>(.)<\/b><\/td><\/tr>/",$semArray,$temp3,PREG_SET_ORDER); 

print_r($temp3); 

} 
get_result_for_this_sem($semArray); 
?> 

这里是我得到的输出:

Array ([0] => Array ([0] => Engineering Maths - II (06MAT21)511667P [1] => Engineering Maths - II (06MAT21) [2] => Engineering Maths - II [3] => 06MAT21 [4] => 51 [5] => 16 [6] => 67 [7] => P)) 
+5

您不应该尝试使用正则表达式解析HTML。改为使用适当的HTML分析器。 – Gumbo 2010-08-14 17:52:30

+2

试图阅读正则表达式时,我的眼睛受伤。 – 2010-08-14 17:52:54

回答

3

你复制和粘贴文字HTML到您的正则表达式。在第一个主题的部分中有一个双空间,在以下部分中不存在,并且您从字面上匹配该双空间。

<td width=60 align=center><b>P</b></td> 
+0

谢谢你的回复,但我没有正确理解。你能建议一些解决方案吗? – user420528 2010-08-14 18:11:46

+0

更好的解决方案,使用HTML解析器:http://stackoverflow.com/questions/292926/robust-mature-html-parser-for-php – 2010-08-14 18:14:15

+1

从数据和正则表达式中删除双空间。这将解决眼前的问题(虽然不是更深的问题,这是正则表达式真的是工作的错误工具)。 – JimG 2010-08-14 18:15:08