2011-03-07 50 views
0

我有一个html文件,它被读为一个字符串..我想解析并获取值使用<TD colSpan=2>Value : 因此,我应该从html文件获得大约10个值。我怎么能做到这一点..我想使用类似解析HTML为字符串以获取使用关键字的值

的startIndex endIndex的getsubstring

sMainBeginKeyword = "<td>Value : "; 
    sBeginKeyword = "<td>Value : "; 
    sEndKeyword = "</td>"; 

    main_begin_index = result.indexOf(sMainBeginKeyword); 
    while (main_begin_index != -1) { 
    begin_index = main_begin_index; 
    end_index = result.indexOf(sEndKeyword, begin_index); 
    String deloc= result.substring(begin_index + sBeginKeyword.length(), end_index); 

但是,这看起来很复杂,我无法获取更多的价值。由于我有很多值与不同的关键字..

回答

0

这种事情确实需要使用XML或DOM解析器来完成:试图通过字符串搜索来完成它,这是为失败而设置的。

如果您将HTML加载到XML或DOM解析器中,您尝试执行的任务将很容易实现,以便使用XPath表示法来查找相关元素。

您尚未指定您正在使用哪种语言或平台(并且您提供的代码示例也不足以确定),因此很难做出更具体的说明。

希望有所帮助。