我已经开始使用Jython,因为它似乎是一种优秀的语言,并且已被证明是迄今为止。需要帮助使Jython(dom4j)脚本更优美:)
我正在使用dom4j来处理和检索我在磁盘上的一堆HTML文件的DOM中的数据。我已经写了下面的脚本来检查扔DOM使用Xpath H1标签和抓取文本,如果H1标记不存在于DOM中,它然后搜索标题标记并从中抓取文本。
我对Jython非常陌生,但我确信有办法执行比以下方法更优雅的所需任务,如果我正确地思考这个问题,是否有人能够向我展示更好的方法做它?
elemHolder = dom.createXPath('//xhtml:h1')
elemHolder.setNamespaceURIs(map)
elem = elemHolder.selectSingleNode(dom)
if elem != None:
h1 = elem.getText()
else:
elemHolder = dom.createXPath('//xhtml:title')
elemHolder.setNamespaceURIs(map)
elem = elemHolder.selectSingleNode(dom)
if elem != None:
title = elem.getText()
else:
title = "Page does not contain a H1 or title tag"
如果有人可以帮助它会很好。干杯
我得到了这个概念,并调整了它的工作。干杯队友 – RailsSon 2008-10-23 21:37:15