2017-05-02 43 views
0

我刮从网页HTML看起来像这样的价值观:我成功地使用Python的分区两次是否有一个Python命令返回夹在两个标识符之间的字符串?再次ID字符串<code>MAIN BUILDING</a> :</code>后,以节省一切,然后<code><br /></code>之前保存的部分:

location=1">MAIN BUILDING</a> : -25.49<br /> 

使用分区两次似乎不太可怕。但有没有更好的方法来做到这一点?似乎应该有办法在一个步骤中提取夹在两个其他字符串之间的字符串,而不是两个字符串。

+0

我怀疑你想要的功能是一个“正则表达式”,使用“捕获”功能。这些应该足以让你在网上找到一个例子,并避免得到任何被认为是“重复”的答案。 – Prune

+0

http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454 – lolopop

+8

[获取解析器。](https://www.crummy。 com/software/BeautifulSoup /)它会更加有效和可靠。 – user2357112

回答

0

您可以使用str.index与Python字符串索引的一个班轮:

>>> s = 'location=1">MAIN BUILDING</a> : -25.49<br />' 
>>> begin = 'MAIN BUILDING</a> :' 
>>> end = '<br />' 
>>> s[s.index(begin):s.index(end)] 
'MAIN BUILDING</a> : -25.49' 

这是假设的东西:

  1. ,你将包括在划界问题字符串的精确文本。
  2. 两段文字都只出现一次。
相关问题