我试图解析一个网页。 基本上它被存储在一个字符串,它看起来就像这样:PHP正则表达式:忽略定义的子串之前的所有内容
"[HTML CODE ...]world:[HTML CODE ...]my_number[REST OF HTML_CODE ...]"
当然,“世界”和“MY_NUMBER”是HTML代码的一部分,不过,我想第一次出现之前,不顾一切“世界:”。我需要的是在第一次出现“world:”之后出现的第一个数字,牢记一堆html代码会介于这两个数字之间。 我可以子字符串的HTML代码,但我想这样做只是通过使用一个正则表达式,如果可能的话。
这是正则表达式我试图匹配:
'/(?<=world:)\D+?[0-9]+/'
但这返回我的“世界”之间的所有HTML的东西,我的电话号码。
谢谢!
您可以删除之前的一切,包括“世界”,然后找到剩下的字符串中的第一个号码。 – Thai
正如我写的,我可以将html代码子字符串,但我只想在可能的情况下仅使用正则表达式来完成此操作。没有特别的原因,我只是想提高我的正则表达式知识 – user586883