我想用php(file_get_contents?)读取一个网站,它隐藏着< span style ='display:none;' >。如何使用PHP从远程网页中提取隐藏的内容?
4的例子:
- ù<跨度风格= '显示:无;' > wsebv < /跨度> <ù> </U > rfahr
- Ž<跨度风格= '显示:无;' >Ë<我> </I >我<跨度> < /跨度> NHV < /跨度> <b> </B >öhrdorf
- 乙<我> </I >一个<我> </I > b <范围> < /范围> e <i> </i > n < span style ='display:none;' > einhv < /跨度> <ù> </U >伯格
- ķ<跨度风格= '显示:无;' > s <i> </i > d < span style ='display:none;' > d < span style ='display:none;' > b < span style ='display:none;' > n < span style ='display:none;' > v <i> </i > b < span style ='display:none;' >ħ<我> </I > gawe < /跨度> <ù> </U > AOI < /跨度> <b> </B > hvws < /跨度> <b> </B > AOIR < /跨度> <b> </b > asud </span > <b> </b > asu </span > <b> </b > irchdorf/Kr。
结果应该是:
- Urfahr
- Zöhrdorf
- 巴本贝格
- 基希多夫/氪。为解决这个问题
两种可能的方法(但我不知道如何来实现):
A)删除所有跨度标签与他们的内容
B)通过编程只读可见内容
非常感谢您的帮助!
那么你的两种方法做了什么?显示一些代码 – 2012-03-15 19:57:01
Uwsebvrfahr - 它是否在html?在浏览器中,它看起来像Urfahr?如果是这样,那么它只能被javascript解码(你可以通过在浏览器中禁用Javascript并重新加载页面来检查它)。你需要找到这个JavaScript并分析编码算法。 – heximal 2012-03-15 19:58:35
是的,删除''标签 - 一个简单的正则表达式将会诀窍。 – halfer 2012-03-15 19:59:17