我遇到了正则表达式的问题! 我如何计算正则表达式的html标签?如何计算html标签和内容
回答
不要使用正则表达式使用DOM。我不确定你会怎么做,但它几乎肯定会更容易与DOM: http://php.net/manual/en/book.dom.php
谢谢。 DomDocument类很好,解决了我的问题,但我还有最后一个问题。我需要的名称 - (关键字)和 的内容 - (一些东西一切)。我有一个meta标签: 。 如何获得DomDocument类的名称和内容? – turbod 2010-03-17 11:14:24
$ meta = $ dom-> getElementsByTagName('meta'); ($ i = 0; $ i < $meta-> length; $ i ++){ echo $ meta-> item($ i) - > getAttribute('name')。“ - ”。$ meta-> item($ i ) - > getAttribute('content')。“
”; } –
turbod
2010-03-17 11:27:36
你不会!为什么不尝试DOMDocument类
正则表达式并不旨在这样做。有一个更好的解决方案,你的问题,只是检查其他答案。
如果你只是需要一次,作为一个快速和肮脏的黑客,并不关心边缘情况下(如字符串中使用的逃逸标签),你可以使用"<\w+"
来匹配起始标签,并计数匹配数。
但是你不应该这样做。 =)
$data=file_get_contents("file");
$data=preg_replace("/\n+|[[:blank:]]+/","",$data);
print "number of tags: ". substr_count($data, '<');
- 1. 如何获取HTML标签的内容?
- 2. 如何获取html标签内容
- 3. 计算和标签
- 4. 搜索算法的标签和内容
- 5. 替换HTML标签内容
- 6. 如何使用BeautifulSoup解析HTML标签内部的HTML标签的内容?
- 7. 获取html标签内/ html标签之间的所有内容
- 8. 如何解析字符串中的HTML标签和内容?
- 9. 在标签内嵌入HTML内容?
- 10. 在html body标签内添加内容
- 11. 如何使用的preg_replace删除内容的HTML标签内
- 12. 如何用C#替换HTML标签内部的文本内容!
- 13. 仅在HTML页面中计算内容
- 14. 计算单元格中的单词,不计算HTML标签
- 15. 从标签页获取HTML内容
- 16. 使用php获取HTML标签内容
- 17. 哪些HTML标签没有内容
- 18. 使用sed替换HTML标签内容
- 19. html标签之外的内容
- 20. 从android的html内容中提取td和标题标签?
- 21. 设计标签标题CSS与标签内容连接 - 圆角
- 22. 如何获取第一个html标签和第二个html标签之间的内容红宝石
- 23. 如何获得标签内的标签内容
- 24. 标签云算法(计算)
- 25. 如何计算XElement的所有标签?
- 26. 如何计算QTreeWidget内容的高度?
- 27. html自定义新标签并获取新标签内容
- 28. 如何让BeautifulSoup将textarea标签的内容解析为HTML?
- 29. 如何删除HTML标签,而不是内容的Vim
- 30. 如何在html元标签中编辑内容属性?
你是在开玩笑吧,不是吗?如果不是,不,你不能,你不应该。阅读http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454 – Amarghosh 2010-03-17 09:32:06
只要计算'<'的数量 - 这会给你相同的用正则表达式可以得到一种精确度。 – 2010-03-17 09:35:43
另外,即使你准备好处理使用它的问题,正则表达式也不会计数。至少你必须使用例如perl将html加载到变量中,并对“<”(不包括“<! - ”)执行split(),然后检查结果数组的长度。 – Timo 2010-03-17 09:47:16