如何使用机械化宝石在html页面的'table'标签中获取'td'标签内的所有文本？

ruby
mechanize

2010-11-24 26 views 0 likes

我想解析表使用机械化宝石，但我不知道如何迭代表。如何使用机械化宝石在html页面的'table'标签中获取'td'标签内的所有文本？

2010-11-24 user633230

回答

机械化使用nokogiri解析HTML，所以你应该查看那里的文档。也就是说，看看xpath的方法。

下面是一个例子，分析当前页面：

require 'open-uri' 
require 'nokogiri' 
doc = Nokogiri::HTML(open('http://stackoverflow.com/questions/4265745/how-to-get-all-text-inside-td-tags-from-table-tag-on-html-page-using-mechaniz')) 
table = doc.xpath('//table').first # getting the first table on the page 
table.xpath('tr/td').count # getting all the td nodes right below table/tr and counting them 
#=> 4

来源

2010-11-24 13:37:53

相关问题

1. 如何使用Mechanize在html页面上从'table'标签中的'td'标签中获取文本
2. 获取html标签内/ html标签之间的所有内容
3. 提取使用WWW ::机械化获取<a>的文本标签
4. 如何使用机械化更改网页上的标签
5. 红宝石/机械化：在登录页面后未获取所有cookie
6. 如何在html页面中获取所有p和h标签的值，但不包括所有其他标签
7. 如何在页面标记中获取标签文本值？
8. 我们如何使用document.querySelectorAll获取html页面中的所有标签
9. 使用Javascript获取所有html标签
10. 如何使用nokogiri和机械化从<script>标签中提取文本？
11. 如何获取HTML标签中的所有内容？
12. 如何使用内容标签标签获取div内的文本？
13. 如何获取第一个html标签和第二个html标签之间的内容红宝石
14. 红宝石Nokogiri提取HTML标签值
15. 如何获取没有URL的页面的html标签
16. 如何获取HTML标签的内容？
17. 获取没有标签标签包装的国际化标签文本
18. 如何获取div标签中的所有li标签
19. 如何使用JavaScript从标签标签获取文本？
20. 如何使用queryselector获取标签内的标签？
21. 从android的html内容中提取td和标题标签？
22. 如何使用机械宝石获取网站的所有链接？
23. 从标签页获取HTML内容
24. PHP/Regex按标签替换（table> td）标签（table> tr> td）
25. 如何从HTML页面源获取特定的html div标签？
26. 提取自特定页面所有的HTML标签在Ruby
27. Objective-C HTML解析。获取标签之间的所有文本
28. 使用php获取HTML标签内容
29. 如何使用jsoup从此html标签中获取文本？
30. 在标签内获取文本，在另一个标签之后