2017-10-09 117 views
1

我使用这个页面的所有类: https://www.google.com/search?q=ford+fusion+msrp&oq=ford+fusion+msrp&aqs=chrome.0.0l6.2942j0j7&sourceid=chrome&ie=UTF-8Webscrapping引入nokogiri无法挑

我试图让这个元素:类=“_ XWK”

page = HTTParty.get('https://www.google.com/search?q=ford+fusion+msrp&oq=ford+fusion+msrp&aqs=chrome.0.0l6.11452j0j7&sourceid=chrome&ie=UTF-8') 

    parse_page = Nokogiri::HTML(page) 
    parse_page.css('_XWk') 

在这里我可以看到整个页面在parse_page中,但是当我尝试.cc('classname')时,我什么都看不到。我是否以错误的方式使用该方法?

+0

你肯定有与该类元素? –

回答

0

它看起来像是交换类,所以你在浏览器中看到的不是你从http调用得到的。在这种情况下,从_XWk到_tA

page = HTTParty.get('https://www.google.com/search?q=ford+fusion+msrp&oq=ford+fusion+msrp&aqs=chrome.0.0l6.11452j0j7&sourceid=chrome&ie=UTF-8') 
    parse_page = Nokogiri::HTML(page) 
    parse_page.css('._tA').map(&:text) 

# >>["Up to 23 city/34 highway", "From $22,610", "175 to 325 hp", "192″ L x 73″ W x 58″ H", "3,431 to 3,681 lbs"] 
0

变化parse_page.css('_XWk')parse_page.css('._XWk')

注意点(.)的区别。点引用一个类。

使用parse_page.css('_XWk'),引入nokogiri不知道羯羊_XWk是一个类,ID,数据属性等。