我试图从MLS网站上抓取玩家信息来创建玩家来自哪里的地图以及其他信息。随着它的发展,我对这件事情是新的。Nokogiri:清理数据输出
到目前为止,我已经使用这个代码:
require 'HTTParty'
require 'Nokogiri'
require 'JSON'
require 'Pry'
require 'csv'
page = HTTParty.get('https://www.atlutd.com/players')
parse_page = Nokogiri::HTML(page)
players_array = []
parse_page.css('.player_list.list-reset').css('.row').css('.player_info').map do |a|
player_info = a.text
players_array.push(player_info)
end
#CSV.open('atlantaplayers.csv', 'w') do |csv|
# csv << players_array
#end
pry.start(binding)
撬函数的输出是:
:"Miguel Almirón10\nMidfielder\n-\nAsunción, ParaguayAge:\n23\nHT:\n5' 9\"\nWT:\n140\n"
其中投入CSV时,在一个单元格创建此
"Miguel Almirón10
Midfielder
-
Asunción, ParaguayAge:
23
HT:
5' 9""
WT:
140
"
我查看过东西,并确定它可能是节点(\ n)?这是抛弃格式。
我想要的结果,在这里是要弄清楚如何获得撬输出到数组如下:
Miguel, Almiron, 10, Midfielder, Asuncion, Paraguay, 23, 5'9", 140
奖励积分,如果你能与名字重音符号帮助。另外,如果高度有问题,是否有方法将其转换为度量标准?
预先感谢您!