1
从html响应中获取数据并通过pandas Dataframe使用下面的代码提供数据后,转置数据并打印结果。剥离大熊猫数据框索引' n'和空格
r1 = bs4.BeautifulSoup(r.text, 'lxml').prettify()
r3 = pandas.read_html(r1, header=None, index_col=None)[0]
r3.dropna(inplace=True)
r4 = pandas.DataFrame.transpose(r3)
r5 = r4.index
print(r5)
我收到下面的结果。
Index(['\n ',
'\n 2006-12\n ',
'\n 2007-12\n ',
'\n 2008-12\n ',
'\n 2009-12\n ',
'\n 2010-12\n ',
'\n 2011-12\n ',
'\n 2012-12\n ',
'\n 2013-12\n ',
'\n 2014-12\n ',
'\n 2015-12\n ',
'\n TTM\n '],
dtype='object')
如何剥离在这个指数只是有数字和TTM所有'\n'
和white spaces
?
'i.str.strip()'可以更简单。 – j0e1in
@JoeLin,好点,谢谢!我已将它添加到答案 – MaxU
谢谢!这工作很好 –