2016-09-26 107 views
4

我使用pd.read_html()从网页导入表,但不是将数据结构化为数据框,而是将Python作为列表导入。如何将数据作为数据框导入?谢谢!pd.read_html()导入列表而不是数据框

的代码如下:

import pandas as pd 

import html5lib 

url = 'http://www.fdic.gov/bank/individual/failed/banklist.html' 

dfs = pd.read_html(url) 

type(dfs) 

Out[1]: list 

回答

2

.read_html()产生dataframes的列表(有可能是在一个HTML源的多个表),得到由索引所需的一个。在你的情况下,有一个单一的数据框:

dfs = pd.read_html(url) 
df = dfs[0] 
print(df) 

需要注意的是,如果没有table S IN的HTML源代码,它会返回一个错误,绝不会产生一个空列表。

+0

谢谢!确实df是一个数据框。但是,当我尝试Python上的.head,.tail和.index参数时,Python返回了错误消息。我该如何解决这个问题? – AlK

+0

@AlexanderKonstantinidis有趣,'df.tail','df.head','df.index'适合我。你有什么错误? – alecxe

+0

AttributeError:'DataFrame'对象没有'heads'属性,AttributeError:'DataFrame'对象没有'tails'属性,TypeError:'Index'对象不可调用 – AlK

相关问题