2017-06-13 72 views
0

我真的很陌生,我一直试图模拟从Python的“pandas.read_table”代码,用于数据分析的书(关于MovieLens 1M数据集的章节, pg.23ish)。下面是用于数据库的文件的链接以及我输入代码的jupyter笔记本的图像。正如你将会看到的那样,我遇到了数据值不正确的问题,因为它应该这样,我似乎无法弄清楚为什么。您的帮助将非常感谢!在读熊猫表的时候遇到了麻烦

Trouble screen

Database file

回答

1

如果您是从.csv文件中读取数据,使用pd.read_csv

如果要使用pd.read_table,则必须使用参数sep=','指定分隔符作为逗号。发生了什么事情是pd.read_table试图在每个::处分隔输入信息,但看起来您的数据是用逗号分隔的。

点击此处了解详情:

http://pandas.pydata.org/pandas-docs/stable/io.html

https://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_table.html

+0

这是你的答案! – piRSquared

+0

啊哈!非常感谢! :) –