2017-06-15 205 views
0

我正在阅读使用pandas的read_csv方法的Python中的巨大csv文件。我有一个包含日期和时间的列(包含在同一列中):YYYY-MM-DD HH:MM:SS。我是数据的第0列。目前我正在做的是:阅读csv文件python 3.6使用熊猫

format = "%Y-%m-%d %H:%M:%S" 
    parser = lambda x: pd.datetime.strptime(x, format) 
    data = pd.read_csv("path/to/file", sep=',', encoding='ISO-8859-1', parse_dates=[0], date_parser=parser) 

但它告诉我在导入时使用指定dtype选项。我尝试在呼叫中添加一个参数:dtype = {[0]:pandas.datetime}但它不起作用。你有更好的解决方法吗?或者可以有人解释如何正确使用dtype参数?我尝试阅读文档,但没有多大帮助。

+0

你能发布你正在得到的实际错误吗? –

+0

尝试不使用'date_parser'参数。熊猫对此有很好的默认设置。 – josh

回答

0

也许你可以尝试读取文件

data = pd.read_csv("path/to/file", sep=',', encoding='ISO-8859-1') 

data[0] = pd.to_datetime(data[0], format= "%Y-%m-%d %H:%M:%S") 

希望它可以帮助后到列格式。

+0

我希望在导入时拥有正确的格式。我认为这会更快,因为在这里我将读取大文件,分配错误的对象类型,然后重新读取它以分配正确的 – anon