阅读csv文件python 3.6使用熊猫

我正在阅读使用pandas的read_csv方法的Python中的巨大csv文件。我有一个包含日期和时间的列（包含在同一列中）：YYYY-MM-DD HH:MM:SS。我是数据的第0列。目前我正在做的是：阅读csv文件python 3.6使用熊猫

format = "%Y-%m-%d %H:%M:%S" 
    parser = lambda x: pd.datetime.strptime(x, format) 
    data = pd.read_csv("path/to/file", sep=',', encoding='ISO-8859-1', parse_dates=[0], date_parser=parser)

但它告诉我在导入时使用指定dtype选项。我尝试在呼叫中添加一个参数：dtype = {[0]:pandas.datetime}但它不起作用。你有更好的解决方法吗？或者可以有人解释如何正确使用dtype参数？我尝试阅读文档，但没有多大帮助。

来源

2017-06-15 anon

你能发布你正在得到的实际错误吗？ –

尝试不使用'date_parser'参数。熊猫对此有很好的默认设置。 – josh

也许你可以尝试读取文件

data = pd.read_csv("path/to/file", sep=',', encoding='ISO-8859-1') 

data[0] = pd.to_datetime(data[0], format= "%Y-%m-%d %H:%M:%S")

希望它可以帮助后到列格式。

来源

2017-06-15 21:32:42 Ding

我希望在导入时拥有正确的格式。我认为这会更快，因为在这里我将读取大文件，分配错误的对象类型，然后重新读取它以分配正确的 – anon

阅读csv文件python 3.6使用熊猫

回答

相关问题