目前我有一个很大的CSV文件(大约5GB) 我想逐行阅读整个文件并尝试应用最典型的算法(SVM,朴素贝叶斯,线性回归,等等)。用于机器学习算法的Python csv流
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import csv
i_f = open('top2Mmm.csv', 'r')
reader = csv.reader(i_f, delimiter = ';')
for row in reader:
print("Fila ->", row)
我刚刚设法读取的CSV,但我不知道如何采取每一行,并建立一个模型。 我从一个较小的文件开始加速过程,但我不知道如何使此过程正常工作。 任何线索或提示?
我建议尝试'pandas'用'read_csv'方法。 – arnold
不幸的是,它不是一个简单的任务。大多数最大似然估计量需要整个数据一次出现才能学习。如果你想以较小的批次来完成,你需要考虑那些支持它的ML算法。阅读更多关于“在线转移学习”,“核心外学习”,“增量学习”等 –