我有一个csv
文件,并且正在尝试创建一个数据集以便与scikit-learn
一起使用。如何从本地csv文件创建一个python数据集?
加载这些包:
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np
from sklearn import datasets, linear_model
我尝试这样做:
sales = pd.read_csv("sales.csv")
dataset = np.loadtxt(sales, delimiter=",")
它给了我这个错误:
AttributeError: 'DataFrame' object has no attribute 'endswith'
请帮帮忙!我无法找到如何从csv
文件创建数据集。
谢谢!
编辑
为了澄清 - 我尽量遵循这一程序http://scikit-learn.org/stable/auto_examples/linear_model/plot_ols.html,但我想用我自己的数据。我想知道如何将csv转换为python数据集,如果甚至可能的话。
请参阅此文档https://docs.scipy.org/doc/numpy-1.10.4/reference/generated/numpy.loadtxt.html,可能有助于设置您的'dtype'。 –