0

我有一个csv文件3483行和460K字符和65K字,我试图用这个语料库来训练一个NaiveBayes分类器Scikit学习。与朴素贝叶斯分类器打开()声明需要长

问题是,当我在下面使用这个语句,需要太长时间(1小时,并没有完成)。

from textblob import TextBlob 
from textblob.classifiers import NaiveBayesClassifier 
import csv 

with open('train.csv', 'r') as fp: 
    cl = NaiveBayesClassifier(fp, format="csv") 

任何猜测我做错了什么?

在此先感谢。

+0

是您的CSV文件格式,像这样:http://textblob.readthedocs.io/en/dev/classifiers.html – vendaTrout

+0

是@vendaTrout 这是该文件的一个例子: '''instagrama,Instagram的 #FB,脸谱 facebookio,FACEBOOK facebooktime信使iphone,FACEBOOK WhatsApp的COM,WHATSSUP facebooko#FB,脸谱 facebookiokio#FB,脸谱 instagramas:,Instagram的 Facebook的HTTPS:FB,脸谱 Facebook的#FB,FACEBOOK ''' – Flavio

+0

假设每列火车数据和标签是分开的通过“\ n”,你可以剖析一个更小的csv或这个函数。请查看stdlib [profiling](https://docs.python.org/3/library/profile.html)模块。 – vendaTrout

回答