与朴素贝叶斯分类器打开（）声明需要长

我有一个csv文件3483行和460K字符和65K字，我试图用这个语料库来训练一个NaiveBayes分类器Scikit学习。与朴素贝叶斯分类器打开（）声明需要长

问题是，当我在下面使用这个语句，需要太长时间（1小时，并没有完成）。

from textblob import TextBlob 
from textblob.classifiers import NaiveBayesClassifier 
import csv 

with open('train.csv', 'r') as fp: 
    cl = NaiveBayesClassifier(fp, format="csv")

任何猜测我做错了什么？

在此先感谢。

来源

2017-02-12 Flavio

是您的CSV文件格式，像这样：http://textblob.readthedocs.io/en/dev/classifiers.html – vendaTrout

是@vendaTrout 这是该文件的一个例子： '''instagrama，Instagram的＃FB，脸谱 facebookio，FACEBOOK facebooktime信使iphone，FACEBOOK WhatsApp的COM，WHATSSUP facebooko＃FB，脸谱 facebookiokio＃FB，脸谱 instagramas：，Instagram的 Facebook的HTTPS：FB，脸谱 Facebook的＃FB，FACEBOOK ''' – Flavio

假设每列火车数据和标签是分开的通过“\ n”，你可以剖析一个更小的csv或这个函数。请查看stdlib [profiling]（https://docs.python.org/3/library/profile.html）模块。 – vendaTrout

这个库存在问题。

它记录在以下链接：

https://github.com/sloria/TextBlob/pull/136

https://github.com/sloria/TextBlob/issues/77

小故事：库没有交易以及大型数据集。

来源

2017-02-15 11:50:13 Flavio

与朴素贝叶斯分类器打开（）声明需要长

回答

相关问题