0
我有一个csv文件3483行和460K字符和65K字,我试图用这个语料库来训练一个NaiveBayes分类器Scikit学习。与朴素贝叶斯分类器打开()声明需要长
问题是,当我在下面使用这个语句,需要太长时间(1小时,并没有完成)。
from textblob import TextBlob
from textblob.classifiers import NaiveBayesClassifier
import csv
with open('train.csv', 'r') as fp:
cl = NaiveBayesClassifier(fp, format="csv")
任何猜测我做错了什么?
在此先感谢。
是您的CSV文件格式,像这样:http://textblob.readthedocs.io/en/dev/classifiers.html – vendaTrout
是@vendaTrout 这是该文件的一个例子: '''instagrama,Instagram的 #FB,脸谱 facebookio,FACEBOOK facebooktime信使iphone,FACEBOOK WhatsApp的COM,WHATSSUP facebooko#FB,脸谱 facebookiokio#FB,脸谱 instagramas:,Instagram的 Facebook的HTTPS:FB,脸谱 Facebook的#FB,FACEBOOK ''' – Flavio
假设每列火车数据和标签是分开的通过“\ n”,你可以剖析一个更小的csv或这个函数。请查看stdlib [profiling](https://docs.python.org/3/library/profile.html)模块。 – vendaTrout