我正在训练使用RASA中的MITIE后端来识别短,一到三个文本句子字符串的模型。该模型使用spaCy进行训练和工作,但并不像我想的那样精确。在spaCy上进行的培训不超过五分钟,但是对于MITIE的培训,我的计算机上连续运行了几天,使用16GB的RAM。因此,我开始在具有255GB RAM和32个线程的Amazon EC2 r4.8xlarge实例上进行培训,但似乎并未使用所有可用的资源。加速使用MITIE和Rasa的模型训练
在莎配置文件,我有num_threads: 32
并设置max_training_processes: 1
,我认为将有助于使用所有的内存和计算能力可用。但现在它已经运行了几个小时,CPU使用率保持在3%(100%的使用率,但只在一个线程上),内存使用率保持在25GB左右,只有它的十分之一。
你们有没有尝试加速MITIE培训的经验?我的模型有175个意图和总共6000个意图示例。有没有什么可以在Rasa配置文件中进行调整?
感谢您的答复,我很欣赏你介绍了新的评估工具。我其实目前正在使用'mitie_sklearn'管道和MITIE分叉。我发现'ner_mitie'在我的数据集上表现得比'ner_crf'好。 'ner_mitie'就是我在多线程中遇到的问题,并且正在减慢训练速度(这是'mitie_sklearn'管线的一部分)。这听起来像是结论是'ner_mitie'不支持多线程。 – hackerman
拿着电话,你特意在谈论意图,现在你已经搬到了NER。当你说准确率低时,意图还是实体的准确性?当你说你有6000个例子是那些意图的例子或实体例子或两者?如果你有175个意图,你有多少个实体,每个实体有多少个训练样例。你能提供一些你有实体的例子吗? –
对不起,我感到困惑。总共有大约900个实体示例,用于25个不同的实体。实体的一个例子是'broken_things',例如:“我的电视不工作”,其中与值电视机实体'broken_things'的电视栏目。 'ner_crf'模型比'ner_mitie'更频繁地测试“tv”。 – hackerman