我有一个带有标记数据的文档,格式为Hi here's my [KEYWORD phone number], let me know when you wanna hangout: [PHONE 7802708523]. I live in a [PROP_TYPE condo] in [CITY New York]。我想根据一组这样的标记文档来训练模型,然后使用我的模型来标记新文档。这在NLTK中
假设我有一个3级问题,我想要构建一个可以根据一组功能区分类的分类器。我想根据它区分这三类的能力来评估模型。 从我的阅读,这听起来像宏F1分数是用来评估对多类问题,其中F1分数为每个类,那么那些F1分数的未加权平均数作为macro F1 score计算分类的通用指标。 在其他文献中,我已经看到多类问题使用的平衡精度,其中准确性是针对每个类别计算的,然后将这些精度的未加权平均值用作balanced a