我正在尝试构建一个程序,该程序可以正确,自信地识别Google Cloud Vision中的对象(表示为GCV)。返回的结果在大多数时间都是正确的,因此每个标签都有一定的准确度分数。如何自信地验证从Google Cloud Vision返回的对象检测结果
{
"banana": "0.92345",
"yellow": "0.91002",
"minion": "0.89921",
}
我正在使用的环境具有不同的闪电条件组合,并且物体预期放置在随机位置。当放置不同位置的物体时,从GCV返回的结果会稍有不同,因为会查询不同的图像。例如,
{
"banana": "0.82345",
"lemon": "0.82211",
"yellow": "0.81102",
"minion": "0.79921",
}
我的程序设计,即,与精确度高于一定值时检测到的对象banana
时,则下一个动作将被分派的方式。
有3个对象类型的集群。例如,banana
转到容器A
,apple
转到容器B
和orange
转到容器C
。
当我向我的教授介绍我的工作时,他质疑我如何可以自信地定义和验证每个项目的阈值,并尊重其各自的群集。
我试图通过培训数百个香蕉图像来获得香蕉的平均分数,但最终我发现这可能不是定义阈值的正确方法。我的教授建议使用K Nearest Neighbor来找到这些图像的相似性,但这不是GCV的一部分?即使他的建议是正确的,使用GCV返回的有限数据来训练后GCV分类器的正确方法是什么?