我指的是keras documentation来构建一个网络,它以嵌入和一些其他重要特征的形式获取多个输入。但是,如果我们已经定义了主要损失,我不明白辅助损失的确切影响。使用深度网络的多输入和多输出模型中的辅助输出的意义
在这里,我们插入辅助损失,允许LSTM和嵌入层被平稳地训练,即使模型中的主损失要高得多。
正如文档中所提到的,我假设它有助于在嵌入/之前定义的任何其他图层上平滑地进行训练。我的问题是,如何确定辅助损失的权重。
我们编译模型并给辅助损失分配一个0.2的权重。要为每个不同的输出指定不同的loss_weights或loss,可以使用列表或字典。
如果有人能够解释如何确定损失权重以及辅助损失权重的高/低值如何影响模型训练和预测,我将非常感激。