0
在kernalized ELM中,他们(www.ntu.edu.sg/home/egbhuang/pdf/ELM-Unified-Learning.pdf)提到内核应该满足Mercer的条件。我没有找到背后的具体原因。请解释原因。为什么内核函数在ELM或SVM中满足Mercer的条件?
在kernalized ELM中,他们(www.ntu.edu.sg/home/egbhuang/pdf/ELM-Unified-Learning.pdf)提到内核应该满足Mercer的条件。我没有找到背后的具体原因。请解释原因。为什么内核函数在ELM或SVM中满足Mercer的条件?
原因解释here。 让我引用它:
最后,如果使用不满足Mercer条件的内核会发生什么?一般而言,可能存在数据使得Hessian是不确定的,并且二次规划问题将无法解决(双目标函数可以变得任意大)。然而,即使对于不满足Mercer条件的内核,仍然可以发现给定的训练集导致了半正定的Hessian,在这种情况下,训练将会很好地收敛。在这种情况下,然而,上述的几何解释是缺乏。” 伯吉斯(1998)
因此,没有被满足Mercer的条件的内核,你至少损失有所收敛保证(这是可能的,你输甚至更多:例如,提前停止时的收敛速度或近似精度)!