初学者的问题,但我有点困惑。希望这个问题的答案也可以让NLP中的其他初学者受益。使用平均方法从word2vec单词向量计算句子向量的具体步骤是什么?
这里有一些更多的细节:
我知道你可以从word2vec生成的单词矢量计算句子载体。但是,制定这些句子向量所涉及的实际步骤是什么?任何人都可以提供一个直观的例子,然后一些计算来解释这个过程?
eg:假设我有一个三个字的句子:今天很热。假设这些词具有假设的矢量值:(1,2,3)(4,5,6)(7,8,9)。通过对这些单词向量进行分量平均来获得句子向量吗?如果向量的长度不同,例如:(1,2)(4,5,6)(7,8,9,23,76)这些情况下的平均过程是什么样的?