我有一个文本语料库,我想从字符开始寻找单词的嵌入。所以我有一系列字符作为输入,我想将它投影到多维空间中。学习使用已经学过的单词嵌入的字符嵌入
作为初始化,我想适应已经学过的单词嵌入(例如,Google嵌入)。
我有些疑惑:
- 我需要用一个字嵌入矢量在输入序列中的每个输入 性格吗?如果我只使用ascii或utf-8编码使用 ,会不会是一个问题?
- 尽管什么是输入 矢量定义(VEC嵌入,ASCII ......)这真的混乱 选择合适的型号有多种选择,但林不知道 哪一个是更好的选择:seq2seq,自动编码器,lstm, multi-regressor + lstm?
- 你能给我任何样本代码 keras或tensorflow?
嗨朱塞佩,谢谢你的回复,但是我真的需要角色嵌入,或者换句话说,在这种情况下,为什么我需要概括角色相似性? –