tf.contrib.layers.embed_sequence（）是为了什么？

我在最新的tensorflow示例中找到了这个函数，但它不在API中。我不知道为什么。请帮助我，谢谢。

来源

2016-11-24 user7204017

它是开源的。你可以阅读的文档字符串和代码here

来源

2016-11-24 11:15:08

非常感谢你！ – user7204017

不要评论感谢我 - 这就是投票和接受的答案！ –

我会给出一个example.I有一个数据集看起来是这样的：

[("Garbage piles in the city","Garbage"), ("City is clogged with vehicles","Traffic")]

我想利用这是每个元组的第一个元素一连串的单词。单词需要嵌入到矢量形式中。作为第一步，它们应该转换为索引或数字。例如，在这种情况下，，词汇表将为

[{Garbage:1},{piles:2},{in:3},{the:4},{city:5},{is:6},{clogged:7},{with:8},{vehicles:9}]。

编码的文本看起来像这 -

features=[[1 2 3 4 5],[5 6 7 8 9]].

你通过这个编码的文本为features在batches- tf.contrib.layers.embed_sequence此功能（功能，vocab_size = n_words， embed_dim = EMBEDDING_SIZE，scope ='words'）

现在，使用索引（1到5）表示的每个单词都嵌入到EMBEDDING_SIZE的向量中。

如果批量大小为2（即，在一个批次2组的序列），EMBEDDING_SIZE是10在我们的情况下，输出将是维度的矩阵2×5×10

样品输出 - [[[0.1,0.3,0.4,0.2,0.5,0.2,0.2,0.2,0.4,0.1],[0.1,0.3,0.4,0.2,0.5,0.2,0.1,0.2,0.4,0.1],[0.1,0.3,0.4,0.2,0.5,0.2,0.4,0.2,0.4,0.1],[0.1,0.3,0.4,0.2,0.5,0.3,0.1,0.2,0.4,0.1],[0.1,0.3,0.4,0.2,0.5,0.2,0.1,0.2,0.4,0.6]],[sent2]]

sent2被类似地编码（5×10矩阵）。

希望这是明确的。

来源

2017-05-31 09:30:31 user1930402

tf.contrib.layers.embed_sequence（）是为了什么？

回答

相关问题