2016-11-24 132 views
1
  1. 我在最新的tensorflow示例中找到了这个函数,但它不在API中。我不知道为什么。请帮助我,谢谢。

回答

2

它是开源的。你可以阅读的文档字符串和代码here

+0

非常感谢你! – user7204017

+0

不要评论感谢我 - 这就是投票和接受的答案! –

10

我会给出一个example.I有一个数据集看起来是这样的:

[("Garbage piles in the city","Garbage"), ("City is clogged with vehicles","Traffic")]

我想利用这是每个元组的第一个元素一连串的单词。单词需要嵌入到矢量形式中。 作为第一步,它们应该转换为索引或数字。例如,在这种情况下, ,词汇表将为

[{Garbage:1},{piles:2},{in:3},{the:4},{city:5},{is:6},{clogged:7},{with:8},{vehicles:9}]

编码的文本看起来像这 -

features=[[1 2 3 4 5],[5 6 7 8 9]].

你通过这个编码的文本为features在batches- tf.contrib.layers.embed_sequence此功能( 功能,vocab_size = n_words, embed_dim = EMBEDDING_SIZE,scope ='words')

现在,使用索引(1到5)表示的每个单词都嵌入到EMBEDDING_SIZE的向量中。

如果批量大小为2(即,在一个批次2组的序列),EMBEDDING_SIZE是10在我们的情况下,输出将是维度的矩阵2×5×10

样品输出 - [[[0.1,0.3,0.4,0.2,0.5,0.2,0.2,0.2,0.4,0.1],[0.1,0.3,0.4,0.2,0.5,0.2,0.1,0.2,0.4,0.1],[0.1,0.3,0.4,0.2,0.5,0.2,0.4,0.2,0.4,0.1],[0.1,0.3,0.4,0.2,0.5,0.3,0.1,0.2,0.4,0.1],[0.1,0.3,0.4,0.2,0.5,0.2,0.1,0.2,0.4,0.6]],[sent2]]

sent2被类似地编码(5×10矩阵)。

希望这是明确的。