2017-06-05 73 views
-1

是否有NLP算法处理检测可从中导出主题关键字 和其他关联关键字的文本列表中的重复 模式?从文本列表中的模式检测轮廓

我将展示它作为一个例子: 你有一个搜索查询“素食的东西健康” (其中一些是您需要了解的建议身体的一部分)。

搜索引擎将返回文章列表。

该算法将搜索这些文章中的模式。 例如它注意到其中80%有一段 至少有4个词橙色的多个实例,类似地 胡萝卜,苹果,黄瓜。

所以它会给你一个大纲(文字心智图)

  • 橙色
  • 胡萝卜 - > 维生素A
  • 苹果
  • 香蕉 - > 维生素B
  • 运行很多

Onc e我在YouTube上观看了关于语义网络的视频,并且知道Tim Berners-Lee谈到了类似的东西,但我已经失去了联系。你能否再次将关键词给我指向那个方向?

+0

ngrams,skipgrams。 GIYF – wildplasser

+0

文本聚类,主题建模? –

回答

1

可能您正在寻找word2vec - 描述的模式可以用单词之间的距离来描述。