2017-03-01 335 views
0

我正在寻找关于如何执行我的想法的一些指示。 我会准备一份食材配方的名称,设备清单和烹饪方法。我想要做的就是将烹饪方法简化为动作动词,成分名称和设备名称。NLP - 从指令列表中提取动作动词,名词

  • 例如:
    1. 成份:鸡蛋,胡椒,盐
    2. 设备:水罐
    3. 方法:1裂纹将鸡蛋打入壶。
    4. 添加胡椒和盐

的输出将是列表中的存储。 输出:1,裂缝,蛋,壶 2.添加,胡椒,壶 3.添加,盐,壶

回答

0

随着NLP,你可以有你的标记词类全部文本。在标记全文后,您知道ingredientsequipments总是名词,而“动作动词”是动词。现在,您可以将问题分为三部分:

  1. 如何区分设备和配料?
  2. 检测哪些动词是“动作动词”,并与您的问题相关的域名,如“添加,混合,剪切..”
  3. 创建句型。 [动作动词] [成分] [装备]

在你可以采取一切的名词,并使用word frequency创造“的设备和配料包的话”。这种技术背后的基本原理是,这些词更容易被频繁使用,因为它们是问题领域的一部分。然后为了区分彼此,您可以使用数据挖掘,亲和力分析例如。

在你可以解析了一堆菜谱,提取所有动词,并得到最常见的。创建一个“动词袋”,并使用词干将它们置于不定式或基本形式。例如“切割”和“切割”应该与“切割”相同。有了这个种子(你的动词包),你可以使用正则表达式在你的食谱中扫描这些动词。

在你需要找到一个句型。也许你会发现不止一个

这是一个很好的起点,应该给你一些想法。结合自然语言处理和数据挖掘/机器学习,更深入地了解您的数据