2012-04-26 135 views
4

我正在尝试使用NLTK命名实体标记来标识各种命名实体。在这本书中自然语言处理与Python他们提供常用的命名entitities列表(表7.4,如果有人好奇),其中包括:DATE月,2008-06-29和TIME两点五A M,下午1:30所以我得到了这个可以用NLTK的命名实体标记器完成的印象。使用nltk将日期识别为命名实体?

然而,当我运行恶搞,它似乎并没有回暖的日期或时间可言,因为它的人或组织。 NLTK命名的实体标记器是否不处理这些日期/时间情况,还是只挑选特定的日期/时间格式?如果它不处理这些情况,是否有人知道一个系统呢?或者正在创造我自己的唯一解决方案?

谢谢!

回答

10

你应该检查NLTK的的contrib库 - 包含模块调用timex.py或在这里下载: https://github.com/nltk/nltk_contrib/blob/master/nltk_contrib/timex.py

从模块的第一行:

 
# Code for tagging temporal expressions in text 
+0

这精美的作品。谢谢! – greatblue 2012-04-28 20:31:56

+1

明确的日期和时间不适用,例如'2016年6月23日' – lenhhoxung 2016-06-20 10:17:14

+0

@lenhhoxung您是否找到更好的解决方案? – 2016-10-27 13:25:15

相关问题