2017-02-10 87 views
-4

我想创建一个python脚本,它将接收一个字符串并确定从数据库表中返回哪些行。例如,如果字符串是“海豚是非常聪明的动物”。 python脚本应搜索Dolphins和smart这两个词,然后返回“海豚是一种非常聪明的动物”,而“海豚是最聪明的动物之一”。下面显示了表格的示例渲染。任何想法从哪里开始。我目前正在从R转换到Python。使用字符串返回来自数据库的结果

Table A 
Animals Characteristics Statement 
Dolphins  Smart    Dolphins are an extremely smart animal 
Dolphins  Smart    Dolphins are one of the most intelligent animals 
Bears  Smart    Bears are extremely smart animals 
+1

http://stackoverflow.com/help/on-topic – obayhan

回答

0

我建议你研究了以下几件事:

  • 停止的话:有在查询关键术语是“海豚”,“智能”和“动物”。查询中的其他术语(例如“are”,“a”)无助于缩小查询的范围。这些是可以从查询中排除的“停用词”,因此只有关键词用于搜索相关语句。
  • 同义词环:“smart”和“intelligent”这两个词在语义上相似。同义词环是可以用来将诸如“海豚和智能”之类的查询转换为“海豚和(智能或智能)”的单词列表。

如果您使用的是英语语句,WordNet具有可用于生成同义词环的同义词数据库。

相关问题