如果在该句子中存在特定单词,我想提取确切的句子。任何人都可以让我知道如何用python来做到这一点。我使用了concordance(),但它只打印单词匹配的行。使用python提取一个句子
0
A
回答
1
如果你有一个字符串中的每个句子,你可以在你的单词上使用find(),如果找到了,返回句子。否则,你可以使用正则表达式,像这样
pattern = "\.?(?P<sentence>.*?good.*?)\."
match = re.search(pattern, yourwholetext)
if match != None:
sentence = match.group("sentence")
我还没有测试这一点,但类似的规定。
我的测试:
import re
text = "muffins are good, cookies are bad. sauce is awesome, veggies too. fmooo mfasss, fdssaaaa."
pattern = "\.?(?P<sentence>.*?good.*?)\."
match = re.search(pattern, text)
if match != None:
print match.group("sentence")
0
杜特的工作做得很好回答这个。只是想补充一对夫妇的事情
import re
text = "go directly to jail. do not cross go. do not collect $200."
pattern = "\.(?P<sentence>.*?(go).*?)\."
match = re.search(pattern, text)
if match != None:
sentence = match.group("sentence")
很明显,你需要在你开始之前导入的正则表达式库(进口重)。这里是什么样的正则表达式实际上没有(更多信息可在Python re library page找到)一个拆解
\. # looks for a period preceding sentence.
(?P<sentence>...) # sets the regex captured to variable "sentence".
.*? # selects all text (non-greedy) until the word "go".
再次,链接到图书馆参考页是关键。
2
只是一个快速提醒:判刑实际上是一个非常复杂的事情,对于期间规则也有例外,例如“先生”或“博士”还有各种句子结尾的标点符号。但是,例外情况也有例外(如果下一个词是大写字母,并且不是专有名词,那么Dr.例如可以结束一个句子)。
如果您对此感兴趣(这是一门自然语言处理主题),您可以查看:
自然语言工具套件(nltk)punkt module。
+0
谢谢@HonestAbe – Crisfole 2013-01-21 18:41:27
相关问题
- 1. 使用PHP提取前2个句子
- 2. 如何使用python&NLTK提取评论的子主题句子?
- 3. 从python中的句子中提取子句
- 4. 使用正则表达式提取一个句子的最后一个字符
- 5. 使用python识别一个句子中的多个关键字
- 6. 提取句子中每个单词的第一个字母
- 7. 提取一个子字符串使python for循环中断
- 8. Python - 如何提取包含引用标记的句子?
- 9. 另一个xml python提取
- 10. 提取句子/字符串中的最后一个单词?
- 11. 如何提取句子的最后一个单词
- 12. 从文本字符串中提取第一个句子
- 13. 如何从一个句子,通过蟒蛇提取数
- 14. 使用where子句中select子句的列号。提取allias原名
- 15. 从madlib中选择一个句子python
- 16. 在Python中提取多个子矩阵
- 17. 使用pycparser我想提取一个函数中的语句?
- 18. 使用一个NaturalSortComparer在LINQ where子句
- 19. 如何使用API.AI从一个句子中获取多值?
- 20. 提取子序列Python
- 21. 正则表达式从python中的段落中提取句子
- 22. Google Cloud Natural Language API - 句子提取(Python 2.7)
- 23. 从句子中提取'date-related'字符串-python
- 24. 提取使用Python和YouTubeAPI
- 25. 使用Python提取字段
- 26. 提取和使用Python
- 27. 提取和使用python
- 28. 数据提取使用Python
- 29. 提取文本使用python
- 30. 提取使用Python 2.7
测试它!这是不正确的。 – pyfunc 2010-10-23 00:37:27
固定。,我只是错过了?之后的第一个\。 – dutt 2010-10-23 01:00:05