我试图在将单词分割为词的后缀和前缀(即词素或词缀)后得到一个列表。分割的正则表达式 - 将单词拆分为词素或词缀
我试过使用正则表达式,与re.findall
函数。
(如下所示)
>>> import re
>>> affixes = ['meth','eth','ketone', 'di', 'chloro', 'yl', 'ol']
>>> word = 'dimethylamin0ethanol'
>>> re.findall('|'.join(affixes), word)
['di', 'meth', 'yl', 'eth', 'ol']
然而,我需要在其中它不匹配被包括在部分。举例来说,上面的例子将需要输出:
['di', 'meth', 'yl', 'amin0', 'eth', 'an', 'ol']
有谁知道如何提取列表中的这些部分?