我试图用我在R中工作的文本中以abc
开头的字符串替换实例。输出文本在HTML中通过几次传递突出显示,所以我需要更换忽略HTML内容中的文本。R中的负向前瞻不像预期的那样
以下似乎在Python中工作,但我没有得到任何撞在我在R的正则表达式。所有帮助表示赞赏。
test <- 'abcdef abc<span abc>defabc abcdef</span> abc defabc'
gsub('\\babc\\(?![^<]*>\\)', 'xxx', test)
预期输出:
xxxdef xxx<span abc>defabc xxxdef</span> xxx defabc
相反,它忽略了abc
所有实例。
记住http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags – MichaelChirico