2017-08-29 71 views
1

我有一个字符串变量,其中包含混合的人类语言和HTML。我想删除嵌入在“<”和“>”中的所有HTML部分。我试过如下:如何逃脱“<" ">”以及其间的所有内容?

gsub("\\<[^\\<]*\\>", "", subject, perl=TRUE); 

但有人告诉我,\ <无效逃逸。任何人都可以帮我解决这个问题吗?非常感谢!

+0

完成与婚前良好的醇Sallie Mae的我在institushin learnin。”这是一个观察的样子。我怎么才能让它变得“只需要付钱给Sallie Mae就可以在institushin中学习”。 – xinyuanliu

+0

这是什么评论? – Masoud

+1

编辑您的问题,以包含输入和期望输出的[可重现示例](https://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example)。 – MrFlick

回答

2

gsub可代替<tags>并输出<tags>之间的内容。

> str 
[1] "<font size=6>Done with payin good ol Sallie Mae for my learnin at the institushin.</font>" 

> gsub("<.*?>","", str) 
[1] "Done with payin good ol Sallie Mae for my learnin at the institushin." 
+0

谢谢!我只是觉得这个问题有多愚蠢。 “<" and ">”根本不需要逃脱。 – xinyuanliu

+1

真正的诀窍是问号,而不仅仅是逃逸字符...... –