2012-04-19 93 views
0

如何使用Notepad ++从文件中的所有URL找到并删除utm_content参数?如何修剪以特定表达式开头的字符串?

的样本数据:

http://example.com/content1.html?utm_content=product1 
http://example.com/abc2.html?utm_content=homepage 
http://example.com/test/?utm_content=sku1234 
http://example.com/runapp?utm_content=31231KS 
http://example.com/blabla?utm_content=nl-laptops-tablets 

期望的结果:

http://example.com/content1.html 
http://example.com/abc2.html 
http://example.com/test/ 
http://example.com/runapp 
http://example.com/blabla 

注:根据我的理解记事本+ +正则表达式使用标准PCRE(的Perl)的语法。

+2

问题在哪里? – 2012-04-19 13:45:38

+0

编辑了这个问题,谢谢! – Bogdan 2012-04-19 13:50:44

+1

这不是一个编程问题,因为你只是在处理文本编辑器;因此我相信它属于超级用户。 – 2012-04-19 13:52:16

回答

2

据我了解你的需求:

搜索:

\?utm_content=.*?" 

"

+0

选择一切,直到换行。示例数据应该看起来像这样:'href =“http://example.com/content1.html?utm_content=nl-laptops-tablets”',我需要输出这个'href =“http://示例。 COM/content1.html“'。我很抱歉没有从一开始就解释得更好。 – Bogdan 2012-04-19 14:02:41

+0

@Bogdan:我不明白你的意思。上述表达式适用于您提供的示例。 – Toto 2012-04-19 14:11:32

+0

这里是样本数据的更广泛的视图:' ' – Bogdan 2012-04-19 14:16:42

2

搜索替换为\?utm_content=\w+\?utm_content=.*,并用零字符串替换它,如果是这样的只有一个参数。

+0

这部分工作:'\?utm_content = \ w +'。但是,如果我有一个参数包含'-'字符,比如这个:'?utm_content = nl-laptops-tablets',它会选择序列直到第一个'-' – Bogdan 2012-04-19 13:55:34

+0

@ChrisMorgan由于OP没有足够具体,整个网址可能如何看待。 – splash 2012-04-19 13:55:38

+0

@Bogdan正确。我的答案非常严格地处理这些例子! ;-) – splash 2012-04-19 14:01:50

-1

使用标准搜索&更换(按Ctrl + R)

编辑:

搜索:的utm_content

替换:

出版社找到,然后按替换休息。

+0

...并做什么? – splash 2012-04-19 14:00:21

+0

这不是OP所要求的。 – splash 2012-04-19 14:06:31

+0

OP的原始问题是模糊的。 一个简单的搜索和替换就足以解决原始问题。 编辑的问题更加清晰,并且需要RegEx – Nihil 2012-04-19 14:27:41

相关问题