我有一个文本文档,其中有一大堆形式为/courses/......./.../..
的网址,从这些网址中我只想提取那些形式为/courses/.../lecture-notes
的网址。意思是以/courses
开头并以/lecture-notes
结尾的网址。 有人会知道使用正则表达式或仅通过字符串匹配来完成此操作的好方法吗?使用java从文本文件中提取特定的url
1
A
回答
5
这里有一个选择:
Scanner s = new Scanner(new FileReader("filename.txt"));
String str;
while (null != (str = s.findWithinHorizon("/courses/\\S*/lecture-notes", 0)))
System.out.println(str);
鉴于与内容filename.txt
Here /courses/lorem/lecture-notes and
here /courses/ipsum/dolor/lecture-notes perhaps.
上述片断输出
/courses/lorem/lecture-notes
/courses/ipsum/dolor/lecture-notes
1
假设你有每行1个网址, 可以 使用方法:
BufferedReader br = new BufferedReader(new FileReader("urls.txt"));
String urlLine;
while ((urlLine = br.readLine()) != null) {
if (urlLine.matches("/courses/.*/lecture-notes")) {
// use url
}
}
1
下面将只返回中间部分(即:排除/courses/
和/lectures-notes/
:
Pattern p = Pattern.compile("/courses/(.*)/lectures-notes");
Matcher m = p.matcher(yourStrnig);
if(m.find()).
return m.group(1) // The "1" here means it'll return the first part of the regex between parethesis.
相关问题
- 1. 使用PowerShell脚本从.zip文件中提取特定文件
- 2. 使用JavaScript/Jquery从URL中提取特定的文件名
- 3. 从文件在java中提取特定文本
- 4. 使用PHP从文本文件中提取特定数据
- 5. 使用jQuery从特定的文本中提取文本
- 6. 在UNIX中从文本文件中提取特定文本
- 7. 从文本文件中提取URL
- 8. 使用Nginx从URL中提取文本
- 9. 从URL中提取文本
- 10. 使用java从100个图像URL的文本文件中提取图像
- 11. 从Java中的文本文件中读取特定的行
- 12. 使用DotNetZip从压缩文件中提取特定文件夹
- 13. 使用ajax从文本文件中读取特定的文字
- 14. 从文本中提取特定单词
- 15. 从数据中提取特定文本
- 16. 从文本中提取特定信息
- 17. 提取从文本文件中的特定数据在Perl
- 18. 使用awk从目录中的所有文本文件中提取特定行
- 19. 在java中使用Apache Tika从PDF文件中提取文本
- 20. 使用Java从文件中的特定列中随机读取文本
- 21. 使用CSV MODELE从大文件中提取文本的特定行
- 22. 使用awk从文本文件中提取特定字符的数量
- 23. Excel使用getElements提取特定文本
- 24. 使用jquery提取特定文本
- 25. 从一个文本文件提取特定的行到其他文本文件
- 26. Python从文本文件中提取特定数字
- 27. 从java的csv文件中提取特定的行
- 28. 用于从文本文件中提取特定模式信息的脚本
- 29. 如何使用python从文本文件中提取特定信息?
- 30. 使用文本索引从PDF文件中提取特定数据以找到
非常感谢你的一切帮助。 – anonuser0428 2012-08-11 21:07:30