我正在使用Jsoup。 我做得到document= connect.get();
并获得html页面。从网站获取超链接
现在我把它写到一个文本(字符串)。
我有填充这些页面的用户。 我知道每个用户名。这些页面有用户名。 我能够做一个string.contains(“用户名”)来检查用户是否存在。
现在我的问题是: 我有一个有名字的用户在
表
有序列表中体
无序列表
但在所有这些情况下,他们格式为:示例
<li><a href="http://university.xxx.students.com/grade9/john/117429">2012 academic record</a></li>
有些是表和所有..
在这个例子中,我知道学生的名字=约翰。 我怎样才能得到所有的网址?
==
我认为不是所有的URL是这样的: 'http://university.xxx.students.com/grade9/' 是否正确? –
是的。有些是在表格中,有些学生有--http://university.xxx.students.com/grade9/john/117429“>约翰 li和所有.. –
我正在寻找greping的页面。如果在链接(或)文本中存在学生姓名,则提取链接。 –