如何从html页面中提取文本?例如,网页是我想要取文本的链接http://www.atempodihockey.it/campionati/campionati-hil/serie-a1-2013-2014/calendario.html。我必须有球队的名字,比赛如何从html页面提取文本?
回答
为了这个目的的resoult,您可以使用HtmlAgilityPack
做得一样follwing ...
在项目中加入HtmlAgilityPack的参考。
using HtmlAgilityPack;
,然后把网址以获得完整的页面
HtmlWeb webGet = new HtmlWeb();
HtmlDocument document = webGet.Load("http://www.atempodihockey.it/campionati/campionati-hil/serie-a1-2013-2014/calendario.html");
从“文件”变量,你可以得到你预期的文本的HTML
当我复制你写的文本时,我有var和HtmlWeb的问题(HtmlWeb是类?) –
您是否添加了对HtmlAgilityPack的引用? – gypsyCoder
是的但是正常,我有HtmlWeb e var的问题? –
我想下面的代码可以帮助ü
webView = (WebView) findViewById(R.id.webterms);
webView.getSettings().setJavaScriptEnabled(true);
webView.getSettings().setPluginsEnabled(true);
webView.getSettings()
.setUserAgentString(
"Mozilla/5.0 (Linux; U; Android 2.0; en-us; Droid Build/ESD20) AppleWebKit/530.17 (KHTML, like Gecko) Version/4.0 Mobile Safari/530.17");
创建webview后加载你的url或html页面
webView.addJavascriptInterface(new MyJavaScriptInterface(),"HTMLOUT");
webView.setWebViewClient(new WebViewClient() {
@Override
public boolean shouldOverrideUrlLoading(WebView view, String url) {
view.loadUrl(url);
return false;
}
@Override
public void onPageFinished(WebView view, String url1) {
if (pDialog.isShowing()) {
pDialog.dismiss();
}
webView.loadUrl("javascript:window.HTMLOUT.processHTML(document.documentElement.innerText);");
}
});
webView.loadUrl(url);
然后创造出具有处理您的HTML
class MyJavaScriptInterface {
public void processHTML(String html) {
if (null != html && html.trim().length() > 0) {
System.out.println("your Html ->" + html);
}
}
你能告诉我只有一个页面的程序,因为我有一些问题要复制三个不同的部分到我的程序中。感谢 –
从我发现你必须在processHtml函数声明之前放置'@ JavascriptInterface' – ccwasden
- 1. 如何从html页面提取文本?
- 2. 如何从HTML页面中提取文本块?
- 3. 如何从C#中的HTML页面中提取此文本?
- 4. 如何从HTML页面提取链接?
- 5. 从html页面获取文本shell
- 6. 如何从HTML源文件中提取页面上可见的文本?
- 7. 如何提取从HTML标记文本
- 8. 如何从HTML页面文件中提取日期和时间?
- 9. PHP从html页面提取所有文本
- 10. Java库从HTML页面中提取文本块
- 11. 从多个页面上的特定HTML位置提取文本
- 12. 如何从Perl中的HTML页面上的链接中提取文本?
- 13. 从HTML中提取文本
- 14. 从html中提取文本?
- 15. 从HTML中提取文本
- 16. 如何从PDF页面获取文本?
- 17. jQuery:如何从页面获取文本?
- 18. 通过从其他HTML页面提取的DIV生成HTML页面的脚本
- 19. 如何使用jsoup从此html页面获取文本?
- 20. 如何从pdf页面使用Zend_Pdf提取文本
- 21. 使用php从html页面提取href
- 22. sed从html页面提取链接
- 23. 从html页面提取classes/id
- 24. 从html页面提取内容
- 25. 从HTML页面提取段落
- 26. 从HTML页面提取数据(Python)
- 27. 如何从网页获取文本到我们的本地html页面?
- 28. 从HTML文本提取标题文本
- 29. 如何从html页面打开本地html文件?
- 30. 如何从html页面获取xPath(WebView)
你想提取整个HTML页面的文本一个方法的类? –
使用'HtmlAgilityPack'获取html页面 – gypsyCoder
但是我有HtmlAgilityPack的问题 –