是否有任何可靠的方法来找出指向我们详细新闻页面的链接集合。换句话说,在访问网站的第一页之后,我只想要那些指向新闻项目的链接。任何解决方案从新闻网站摘录新闻链接
0
A
回答
0
如果是针对某个特定的网站,您可以随时尝试获取该网站的HTML并使用正则表达式提取到新闻报道的链接。只需在HTML中找到代码可用于识别链接位置的部分即可。
我这样做了几次,以从网站上刮取一些信息。
但也许一个明显的问题,网站上没有RSS提要?
0
你可以做一个简单的WebRequest并下载一个页面并搜索你想要解析的内容的html。
WebRequest req = WebRequest.Create
("http://www.domain.com/news.html");
req.Proxy = null;
using (WebResponse res = req.GetResponse())
using (Stream s = res.GetResponseStream())
using (StreamReader sr = new StreamReader(s))
File.WriteAllText("news.html", sr.ReadToEnd());
//search through html page for news content.
System.Diagnostics.Process.Start("news.html");
相关问题
- 1. 无法凑新闻网站
- 2. 生成一种智能新闻摘录
- 3. 如何制作新闻网站新闻可搜索
- 4. 从Google新闻获取链接列表
- 5. 重定向从/新闻到/新闻/
- 6. 新闻网站的Java矫枉过正?
- 7. 新闻网站爬行不起作用?
- 8. 联机新闻网站的RDF数据
- 9. Google Blogger新闻提要网站
- 10. 新闻网站的SQL表结构
- 11. 添加新闻页面后,新闻没有出现在Morea Framework网站上
- 12. 添加链接到Facebook新闻订阅
- 13. 新闻提要API的一般新闻
- 14. 从谷歌新闻中提取前10条新闻
- 15. 无法从黑客新闻中刮取新闻标题
- 16. TYPO3新闻hidePagination
- 17. 新闻聚类
- 18. 有一个Python新闻网站这是RubyFlow的接近相等?
- 19. (How)我可以制作新闻摘录吗?
- 20. 是否有任何新闻/链接共享网站有一个很好的API?
- 21. 如何获取网站在Twitter上发布的最新新闻
- 22. 解析从一个希伯来新闻网站的Rss饲料
- 23. 从Wordpress网站开发新闻应用程序
- 24. 这个网站如何从顶部滑动它的新闻稿?
- 25. 通过xml/rss从Webforms导入新闻网站到Wordpress
- 26. 如何通过RSS从其他网站获取新闻
- 27. HTML更新新闻页面
- 28. 更新CMS上的新闻
- 29. RSS新闻推送
- 30. Django Google新闻Sitemap.xml