2012-07-15 105 views
4

是否可以使用gdata javascript或任何其他javascript api检索基于标签的博客帖子列表?使用Gdata根据博客中的标签检索帖子

我的使用案例:

每篇博文都有一个标签,表示其类别。某些帖子标有“摘要”及其所属类别。

我希望能够显示MyCategory(标签)的标签页面上的总结。例如http://myblog.blogspot.com/search/label/MyCategory

是否有可能检索博客文章的匹配“摘要”和“MyCategory”名单?

UPDATE:

更多细节:

  • 这是一个博客,我必须
  • 编辑权限JS可以放在谷歌的网站或博客的HTML
  • 的博客有内部18k +的帖子,所以列出所有帖子和过滤不是一个选项。
  • myblog.blogspot指的是任何博客,而不是实际的博客。我只是在谈论基于标签的博客过滤器。

回答

1

我已阅读并重新阅读此问题和blogspot-link几次。这很难理解。

我认为,如果你给一些更多的信息,这将有助于:

  • 你在哪里要放置这个JavaScript?我的意思是:是否将 放置在同一个博客上?我在问,因为这决定了跨站点安全要求。
  • 我有一种强烈的感觉,这其实是要跨域请求的问题(从不同的域加载数据|服务器(blogspot.com)),你不要管,否则你会跟你玩游戏'Access-Control-Allow-Origin'在服务器端。
  • 此脚本位于在线或本地(x)html源代码中吗?
  • 能否请您提供包含的这个标签,还是你想抓取像蜘蛛博客中现有列表的更详细的例子(或样品)|指数机器人?

如果上述假设是正确的,你的问题的第一部分检索cross-domain data(这是很难用现在是XMLHttpRequest又名AJAX简单的解决方案)。
然后,您可以开始查看一些自己的服务器端脚本(php)以获取此数据并将其发送(预解析)到您的浏览器应用程序(实际上,这只是位于您自己的域中的代理)。
我也听说过使用Java对象(或silverlight?或flash,现在也有cross-domain-security restrictions),以解决这个现代的跨域安全问题。
然后,您可以嵌入一个或多个这些对象(即检索源代码)并通过javascript与它们进行通信。这种技术的一个变体也经常用于跨浏览器的多文件上传。
在StackOverflow上,您的问题的这一部分已经有一个解决方案(对象)了。

如果你解决了这个问题的第一部分,你的问题的第二部分简单归结为解析(例如正则表达式)你检索到的'标签'数据,从它们建立新的链接来检索'摘要'内容你在哪里后,使用相同的数据检索技术,以获得标签列表中的第一位..

这是你在什么之后?

更新: 在纯javascript/json中有一个excellent这个主题在SO上。
你应该去用java,你可以看看this
在php中,您使用file_get_contents()file_get_html()。另请参阅SO上的this topic

UPDATE2:接受的答案(出评论的下面:)
对谷歌的开发者博客文档2.0,你可以找到:RetrievingWithQuery
引用:

/类别
指定类别(也称为标签),以过滤进料的结果。例如, blogger.com/feeds/blogID/posts/default/-/Fritz/Laurie返回条目 与标签Fritz和Laurie。

您还可以找到采用此方法在这里的JavaScript的工作件:list-recent-posts-by-label

现在,你可以简单地继续“AJAX'ing这个过滤列表中你总结的了。

祝你好运!

+0

嗨。谢谢,但那不是我追求的。请参阅更新。 – 2012-07-24 18:47:16

+0

我的问题不在于如何阅读页面。更像是:我应该访问哪些查询应该/ feed/url来获取该信息。在阅读您的更新后: – 2012-07-24 19:18:22

+0

:从逻辑上说,您不想抓取18k +文章。我猜你没有访问包含标签和内容的数据库?否则,它将是一个简单的sql语句。如果可以实现这样一个简单的搜索页面(如果他们还没有),那么你可能想问一下blogspot.com,那么你会很乐意与AJAX一起使用技术(在我的awnser的更新中提到),因为只要javascript(可以在其他地方托管)在同一个域的页面上运行,跨域安全部分就不成问题。 – GitaarLAB 2012-07-24 19:23:40