2015-09-28 60 views
1

我打算建立一个网站,在这里我可以分享我精心挑选的策划内容,并且我无法将自己的头围绕获取这些内容的基本想法无需通过API即可将数据输入到我的网站。如何从他人的博客文章中提取标题和图像,并在自己的网站上发布

我首先想到的也许我应该检查我想在我的网站上嵌入的页面的源HTML,并使用类似$('div.post').find('img').attr('src')的东西访问它。 但我无法想象自己每次都这样做,所以我猜想必须有更好的方法。

这就是Google+对他们的帖子所做的事情。一旦你添加一个URL链接,一秒钟后,它会从链接页面中提取精选图片和一些文本片段。

+0

尽管听起来这对javascript/jquery来说是完美的,但cetain可疑的声誉的人使用它是出于其恶意的原因,所以浏览器将其锁定,并且必须在远程服务器上启用它(您不太可能拥有它进入)。在此处阅读有关跨站点脚本的更多信息:https://en.wikipedia.org/wiki/Cross-site_scripting –

+0

您可以进行服务器端调用,但尚未提及服务器端技术(例如asp。净-mvc/php)。对于每个来源,代码也会有所不同。 –

回答

1

许多网站使用Open graph protocol获得元标题,元描述,图像等任何URL。

例如open:view-source:https://blog.kissmetrics.com/open-graph-meta-tags/并搜索“Open Graph Protocol Meta”。

它们包含在页面源代码中。您将不得不向您想要抓取的URL发送请求,并通过Regular Expr/HTML Parsers阅读适当的元标记。

+0

谢谢。我读过你分享的文章。那么,它只适用于javascript吗? –

+0

因为@ freedomn-m所说的Cross来源政策,您无法使用前端JavaScript。您需要从服务器端语言(例如Java/PHP/Py/NodeJS)发送Web请求。如果您熟悉Nodejs(服务器端js),则可以在NodeJS中完成。 – Ananth

+0

嗨,我不知道如果JSONP可以是一种解决方法,所以我不需要服务器端脚本? –

1

你不能用javascript做到这一点。你需要一个服务器端脚本来下载你需要的页面,然后用DOM解析器解析它。

使用PHP,您可以使用cURL获取一个URL的内容。

查看更多:

http://php.net/manual/es/book.curl.php

相关问题