我需要从任意网页中提取文本(只有纯文本)(我在服务器上绕过了一个简单的php代理的跨域问题)。 我做,像往常一样,jQuery:如何从页面获取文本?
$.get(url, function(data) {
process(data);
});
,并在我的过程()函数我有网页的内容。 我想在该页面中考虑一个特定的div(这里是'#my-div'),或者如果不存在 - 作为后备 - 整个主体。
我愿做这样的事情:
function process(content) {
if ($(content).find('#my-div'))
$('#output').text($(content).find('#my-div').text());
else
$('#output').text($(content).find('body').text());
}
但我总赌注得到一个空的结果时,“发现”“体”:什么建议吗?
如果要打印的内容的整个变量里面是什么东西?它有身体标签吗? – 2012-02-20 16:22:42
我以前遇到过这个问题。在我的情况下,响应('内容')没有正确的xml格式;检查错误控制台(萤火虫/火狐)... – mshsayem 2012-02-20 16:24:22
整个变量包含页面的全身,包括html标记,我想忽略... – MarcoS 2012-02-20 16:25:53