2015-09-28 91 views
0

我试图从HTML编码的字符串中检索前10个单词。从HTML文档中检索单词量

此刻我被空白分裂。问题是标签参数中的空格被识别为单独的单词。

我需要一种机制,使我可以在HTML或JavaScript中正确格式化HTML文档预览为字符串。

有人有想法吗?

在HTML字符串中,有列表,段落,颜色等,但没有像异国情调的形式,收音机,内部框架,表格或闪存

+2

你可以给一个字符串的例子吗? – Saar

+3

你将需要使用一个html解析器来做到这一点..一个简单的字符串处理可能不会给你你正在寻找的结果 –

+0

http://jsfiddle.net/arunpjohny/t0xntsyh/5/? –

回答

0

如果您需要做的Ruby这份工作,你可以使用宝石引入nokogiri 。这对你的工作是完美的。 Here你有一些如何使用它的例子。 Nokogiri是有据可查的,易于使用。