2016-09-19 57 views
0

我从编辑内容,这样的内容包括像这样在C#中-controller“ DDDDHtml.Raw在控制器

我必须从内容中删除html标签,因为我写这篇文章的内容为PDF格式(PDF生成html标签使用itextsharp.DLL但iTextSharp的HTML标记内容的行动),它不显示HTML标记,你可以看到屏幕下面

enter image description here

有在C#中没有Html.Raw功能或HtmlHelper.Raw功能(作用 - 控制器)

我应该怎么办呢?我尝试删除HTML标签与正则表达式,但内容是非常复杂的,它是动态的,所以有很多很多的html标签

回答

0

一种方法是使用HTML解析器像HTML Agility Toolpack。我已经成功地用它来解决你所描述的问题(但在其他方面与它的发展无关)。从该网站:

这是一个灵活的HTML解析器,建立一个读/写DOM和支持纯XPath或XSLT(你居然没有了解XPATH也不XSLT使用它,不要担心。 ..)。它是一个.NET代码库,允许您解析“离开网页”的HTML文件。解析器对“真实世界”格式错误的HTML非常宽容。对象模型与提出System.Xml非常相似,但是对于HTML文档(或流)。

你会在网上找到很多的例子来定制你的需求。

+0

Allahrazıolsun :) @codenoir – user1688401

+0

Buhiçbirsorun,arkadaşım! –

0

您可以使用Html.RawHtml.Json在控制器这样

如果我用这个在查看

var attrilist = @Html.Raw(Json.Encode(attriFeildlist)); 

那么我可以用这作为代码在控制器中的备用代码,如

var jsonencode = System.Web.Helpers.Json.Encode(attriFeildlist); 
var htmlencode= WebUtility.HtmlEncode(jsonencode);