2013-02-27 92 views
1

我必须处理密集格式化的HTML中存在的问题,这些问题实际上是无法读取的,所以我希望图书馆能够“漂亮地打印”,格式化,美化等等你想在管理这个HTML的.NET应用程序中调用它。寻找一个离线库来格式化HTML,我可以使用.NET代码

目前,我将其复制并粘贴到Visual Studio 2012中,并将其格式化,然后将其粘贴回应用程序,但这变得有点乏味。

如果能够在解决问题时有效地逆转过程并去掉所有的空白区域,它也会很方便。

顺便说一句,我知道改变HTML格式有时会导致意想不到的结果(我在看你IE),但我可以忍受。

+0

使用IDE他们有格式化功能,您可以在其中格式化整个文档或指定的选择。 – MethodMan 2013-02-27 19:47:31

+0

@DJKRAZE:OP使用IDE,但它是手动的,需要自动执行此过程。 – 2013-02-27 19:50:22

+0

不要关闭!这是一个很好的问题! – nalply 2013-02-27 20:25:18

回答

5

退房Html Tidy for .NET/Mono

从项目页面:

TidyManaged

这是一个托管的.NET /单声道包装领域的开源,跨平台的整理图书馆,HTML/XHTML/XML标记分析器&清洁器最初由Dave Raggett创建。

而且样品用量:

using System; 
using TidyManaged; 

public class Test 
{ 
    public static void Main(string[] args) 
    { 
    using (Document doc = Document.FromString("<hTml><title>test</tootle><body>asd</body>")) 
    { 
     doc.ShowWarnings = false; 
     doc.Quiet = true; 
     doc.OutputXhtml = true; 
     doc.CleanAndRepair(); 
     string parsed = doc.Save(); 
     Console.WriteLine(parsed); 
    } 
    } 
} 

看起来它应该满足您的需求完美。

+0

我有这样的感觉,但在VS2012解决方案中引用DLL(我认为是COM组件)时遇到了问题。即使如此,我真的想要托管代码解决方案。 – CrispinH 2013-02-28 08:43:37