2010-11-23 99 views
2

试图找到一种正确的方法将HTMl变成纯文本表格。任何人都知道是否有一个好的工具?无论是软件还是免费软件。最好在.net(C#)中。 我已经着手通过HTML敏捷包来做它,也许有更好的方法?使用html解析器仍然会留下很多复杂性,例如用不同的colspan来计算列宽和表格宽度等等...将html表转换为monospace字体纯文本表?

谢谢!

这里有一个例子: http://www.w3.org/TR/html401/struct/tables.html#h-11.5

实际上,我与财务报表,有更多不同的合并单元格的工作,但如指出,我想达到的目标。还必须限制表格的宽度。

+0

你希望你的“纯文本表”是什么格式? – Larsenal 2010-11-23 21:35:15

回答

0

看看source code to Links。这是一个基于文本的网页浏览器,因此它知道如何将表格呈现为文本。它用C编写,而不是C#,但它应该足以让你找出映射算法。