2008-11-11 85 views
4

我正在寻找一个.NET库,将允许创建一个Word文档。我需要将基于HTML的内容导出为Word文档(97-2003格式,而不是docx)。导出到Word文档在C#

我知道有Microsoft Office自动化库和Office互操作,但据我所知,他们要求你有办公室实际安装,他们通过打开自己的词做转换。但是我不希望为了转换工作而安装办公室。

编辑:如果可能,转换为RTF甚至可能工作。

回答

6

它会工作,如果我以某种方式转换的CSS嵌入HTML?

是的。正如我所提到的,我使用内部样式表。

文件的例子:

<html> 
<head> 
<STYLE type="text/css"> 
    h1 {text-align:center; font-size:12.0pt; font-family:Arial; font-weight:bold;} 

    p {margin:0in; margin-bottom:0pt; font-size: 10.0pt;font-family: Arial;} 
    p.Address {text-align:center;font-family:Times; margin-bottom: 10px;} 
</style></head> 
<body> 
<p class="Address">The Street</p> 
<h1>Head</h1> 
+1

我们也是这样做的,以允许我们的动态页面被“导出”为Word。提取页面内容HTML,然后将其插入Word HTML文档模板的中间,该模板已包含html所需的所有样式。 – 2008-11-12 14:38:54

0

由于doc格式规范未打开,互操作程序集是Microsoft解决方案,所以我担心它们是您的主要(甚至是唯一)选项。

他们的确需要安装Office,他们打开Word(尽管显示窗口是可选的)。

我想Word可以打开HTML文档;这是你的选择吗?

+1

Bzzt! Word-ML格式的文档规格免费提供。事实上,在我的场景中,我从MS-Word生成了一个单独的XML文件,然后在该XML文件中的字段上进行了文本替换,以“动态生成”一个新文档,并以邮件合并的方式。简单,容易。 – Cheeso 2009-02-26 10:16:35

+0

这就是XML格式,对吧?问题是关于二进制Word格式... – 2009-02-26 18:10:36

2

我发现文档输出为HTML但调用.doc将在Word中正确打开格式。我使用Word 2000和带有内部样式表的文件进行了测试。

0

我尝试了字,这在技术上的工作,除了一件事......我的HTML文档包含CSS,并在Word中打开时,直接打开HTML,它完全忽略的CSS,所以我不再有任何的格式。我意识到我不会把所有的东西都拿出来,但我至少还想拥有指定的字体,字体大小等等......有什么办法让它读取CSS?如果我以某种方式将CSS嵌入到HTML中,它会起作用吗?

0

有一个叫JODConverter工具,挂钩到开放式办公揭露它的文件格式转换器,有作为一个Web应用程序提供的版本(坐在tomcat中),你可以发布到一个命令行工具。我一直在解决它的HTML问题,并且成功转换为.doc和pdf,这是一个相当大的项目,还没有开始,但我想我会使用它。 http://sourceforge.net/projects/jodconverter/