每我遇到过这个问题的时候,图片对于画布来说太大了,更具体地说,即使是一个全裸的IMG
标签也会被包装在一个Chunk
中,并且会被包装在Paragraph
中,我认为图片是溢出段落,但我不是100%肯定。
这两个简单的修复方法是放大画布或指定HTML IMG
标记上的图像尺寸。第三种更复杂的路线是使用额外的供应商IMG_PROVIDER
。要做到这一点,你需要实现IImageProvider
接口。下面是一个
public class ImageThing : IImageProvider {
//Store a reference to the main document so that we can access the page size and margins
private Document MainDoc;
//Constructor
public ImageThing(Document doc) {
this.MainDoc = doc;
}
Image IImageProvider.GetImage(string src, IDictionary<string, string> attrs, ChainedProperties chain, IDocListener doc) {
//Prepend the src tag with our path. NOTE, when using HTMLWorker.IMG_PROVIDER, HTMLWorker.IMG_BASEURL gets ignored unless you choose to implement it on your own
src = Environment.GetFolderPath(Environment.SpecialFolder.Desktop) + @"\" + src;
//Get the image. NOTE, this will attempt to download/copy the image, you'd really want to sanity check here
Image img = Image.GetInstance(src);
//Make sure we got something
if (img == null) return null;
//Determine the usable area of the canvas. NOTE, this doesn't take into account the current "cursor" position so this might create a new blank page just for the image
float usableW = this.MainDoc.PageSize.Width - (this.MainDoc.LeftMargin + this.MainDoc.RightMargin);
float usableH = this.MainDoc.PageSize.Height - (this.MainDoc.TopMargin + this.MainDoc.BottomMargin);
//If the downloaded image is bigger than either width and/or height then shrink it
if (img.Width > usableW || img.Height > usableH) {
img.ScaleToFit(usableW, usableH);
}
//return our image
return img;
}
}
一个非常简单的版本要使用此供应商只需将其添加到供应商收集像你HTMLWorker.IMG_BASEURL
做:
providers.Add(HTMLWorker.IMG_PROVIDER, new ImageThing(doc));
应当注意的是,如果你使用HTMLWorker.IMG_PROVIDER
你负责搞清楚形象的一切。上面的代码假定所有图像路径都需要用一个常量字符串前缀,您可能需要更新它并在开始时检查HTTP
。另外,因为我们说我们想完全处理图像处理流水线,所以不再需要供应商HTMLWorker.IMG_BASEURL
。
的主要代码回路现在看起来是这样的:
string html = @"<img src=""Untitled-1.png"" />";
string outputFile = Path.Combine(Environment.GetFolderPath(Environment.SpecialFolder.Desktop), "HtmlTest.pdf");
using (FileStream fs = new FileStream(outputFile, FileMode.Create, FileAccess.Write, FileShare.None)) {
using (Document doc = new Document(PageSize.A4, 50, 50, 80, 100)) {
using (PdfWriter writer = PdfWriter.GetInstance(doc, fs)) {
doc.Open();
using (StringReader sr = new StringReader(html)) {
System.Collections.Generic.Dictionary<string, object> providers = new System.Collections.Generic.Dictionary<string, object>();
providers.Add(HTMLWorker.IMG_PROVIDER, new ImageThing(doc));
var parsedHtmlElements = HTMLWorker.ParseToList(sr, null, providers);
foreach (var htmlElement in parsedHtmlElements) {
doc.Add(htmlElement as IElement);
}
}
doc.Close();
}
}
}
最后一两件事,一定要指定张贴在这里,当你靶向其中iTextSharp的版本。上面的代码针对iTextSharp 5.1.2.0,但我认为你可能会使用4.X系列。
我试图创建和使用基于这种代码实现IImageProvider一类,但它不工作,我相信它与这条线有关: providers.Add(HTMLWorker。IMG_PROVIDER,新ImageThing(doc)); 我在C#中编码,当我添加到我的散列表时,我无法使用HTMLWorker.IMG_PROVIDER枚举。如果这个值只是一个字符串,这有什么关系吗?也许我需要从循环内部做更多的事情来实际执行ImageProvider类中的GetImage代码。我使用的是itextsharp 4.1.6,以防万一。 – Neitherman 2014-02-06 14:36:33
@Neitherman,请发表一个新的问题与你的尝试和什么不工作,引用这篇文章,如果它是有道理的。 – 2014-02-07 14:35:31
发布新问题: http://stackoverflow.com/questions/21684040/imageprovider-not-working-in-html-to-pdf-conversion – Neitherman 2014-02-10 17:32:30