这是我在空闲时间尝试做的事情。但是我还不确定我可能面临的复杂性和问题。我想去像这样的网址:https://fred.stlouisfed.org/series/DFII5和保存此图表作为图像,本地任何地方在我的电脑上。将html表格/图表元素转换为图片
我的第一个方法是为使用的HTML敏捷包:
var document = new HtmlWeb().Load("https://fred.stlouisfed.org/series/DFII5");
var urls = document.DocumentNode.Descendants("img")
.Select(e => e.GetAttributeValue("src", null))
.Where(s => !String.IsNullOrEmpty(s));
,甚至使用的WinForms Web浏览器控件:
private void GetWebpage(string url)
{
WebBrowser browser = new WebBrowser();
browser.Navigate(url);
browser.DocumentCompleted += new WebBrowserDocumentCompletedEventHandler(browser_DocumentCompleted);
}
void browser_DocumentCompleted(object sender, WebBrowserDocumentCompletedEventArgs e)
{
var browser = (WebBrowser)sender;
var client = new WebClient();
foreach (var img in browser.Document.Images)
{
var image = img as HtmlElement;
var src = image.GetAttribute("src").TrimEnd('/');
if (!Uri.IsWellFormedUriString(src, UriKind.Absolute))
{
src = string.Concat(browser.Document.Url.AbsoluteUri, "/", src);
}
//Append any path to filename as needed
var filename = new string(src.Skip(src.LastIndexOf('/') + 1).ToArray());
File.WriteAllBytes(filename, client.DownloadData(src));
}
}
这两种方法都能够从获取所有图片该网页,但图表是我想要的,它不是一个图像。
这个任务可能吗?我需要图书馆/新手来做这件事吗?我将如何去实现这一目标?注意:在C#中没有必要这样做,它可以是Python或其他任何东西。
编辑一些进一步的研究把这些2至我的注意:http://www.princexml.com/和https://wkhtmltopdf.org/
他们都是HTML到PDF库从我的理解。是否有可能使用这些,只获得图表的HTML并将其转换为PDF?
使用硒去网页并截图。你可以参考https://stackoverflow.com/questions/35921168/how-can-i-get-screenshot-of-specified-element-using-webdriver-in-c-sharp –