我试图让HTML源代码以下列方式HTML源代码:获得通过C#中的WebBrowser控件
webBrowser1.Document.Body.OuterHtml;
,但它不工作。例如,如果原来的HTML源代码是:
<html>
<body>
<div>
<ul>
<li>
<h3>
Manufacturer</h3>
</li>
<li><a href="/4566-6501_7-0.html?
filter=1000036_3808675_100021_10194772_">Sony </a>(44)</li>
<li><a href="/4566-6501_7-0.html?
filter=1000036_108496_100021_10194772_">Nikon </a>(19)</li>
<li><a href="/4566-6501_7-0.html?
filter=1000036_3808726_100021_10194772_">Panasonic </a>(37)</li>
<li><a href="/4566-6501_7-0.html?
filter=1000036_3808769_100021_10194772_">Canon </a>(29)</li>
<li><a href="/4566-6501_7-0.html?
filter=1000036_2913388_100021_10194772_">Olympus </a>(21)</li>
<li class="seeAll"><a href="/4566-6501_7-0.html?
sa=1000036&filter=100021_10194772_" class="readMore">See all manufacturers </a></li>
</ul>
</div>
</body>
</html>
但webBrowser1.Document.Body.OuterHtml
输出是:
<body>
<div>
<ul>
<li>
<h3>
Manufacturer</h3>
<li><a href="/4566-6501_7-0.html?filter=1000036_3808675_100021_10194772_">Sony </a>(44)
<li><a href="/4566-6501_7-0.html?filter=1000036_108496_100021_10194772_">Nikon </a>(19)
<li><a href="/4566-6501_7-0.html?filter=1000036_3808726_100021_10194772_">Panasonic
</a>(37)
<li><a href="/4566-6501_7-0.html?filter=1000036_3808769_100021_10194772_">Canon </a>
(29)
<li><a href="/4566-6501_7-0.html?filter=1000036_2913388_100021_10194772_">Olympus </a>
(21)
<li class="seeAll"><a class="readMore" href="/4566-6501_7-0.html?sa=1000036&filter=100021_10194772_">
See all manufacturers </a></li>
</ul>
</div>
</body>
,你可以看到,许多</li>
都将丢失。
有没有办法让WebBrower
正确控制HTML源码?请注意,在我的应用程序中,我尝试使用WebBrowser
向每个节点添加坐标信息并输出其HTML源,并添加了作为节点属性添加的坐标信息。
有人可以帮我一个忙吗?
是的,DocumentText和DocumentStream都可以返回正确的HTML源代码。但是当我在DOM树(myIHTMLElement.setAttribute())中为节点添加一些属性时,WebBrowser1.DocumentText获得的HTML源不包含任何附加属性 – Rockycqu 2011-03-02 09:38:49
@Rockucqu,InnerHtml属性如何返回正确的html? – VinayC 2011-03-02 10:15:41