csquery

    1热度

    1回答

    我有一个HTML文件如下: <h3> <div id='type'> Type 1 </div> <div id='price'> 127.76; </div> </h3> <h3> <div id='type'> Type 2 </div> <div id='price'>

    0热度

    1回答

    我使用CsQuery来读取HTML元素的值。 提前,我不知道<a>元素是否包含<font>元素。 有没有办法读取锚点的InnerText,无论它是否包含font元素? 方案1:字体元素中的文本 <div class="link"> <a href="http://www.example.com/1"> <font>Foo</font> </a> </div>

    1热度

    1回答

    我已经创建了一个新的控制台应用程序,并通过nuget安装了CsQuery,以编写一个应用程序来刮取一些HTML。 任何时候,我尝试使用CsQuery如: CQ dom = CQ.CreateFromUrl("http://google.com"); 我得到一个 “TypeLoadException是未处理” 错误如下: 我已经搜查SO和职位我已经阅读说,这是由于我的代码中的错误,但我所做的是复

    0热度

    2回答

    我正在尝试使用CSQuery来描述站点的DOM。如果我在IE中打开一个站点并检查一个元素,则它的HTML与使用CSQuery.CreateFromUrl方法加载的同一站点略有不同(属性的排序和值之间的间距)。例如,由IE生成的div样式为“style = margin-bottom:0.5em;”和相同的div CSQuery的Render方法生成不同的HTML“style = margin-bo

    0热度

    1回答

    我正在尝试创建一个爬网程序,我需要能够执行不同的查询以从爬网页中提取不同类型的数据。我一直在寻找到CsQuery为extracing数据,似乎当我有一个简单的CSS选择器作为 H4完美运行:包含(“texstring”) 我的问题是,我需要能够评估如下的复杂查询: [“h4:contains('textstring')”]。Parent()。Parent()。Find(“div”)。Find(“s

    0热度

    1回答

    我有一个N形式的网站。 Foreach窗体我想选择所有的输入元素。 如何在代码注释中看到(1)+(2)? doc = CQ.CreateFromFile("sample.html"); doc["form"].Each(e => { // 1) This returns only first level IEnumerable<IDomElement> i

    1热度

    2回答

    我试图打开一个HTML文件,通过匹配特定条件的div进行循环,然后通过符合特定条件的p标签循环。 CQ dom = CQ.CreateFromFile("page.html"); CQ document_divs = dom["div"]; document_divs.Each((i,document_div) => { string divid = document_div.Id

    1热度

    1回答

    我试图获取Wikipedia页面上每个锚标记的绝对URI。我认为.href属性应该给出绝对URI,但是当我在CsQuery中尝试它时,我发现它仍然给我相对URI。我应该如何获得绝对URI? static void Main(string[] args) { string url = "https://en.wikipedia.org/wiki/Barack_Obama";

    0热度

    1回答

    我在C#项目中使用CsQuery。 作为一个简单的例子我有一个P标签具有嵌套B-标签在它: <p>Lorem ipsum dolor sit amet, sanctus <b>TEST</b> Lorem ipsum dolor sit amet.</p> 我需要修改在每个标签的纯文本,这意味着P标签和内部内的文本在b标签,用另一种方法(路易斯()): IDomObject htmleleme

    2热度

    2回答

    我在学习如何使用CsQuery遍历dom来获取特定的文本。 的HTML如下: <div class="featured-rows"> <div class="row"> <div class="featured odd" data-genres-filter="MA0000002613"> <div class="album-cover"> <div c