data-extraction

    1热度

    2回答

    如何使用Linq从目录中的每个XML文件提取单个XML属性并将该元素放入C#列表中。我是否必须逐一循环每个文件? XML文件非常大,所以我想在不将整个文件加载到内存的情况下执行此操作。 感谢, Ĵ

    6热度

    2回答

    我正在寻找类似HTML::TableExtract的东西,只是不是用于HTML输入,而是用于包含使用缩进和间距格式化的“表格”的纯文本输入。 数据看起来是这样的: Here is some header text. Column One Column Two Column Three a b a b c Some more text An

    7热度

    4回答

    我想在Google地图网页中提取一组约50-100个引脚的经度和纬度。我不控制网页,我不需要多做一次,所以我正在寻找快速而肮脏的东西。我有FireBug以及Chrome的FireFox,我需要的是比重新输入所有数字更容易的事情。

    0热度

    1回答

    我正在处理大量的html文档。我的任务之一是从文档中提取所有文本。我已经得到了很多,但现在我因为使用​​表格作为容器/格式化结构来获得非数字性质的信息而难住了 我的目标是忽略 - 留下 - 不提取'表'是一个数字字段表 我准备实施基于暴力规则的方法,通过获取一个表,并且如果超过一定比例的td.text_content()可以分类为数字,我将决定该表是一张数值表 我想知道如果别人可以建议更好的方法

    -2热度

    1回答

    如果文章是关于Lebron_James,那么我会知道它是关于一个运动员。

    2热度

    5回答

    我有一个应用程序,它显示我一些数据。我需要附加到这个应用程序的进程,找到我需要的内存(实际上是一个单一的数字),并将其保存在某个地方。这个应用程序似乎没有使用标准的Windows控件,所以事情不会像使用AutoIt或类似的东西读取控件数据那么简单。 目前我是一个自学习者数据库家伙,并且对Windows应用程序调试的知识还很浅。甚至不知道我是否正确地问了我的问题。 那么,你能给我一些关于我应该先读什

    1热度

    1回答

    我想提取动态网页上的所有ISBN,我无法通过Yahoo管道输入(用户必须登录才能看到页面)。有没有办法做到这一点与jQuery?怎么样? 编辑: 结构: 这里的HTML是什么样子该网页上的例子。有一个<table>,其中有一系列<tr>元素。其中一个示例大致如下: <tr> <td>(required/optional)</td> <td>LAFORE</td> <t