data-extraction

    0热度

    1回答

    我知道ICR基本上用于手写(手印)数据识别,但我们是否可以利用ICR提取扭曲(质量差)的机器打印文本? 如果没有什么是解决以下问题 我有可能会碰到2个或更多的页面,使文档中很少有日期字段非结构化文档,这将是handwritten.now我想最好的办法将其转换为文本文件。 我已经尝试了一些fullpage ocr(omnipage和abbyy等)工具,它们有ICR模块转换成文本文件。 他们擅长整页O

    2热度

    2回答

    我可以使用TAG..EXTRACT..SAVEAS获取URL并将其写入文件。如果我在脚本中执行了这10次,则该文件仅包含最后提取的URL - 文件正在被覆盖。我没有看到有关如何附加到现有文件的任何文档。我宁愿不必为每个URL指定它自己的文件名,然后从命令提示符中加入所有这些文件。 iMacros for Firefox 7.6.0.2;的Windows XP SP3

    0热度

    2回答

    我想在GATE中使用TermRaider功能。有人可能会发布一些示例代码来加载和使用这个资源在Java类。我尝试过跟随但失败。 Gate.getCreoleRegister().registerDirectories(new URL("file:///D:/misc_workspace/gate-7.1-build4485-SRC/plugins/TermRaider")); Proc

    2热度

    1回答

    在表1中:在A列中,我有日期。在B列我有货币值。在工作表2中,如何才能找到工作表1中仅与某些指定的一周日期范围相对应的货币值总和?

    0热度

    2回答

    我通过串口通信在字符串中接收我的数据。那部分工作正常。的数据是在以下格式: Distance run: 36in. Direction in degrees: 275 Total of person founds:11 New Person found in: Lat/Long: 18.38891, -66.12174 Date: 5/4/2013 Time: 19:13:35.0

    -1热度

    1回答

    请允许我解释一下我的一套代码后需要 <tr> <td align="center"><a href="search.asp?keyword=1123">1123</a></td> <td> </td> <td> </td> <td> </td> <td align="center"><a href="member.asp?t_id=75481&t=0"></a> TEXT</

    2热度

    1回答

    $store = curl_exec($ch); // Returns a page of HTML $doc = new DOMDocument(); $doc->loadHTML($store); $xpath = new DOMXpath($doc); Vardump $xpath: object(DOMXPath)#2 (1) { ["document"] => st

    0热度

    1回答

    我有一个要求将数据从Pervasive-SQL 7的数据库文件中提取到CSV格式。 我得到包含应用程序的可执行文件(可能开发VB6)和一个文件夹中的数据文件的ZIP压缩文件,并且只告诉应用程序使用普适-SQL 7 因为从来没使用前普适-SQL我不确定如何开始。我下载了第7版客户机/服务器数据库引擎的副本,并将其安装在Windows XP工作站上。但是我不确定如何从那里继续?如何浏览数据? 我需要从

    0热度

    1回答

    我是新来的PHP。作为课程作业的一部分,我需要从网站提取数据并使用该数据呈现表格。 P.S. :使用正则表达式不是一个好的选择,但我们不允许使用像DOM,jQuery等任何库。 字符集是UTF-8。 $searchURL = "http://www.allmusic.com/search/artists/the+beatles"; $html = file_get_contents($searc

    0热度

    2回答

    如何计算我从JSON中抓取的条目? 下面的例子有6个条目,但你可以看到..如果添加了一个条目,我的代码将忽略它。我可以循环10次,如果它什么都没有收到,那就停下来,但我认为这是一个不好的方法。 是否有任何简单的代码在接下来的JSON中提取6'季节'? MYPAGE.PHP //Get the page $str = file_get_contents('http://myjsonurl.here