我用这简单的算法搜索文件的一些文字和taging所在的页面,我发现它加快字符串搜索算法
for (int i = 1; i <= a.PageCount; i++)
{
Buf.Append(a.Pages[i].Text);
String contain = Buf.ToString();
if (contain != "")
{
// Inside is dictionary of keys and value contain page where I found it
foreach (KeyValuePair<string, List<string>> pair in inside)
{
if (contain.Contains(pair.Key))
inside[pair.Key].Add((i).ToString());
}
}
Buf.Clear();
}
我都没有问题,但是当我在700多页的文档搜索而我正在寻找超过500个按键,它的速度非常慢,需要大约1-2分钟才能通过,有什么办法可以加速它?我正在使用c#
谢谢!
什么样的文件是?你能开始确定什么键实际上在整个文件中,然后在逐页的基础上搜索那些键? – 2012-02-10 21:27:45
它的pdf文件,但它没有关系的文件格式,它的产品目录和一些页面包含产品类型的表 - 我需要创建索引的所有键 - 它们在哪里 - 他在页面 – 2012-02-10 21:30:24