2017-04-14 51 views
0

从Blob提取器接收文件对于当前层而言太大的错误,这是基本的。我将升级到更高层,但我注意到最大尺寸目前是256MB。使用Azure搜索blob提取器处理大文件

当我有PPTX文件,主要是视频和音频,但我有兴趣的文本,有没有办法索引这些? blob提取器最大文件大小实际上意味着什么?

我可以告诉提取器只采取第一个X MB或字符,只是停止?

回答

1

有在团块索引两个相关的限制:

  1. 最大的是你打文件大小限制。如果文件大小超过该限制,索引器不会尝试下载它并产生错误,以确保您知道该问题。我们不仅仅需要第一个N字节的原因是因为为了正确解析许多格式,需要整个文件。您可以将斑点标记为可滑动或将索引器配置为忽略大量错误,如果您希望它在遇到过大的斑点时取得进展。

  2. 提取文本的最大尺寸。如果文件包含的文本比这更多,索引器会将N个字符限制为最大值,并包含警告信息,以便您能够意识到问题所在。当然,无法提取的内容(例如至少今天的视频)不会影响这个限制。

您需要索引的PPTX有多大?我会在评论中添加我的联系信息。

+1

您需要索引的PPTX有多大?你可以在eugenesh的微软域名 –

+0

上联系我,感谢Eugene。是的,由于嵌入的视频和图像,文件非常大。很多时候,他们超过500MB,有时可以达到1.5GB + –

+0

嗨保罗,请给我发电子邮件进一步讨论。谢谢! –