2014-09-20 50 views
8

我在处理XLS文件时遇到了PHPExcel的内存问题。 我必须使用相当大的文件(在50k到200k行和9-10列之间),所以我不得不使用ReadFilters来解决内存问题。PHPExcel仅在使用XLS文件时超出了内存使用量

但是,尽管XLSX文件运行良好,对块大小使用混合的后台进程和一些简单的计算,但我无法使其与XLS文件一起工作。

这是一切爆炸的一段代码:

Class ExcelReadFilter implements PHPExcel_Reader_IReadFilter 
{ 
    private $startRow = 0; 
    private $endRow = 0; 

    public function setRows($startRow, $chunkSize) { 
     $this->startRow = $startRow; 
     $this->endRow  = $startRow + $chunkSize; 
    } 

    public function readCell($column, $row, $worksheetName = '') { 
     if (($row >= $this->startRow && $row < $this->endRow)) { 
      return true; 
     } 
     return false; 
    } 
} 

PHPExcel_Settings::setCacheStorageMethod(PHPExcel_CachedObjectStorageFactory::cache_in_memory_serialized); 

.... 
$filter = new ExcelReadFilter(); 
$filter->setRows($desde, $cuantas); 

$reader = PHPExcel_IOFactory::createReader($this->file_type); 

$reader->setLoadSheetsOnly($sheet_name);  
$reader->setReadDataOnly(false);  
$reader->setReadFilter($filter); 

$chunk = $reader->load($this->file); 
$chunk->setActiveSheetIndexByName($sheet_name); 

$active_sheet = $chunk->getActiveSheet(); 
$rowIterator = $active_sheet->getRowIterator($desde); 
$this->num_filas = $active_sheet->getHighestRow(); 

紧接着,我包括以下行有发生了什么更好的主意:

ob_start(); 
var_dump($rowIterator); 

$f = fopen("excel-info.txt", "w"); 
fwrite($f, ob_get_clean()); 
fclose($f); 

ob_end_clean(); 
die; 

而且我觉得它指出了内存问题。 当我第一次上传原始的XLS文件时,excel-info.txt的大小为13M。 然后我打开XLS文件并将其保存为XLSX,并重复该过程,之后,excel-info.txt仅为285k。

有没有什么办法可以修改这些过滤器来处理XLS文件?

哦,并且将PHP内存限制设置为更高的值不是一个选项,但执行时间并不重要。

ADDED

当我使用不同的内存缓存选项,我能够减少内存使用量足以令它的工作,并保持它在大多数情况下可接受的大小。

现在,我正在使用PHPExcel_CachedObjectStorageFactory :: cache_to_sqlite,它似乎足以使它工作。

我想说的是,我对序列化信息所做的计算放在文件中是不正确的。 Excel5文件会生成一个具有尽可能多的记录的数组,因为行的excel文件的所有值都不符合设置为NULL的过滤条件。当然,当我将它保存到一个文本文件,具有类似......

array(10) { 
    ["A"]=> 
    NULL 
    ["B"]=> 
    NULL 
    ["C"]=> 
    NULL 
    ["D"]=> 
    NULL 
    ["E"]=> 
    NULL 
    ["F"]=> 
    NULL 
    ["G"]=> 
    NULL 
    ["H"]=> 
    NULL 
    ["I"]=> 
    NULL 
    ["J"]=> 
    NULL 
} 

...需要很大的空间,在该文件中,但不应该在php_memory,所以这是我的错。现在

,我使用这个代码,以保持内存使用情况的跟踪:

for ($i=1; $i < 20000; $i+=5000){ 
     $filter->setRows($i, 5000); 
     echo "\n1- Usage: ".(memory_get_usage()/1024)/1024; 
     $objPHPExcel = $reader->load($this->file); 
     echo "\n2- Usage: ".(memory_get_usage()/1024)/1024; 
     $sheetData = $objPHPExcel->getActiveSheet()->toArray(null,true,true,true); 
     unset($sheetData); 
     unset($objPHPExcel); 
     echo "\n3- Usage: ".(memory_get_usage()/1024)/1024; 
     } 

有了一定的XLS文件,它表明:

第一次迭代 1用法:4.3859634399414 2-使用:34.292671203613 3-使用:34.68034362793

第2次迭代 1-用途:34.68034362793 2-用途:34.68293762207 3-用法:34。684982299805

而且相同的文件,保存为XLSX后:

第一迭代 1-用途:4.2780990600586 2-用法:6.9042129516602 3-用法:7.2916641235352

第二迭代 1-使用方法:7.2916641235352 2-使用方法:7.5115432739258 3-使用方法:7.2813568115234

但是,我必须说,保存为XLSX后,大小减少了大约一半,因此我不能说它是一个错误还是它的预期行为。

+1

读过滤器应与Excel5 Reader和用Excel2007的阅读器相同的工作...但如果你对内存很紧张,那么你可能要考虑使用PHPExcel的单元缓存选项 – 2014-09-20 17:07:06

+1

也许他们应该,但它清楚地显示出不同的行为。我不确定,也许我没有按照我应该使用的过滤器,或者我错过了一些东西。我不确定内存限制,因为这是共享服务器,我必须小心。关于单元缓存选项,你能否指点我一些文档来尝试一下? – sergio0983 2014-09-20 17:16:01

+0

好吧,给我一个工作示例来证明这确实是代码中的一个错误,我会看看它.....我已经放弃花费数小时来搜索没有示例的报告的错误报告只是发现代码中没有任何问题 – 2014-09-20 20:16:55

回答

2

PHPExcel是一个内存猪。我已经将它用于多个客户端,并且发现您必须尝试使用​​php内存限制设置来找到可以加载客户端可能导入的平均文件的最佳位置。在一些项目中,我不得不使用高达8 GB的内存。当然,你在例程中使用 ini_set('memory_limit','16M')加载xls文件,而不是在php.ini文件中。

你试过setReadDataOnly(true)吗?

我认为原因是xls文件不仅仅是csv数据,而且还包含许多其他信息(比如字体和宏)。加载文件时,PHPExcel会尝试将所有部分加载到内存中,从而创建一个巨大的结构。

0

只需添加这条线(例如)

的ini_set( 'memory_limit的', '254M');

这将解决内存问题..

随意更改内存限制,使其适合于你的情况