我在处理XLS文件时遇到了PHPExcel的内存问题。 我必须使用相当大的文件(在50k到200k行和9-10列之间),所以我不得不使用ReadFilters来解决内存问题。PHPExcel仅在使用XLS文件时超出了内存使用量
但是,尽管XLSX文件运行良好,对块大小使用混合的后台进程和一些简单的计算,但我无法使其与XLS文件一起工作。
这是一切爆炸的一段代码:
Class ExcelReadFilter implements PHPExcel_Reader_IReadFilter
{
private $startRow = 0;
private $endRow = 0;
public function setRows($startRow, $chunkSize) {
$this->startRow = $startRow;
$this->endRow = $startRow + $chunkSize;
}
public function readCell($column, $row, $worksheetName = '') {
if (($row >= $this->startRow && $row < $this->endRow)) {
return true;
}
return false;
}
}
PHPExcel_Settings::setCacheStorageMethod(PHPExcel_CachedObjectStorageFactory::cache_in_memory_serialized);
....
$filter = new ExcelReadFilter();
$filter->setRows($desde, $cuantas);
$reader = PHPExcel_IOFactory::createReader($this->file_type);
$reader->setLoadSheetsOnly($sheet_name);
$reader->setReadDataOnly(false);
$reader->setReadFilter($filter);
$chunk = $reader->load($this->file);
$chunk->setActiveSheetIndexByName($sheet_name);
$active_sheet = $chunk->getActiveSheet();
$rowIterator = $active_sheet->getRowIterator($desde);
$this->num_filas = $active_sheet->getHighestRow();
紧接着,我包括以下行有发生了什么更好的主意:
ob_start();
var_dump($rowIterator);
$f = fopen("excel-info.txt", "w");
fwrite($f, ob_get_clean());
fclose($f);
ob_end_clean();
die;
而且我觉得它指出了内存问题。 当我第一次上传原始的XLS文件时,excel-info.txt的大小为13M。 然后我打开XLS文件并将其保存为XLSX,并重复该过程,之后,excel-info.txt仅为285k。
有没有什么办法可以修改这些过滤器来处理XLS文件?
哦,并且将PHP内存限制设置为更高的值不是一个选项,但执行时间并不重要。
ADDED
当我使用不同的内存缓存选项,我能够减少内存使用量足以令它的工作,并保持它在大多数情况下可接受的大小。
现在,我正在使用PHPExcel_CachedObjectStorageFactory :: cache_to_sqlite,它似乎足以使它工作。
我想说的是,我对序列化信息所做的计算放在文件中是不正确的。 Excel5文件会生成一个具有尽可能多的记录的数组,因为行的excel文件的所有值都不符合设置为NULL的过滤条件。当然,当我将它保存到一个文本文件,具有类似......
array(10) {
["A"]=>
NULL
["B"]=>
NULL
["C"]=>
NULL
["D"]=>
NULL
["E"]=>
NULL
["F"]=>
NULL
["G"]=>
NULL
["H"]=>
NULL
["I"]=>
NULL
["J"]=>
NULL
}
...需要很大的空间,在该文件中,但不应该在php_memory,所以这是我的错。现在
,我使用这个代码,以保持内存使用情况的跟踪:
for ($i=1; $i < 20000; $i+=5000){
$filter->setRows($i, 5000);
echo "\n1- Usage: ".(memory_get_usage()/1024)/1024;
$objPHPExcel = $reader->load($this->file);
echo "\n2- Usage: ".(memory_get_usage()/1024)/1024;
$sheetData = $objPHPExcel->getActiveSheet()->toArray(null,true,true,true);
unset($sheetData);
unset($objPHPExcel);
echo "\n3- Usage: ".(memory_get_usage()/1024)/1024;
}
有了一定的XLS文件,它表明:
第一次迭代 1用法:4.3859634399414 2-使用:34.292671203613 3-使用:34.68034362793
第2次迭代 1-用途:34.68034362793 2-用途:34.68293762207 3-用法:34。684982299805
而且相同的文件,保存为XLSX后:
第一迭代 1-用途:4.2780990600586 2-用法:6.9042129516602 3-用法:7.2916641235352
第二迭代 1-使用方法:7.2916641235352 2-使用方法:7.5115432739258 3-使用方法:7.2813568115234
但是,我必须说,保存为XLSX后,大小减少了大约一半,因此我不能说它是一个错误还是它的预期行为。
读过滤器应与Excel5 Reader和用Excel2007的阅读器相同的工作...但如果你对内存很紧张,那么你可能要考虑使用PHPExcel的单元缓存选项 – 2014-09-20 17:07:06
也许他们应该,但它清楚地显示出不同的行为。我不确定,也许我没有按照我应该使用的过滤器,或者我错过了一些东西。我不确定内存限制,因为这是共享服务器,我必须小心。关于单元缓存选项,你能否指点我一些文档来尝试一下? – sergio0983 2014-09-20 17:16:01
好吧,给我一个工作示例来证明这确实是代码中的一个错误,我会看看它.....我已经放弃花费数小时来搜索没有示例的报告的错误报告只是发现代码中没有任何问题 – 2014-09-20 20:16:55