Große Dateien zeilenweise in PHP verarbeiten

Das Verarbeiten von großen Dateien in PHP ist mit Bordmitteln sehr problematisch. Der Speicherverbrauch geht sehr schnell in die Höhe und macht die Verarbeitung sehr schwierig. Ein kleines Skript, daß diese Probleme behandelt möchte ich hier vorstellen. Probleme, Fragen und Anregungen sind immer willkommen.


/*************************************************
Zeilenweise Verarbeitung von Textdateien in PHP
Author: Michael Jentsch
Copyright (c): 2006 - all rights reserved
Version: 1.01

 * This library is free software; you can redistribute it and/or
 * modify it under the terms of the GNU General Public
 * License as published by the Free Software Foundation; either
 * version 2.1 of the License, or (at your option) any later version.
 *
 * This library is distributed in the hope that it will be useful,
 * but WITHOUT ANY WARRANTY; without even the implied warranty of
 * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
 * Lesser General Public License for more details.
 *
 * You should have received a copy of the GNU Lesser General Public
 * License along with this library; if not, write to the Free Software
 * Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA

You may contact the author of by e-mail at:
[email protected]

The latest version can be obtained from:

http://m-software.de/

*************************************************/
$filename = "urls.txt";
$readsize = 1024*1024; // 1MB
$linebreak = "\n";

$rest = "";
$handle = fopen ($filename, "r");
$linebreaksize = strlen ($linebreak);
while (!feof($handle))
{
        $contents = $rest . fread($handle, $readsize);
        $rest = substr (strrchr ($contents, $linebreak), $linebreaksize);
        $contents = substr($contents, 0, strlen ($contents) - strlen ($rest) - $linebreaksize);
        $lines = split ($linebreak, $contents);
        $anz = count ($lines);
        for ($i = 0; $i < $anz; $i++)
        {
                $line = $lines[$i];
                // Hier kann man dann etwas mit der aktuellen Zeile machen
        }
}
fclose ($handle);
exit (0);

Michael Jentsch

Michael Jentsch arbeitet seit 2006 bei der Itellium Services GmbH als Entwickler und Software Architekt. Er ist spezialisiert auf Java basierte Web-Applikationen und E-Commerce. Neben dem Beruf interessiert er sich auch für Suchmaschinenoptimierung und ist engagiert in vielen Open Source Projekten im Web Umfeld. Sie erreichen ihn per E-Mail unter [email protected].

More Posts

Weiterführende Themen:

  1. Exif Remove in JPG Dateien
  2. “Der große Humboldt Fotolehrgang”