Lectura eficiente de archivos línea por línea en Python

julio 18, 2025 - By admin

Spread the love

Leer archivos eficientemente línea por línea es una habilidad crucial para cualquier programador Python. Ya sea que esté procesando registros, analizando datos o trabajando con archivos de configuración, comprender los diferentes enfoques y sus ventajas e inconvenientes es esencial. Este artículo explora tres métodos comunes, destacando sus fortalezas y debilidades para ayudarlo a elegir el mejor enfoque para sus necesidades específicas.

Usando `readlines()`

El método readlines() proporciona una manera sencilla de leer todas las líneas de un archivo en una lista. Cada elemento de la lista representa una sola línea, incluyendo el carácter de nueva línea.


def read_file_readlines(filepath):
    """Lee un archivo línea por línea usando readlines() y devuelve una lista de líneas."""
    try:
        with open(filepath, 'r') as file:
            lines = file.readlines()
            return lines
    except FileNotFoundError:
        return None

filepath = 'my_file.txt'  # Reemplace con la ruta de su archivo
lines = read_file_readlines(filepath)

if lines:
    for line in lines:
        print(line, end='') #end='' evita una nueva línea extra
else:
    print(f"Archivo '{filepath}' no encontrado.")

Ventajas: Simple y conciso. Todo el archivo se lee en la memoria a la vez, lo que hace que el acceso posterior a cualquier línea sea muy rápido.

Desventajas: Consume mucha memoria para archivos grandes. El carácter de nueva línea (`n`) se incluye al final de cada línea.

Iterando a través del objeto archivo

Para archivos grandes, iterar directamente a través del objeto archivo ofrece una solución más eficiente en cuanto a memoria. Este método lee y procesa una línea a la vez, evitando cargar todo el archivo en la memoria.


def read_file_iter(filepath):
    """Lee un archivo línea por línea usando iteración y devuelve una lista de líneas."""
    try:
        lines = []
        with open(filepath, 'r') as file:
            for line in file:
                lines.append(line)
        return lines
    except FileNotFoundError:
        return None

filepath = 'my_file.txt'
lines = read_file_iter(filepath)

if lines:
    for line in lines:
        print(line, end='')
else:
    print(f"Archivo '{filepath}' no encontrado.")

Ventajas: Eficiente en cuanto a memoria, adecuado para archivos grandes. El procesamiento puede comenzar antes de que se lea todo el archivo.

Desventajas: Ligeramente más detallado que readlines(). El carácter de nueva línea (`n`) se incluye al final de cada línea.

Usando `read()` y `splitlines()`

El método file.read() lee todo el contenido del archivo en una sola cadena. Luego podemos usar el método splitlines() para dividir esta cadena en una lista de líneas. Tenga en cuenta que splitlines() elimina los caracteres de nueva línea de forma predeterminada.


def read_file_read(filepath):
    """Lee un archivo línea por línea usando file.read() y devuelve una lista de líneas."""
    try:
        with open(filepath, 'r') as file:
            file_content = file.read()
            lines = file_content.splitlines()
            return lines
    except FileNotFoundError:
        return None

filepath = 'my_file.txt'
lines = read_file_read(filepath)

if lines:
    for line in lines:
        print(line)
else:
    print(f"Archivo '{filepath}' no encontrado.")

Ventajas: Relativamente simple.

Desventajas: Menos eficiente que la iteración para archivos grandes porque lee todo el archivo en la memoria antes de dividirlo. El carácter de nueva línea se elimina de forma predeterminada por splitlines().

Comparando los Métodos

El mejor método depende de sus necesidades específicas y del tamaño de su archivo. Para archivos muy grandes, generalmente se recomienda la iteración debido a su eficiencia de memoria. Para archivos más pequeños, se puede preferir la simplicidad de readlines(). Evite usar read().splitlines() para archivos grandes para evitar el uso excesivo de memoria.

Método	Eficiencia de Memoria	Velocidad	Manejo de Saltos de Línea	Simplicidad
`readlines()`	Baja	Rápida	Incluido	Alta
Iteración	Alta	Rápida	Incluido	Media
`read().splitlines()`	Baja	Lenta	Eliminado	Media

Recuerde manejar siempre las posibles excepciones FileNotFoundError.

Tabla de Contenido

Usando readlines()

Iterando a través del objeto archivo

Usando read() y splitlines()

Comparando los Métodos

Publicaciones relacionadas:

Deja una respuesta Cancelar la respuesta

Usando `readlines()`

Usando `read()` y `splitlines()`