API-Pagination mit Python Requests meistern

August 11, 2025 - By admin

Spread the love

Die effiziente Verarbeitung großer Datensätze ist bei der Arbeit mit APIs entscheidend. Das Abrufen aller Daten auf einmal kann sowohl den Server als auch Ihre Anwendung überlasten. Pagination löst dieses Problem, indem Daten in kleineren, handhabbaren Blöcken abgerufen werden. Dieser Artikel untersucht verschiedene Paginierungsstrategien mit der Python-Bibliothek requests und konzentriert sich auf die serverseitige Logik.

Was ist Pagination?

Pagination ist die Technik, Daten von einer API in kleineren, sequenziellen Seiten abzurufen, anstatt in einer einzigen, massiven Antwort. Jede Seite enthält einen Teil der Daten, identifiziert durch eine Seitennummer, einen Offset, einen Cursor oder eine andere eindeutige Kennung. Dies verbessert die Leistung, reduziert den Speicherverbrauch und verbessert die Benutzererfahrung, insbesondere bei großen Datensätzen.

Pagination mit „Weiter“-Schaltfläche

Viele APIs verwenden einen einfachen Ansatz mit einer „Weiter“-Schaltfläche. Die API-Antwort enthält eine URL (oft innerhalb einer JSON-Antwort), die auf die nächste Seite verweist. Dies wird fortgesetzt, bis die „Weiter“-URL null oder nicht vorhanden ist.


import requests

def paginate_next_button(base_url):
    all_data = []
    url = base_url
    while url:
        response = requests.get(url)
        response.raise_for_status()
        data = response.json()
        all_data.extend(data.get('results', [])) #Handhabung von Fällen, in denen der Schlüssel 'results' fehlen könnte
        url = data.get('next')
    return all_data

# Beispiel (ersetzen Sie dies durch Ihren API-Endpunkt)
base_url = "https://api.example.com/data?page=1"
all_data = paginate_next_button(base_url)
print(all_data)

Pagination mit Offset und Limit

Einige APIs verwenden Parameter wie offset und limit. offset gibt den Startpunkt an, und limit definiert die Anzahl der Elemente pro Seite. Sie müssen möglicherweise die Gesamtzahl der Elemente separat ermitteln (z. B. über einen dedizierten API-Aufruf oder einen Header wie X-Total-Count).


import requests

def paginate_offset_limit(base_url, limit=10):
    all_data = []
    offset = 0
    while True:
        url = f"{base_url}&offset={offset}&limit={limit}"
        response = requests.get(url)
        response.raise_for_status()
        data = response.json()
        results = data.get('results', [])
        if not results:  #Prüfen, ob die Seite leer ist
            break
        all_data.extend(results)
        offset += limit
    return all_data

# Beispiel (ersetzen Sie dies durch Ihren API-Endpunkt)
base_url = "https://api.example.com/data"
all_data = paginate_offset_limit(base_url, limit=20)
print(all_data)

Cursor-basierte Pagination

Die cursor-basierte Pagination verwendet einen eindeutigen Cursor-Wert, um die nächste Seite zu identifizieren. Dies ist bei großen Datensätzen oft effizienter als die offset-basierte Pagination, da die Neuberechnung von Offsets vermieden wird. Die API-Antwort liefert den Cursor für die nächste Seite.


import requests

def paginate_cursor(base_url):
    all_data = []
    url = base_url
    while url:
        response = requests.get(url)
        response.raise_for_status()
        data = response.json()
        all_data.extend(data.get('results', []))
        url = data.get('next_cursor') # An den tatsächlichen Schlüsselnamen in der Antwort anpassen
    return all_data

# Beispiel (ersetzen Sie dies durch Ihren API-Endpunkt)
base_url = "https://api.example.com/data?cursor=" #Der anfängliche Cursor kann leer oder ein bestimmter Wert sein
all_data = paginate_cursor(base_url)
print(all_data)

Denken Sie daran, diese Code-Schnipsel an die Struktur und das Antwortformat Ihrer spezifischen API anzupassen. Konsultieren Sie immer die API-Dokumentation für die korrekten Paginierungsparameter und die Antwortstruktur. Eine gründliche Fehlerbehandlung ist für robuste Anwendungen unerlässlich.

Inhaltsverzeichnis

Was ist Pagination?

Pagination mit „Weiter“-Schaltfläche

Pagination mit Offset und Limit

Cursor-basierte Pagination

Ähnliche Beiträge:

Schreibe einen Kommentar Antworten abbrechen