Pivotieren: Jahresmittelwerte aus Long-Datensatz berechnen

Wie kann ich aus einem Long-Datensatz Jahresmittelwerte berechnen, um zum Beispiel bestimmte Jahre oder Monate miteinander vergleichen zu können ? Ein Beispiel : Die Gas-Transparenzplattform AGSI der EU wertet einmal am Tag den Füllstand der Gasspeicher aus. Die Aufzeichnungen starten am 1.1.2011 - es liegen also tausende Datenpunkte vor, einer für jeden Tag. Daraus möchte ich eine Auswertung erstellen, die mir […]

Tutorial : Seaborn Heatmap mit RKI Corona Altersinzidenzen erzeugen

Heatmaps mit Seaborn sind eine gute Visualisierung, um zum Beispiel die Änderungen in den Corona-Inzidenzen im Wochenverlauf bei den einzelnen Altersgruppen darzustellen. Jetzt laden wir die Daten für die Heatmap. Das sind Corona- Altersinzidenzen für Hamburg vom RKI. Man kann sich mit der RKI-Software SurvStat diese CSV-Dateien selbst erzeugen.  SurvStat öffnenBeispielabfragenCOVID-19 (ganz unten)Meldejahr/Woche in die Spalten und Altersjahre in die ZeilenAm Ende gezippte CSV-Datei in den gleichen Ordner wie das Python Skript packen. Und nun wird die Grafik gebaut und abgespeichert: 

Führende Nullen hinzufügen

Ab und zu ist hier vom Amtlichen Gemeindeschlüssel (AGS) die Rede. Den gibt es in Deutschland für Gemeinden, Kreise, Regierungsbezirke und Bundesländer. Für Kreise ist der immer 5-stellig, für die ersten neun Bundesländer beginnt der AGS mit einer führenden Null. In manchen Daten ist diese führende Null aber nicht enthalten. Deshalb muss man sie hinzufügen - beziehungsweise in der Pandas-Logik vorne […]

Erste Schritte : CSV-Datei mit Pandas laden

Viele Daten im Netz liegen im CSV-Format vor. CSV-Dateien sind eigentlich Text-Datein (so etwas wie *.txt), die von vielen Systemen wie z.B. Windows, MacOS, Linux usw gelesen werden können. Was in Excel-Dateien die Spalten sind, sind in CSV-Dateien die speziellen Trennzeichen. Hier ein Beispiel des Corona-Datensatzes vom RKI : In der ersten Zeile stehen die Spaltenköpfe, inden folgenden Zeilen die Daten. Man kann sehen, dass […]

Datumsformat in Grafik-Plots anpassen

Manchmal möchte man z.B. in einem Seaborn-Plot auf einer Achse die Datetime-Informationen plotten. Das “normale” Datetimeformat ist ja in der Regel so formatiert : JAHR-MONAT-TAG. Mit diesem Code lässt sich das auf das deutsche Datumsformat anpassen. Dabei muss sich das Ganze auf ein ax-Objekt beziehen. Quelle

Anzahl der angezeigten Spalten/Zeilen im Dataframe

Standardmäßig zeigt Pandas bei längeren Dataframes nur die ersten und letzten Spalten und Zeilen an. Wenn man jedoch den gesamten Dataframe-Output sehen will, muss man zuerst ein paar Code-Zeilen hinzufügen. Ich mache das ganz oben, direkt nach dem Import der anderen Pakete. Statt der 100 kann auch ein höherer oder niedrigerer Wert eingesetzt werden. Bis vor kurzem war auch -1 […]