Datenaufbereitung#
In diesem Kapitel lernen Sie mit der Python-Paket Pandas ein neues Werkzeug kennen, das speziell für die Arbeit mit Daten entwickelt wurde. Anders als NumPy, das sich vor allem für numerische Daten eignet, erlaubt Pandas auch den Umgang mit nicht-numerischen Werten wie Pandas. Im Mittelpunkt steht dabei die tabellarische Darstellung von Informationen – ähnlich einer Excel-Tabelle.
Sie lernen zunächst, wie Sie eigene Datentabellen erstellen können, und wie man mit bereits bestehenden Tabellen arbeitet. In beiden Fällen geht es darum, gezielt auf bestimmte Informationen zuzugreifen, relevante Daten herauszufiltern und diese für Ihre Zwecke weiterzuverarbeiten. Dazu gehört z. B. das Zählen von Häufigkeiten, das Berechnen von Durchschnittswerten oder das gezielte Umformen von Daten.
Darüber hinaus erfahren Sie, wie sich Datentabellen erweitern und miteinander kombinieren lassen.
Lernziele#
Was ist Pandas und wofür eignet es sich besonders?
Wie kann man eigene Datentabellen erstellen?
Wie kann man bestehende Datentabellen einlesen und untersuchen?
Wie greift man gezielt auf bestimmte Informationen in Tabellen zu?
Wie kann man Daten manipulieren, analysieren und zusammenfassen?
Wie fügt man neue Informationen zu Tabellen hinzu?
Wie kann man mehrere Tabellen sinnvoll zusammenführen?