Einleitung - Mit Daten arbeiten
Wir lernen verschiedene Arbeitsformen kennen, die im Umgang mit den Daten einer Pandemie wichtig sind.
Lineare und logarithmische Skalen
Ein wichtiges Hilfsmittel bei der Untersuchung exponentiell wachsender Daten sind Schaubilder mit logarithmischen Skalen. Dabei wachsen die Werte auf der y-Achse nicht in gleichmäßigen Schritten. Wir sehen in der Abbildung unten zwei Schaubilder mit den selben Daten. Im rechten Schaubild ist der Abstand auf der y-Achse zwischen den Werten 0 und 10 der selbe wie der Abstand zwischen den Werten 10 und 100.
Der Nutzen einer solchen Skala besteht darin, dass man exponentielles Wachstum (und Abweichungen davon) nun mit bloßem Auge erkennen kann. Wir verdeutlichen das wieder mit einem Experiment in einer Tabellenkalkulation.
Logarithmische Skalen
Öffne die nachfolgende Tabelle:
Dort ist ein exponentielles Wachstum dargestellt. Um den Wachstumsfaktor zu ändern, können wir den Eintrag in Zelle E2 verändern. Erzeuge zu den Daten ein Schaubild und ändere die Skala wie in der nachfolgenden Videobeschreibung:
Aufgabe 1
- Welche Besonderheit hat die Kurve im Schaubild jetzt?
- Wie kann man den Wachstumsfaktor in diesem Schaubild ablesen? Falls du es in diesem Beispiel nicht erkennst, versuche mal das Beispiel mit dem Wachstumsfaktor 10.
Aufgabe 2
Betrachte noch einmal die COVID-19 Daten aus Deutschland und stelle sie mit einer logarithmischen Skala dar. Können wir nun die Fragen aus der Einleitung besser beantworten?
- Ist dieser Anstieg zu erwarten?
- Mit wie vielen Krankheitsfällen kann man am 30. April rechnen?
- Können wir aus dem Schaubild ablesen, ob (und ggf. wann) die Maßnahmen (Kontaktverbote etc.) Wirkung zeigten?
Daten fitten
Manchmal hat man Daten gegeben und sucht eine mathematische Funktion, die zu den Daten passt. Wenn man eine grobe Vorstellung davon hat, welche Art von Funktion die Daten beschreiben könnte (lineare Funktion, quadratische Funktion, Exponentialfunktion, ...), so kann man versuchen, eine Reihe von Parametern so anzupassen, dass die Abweichung zwischen der Funktion und den gegebenen Daten möglichst klein ist. Man spricht davon, dass man eine Funktion an die Daten fittet.
Aufgabe 3
Wir betrachten erneut die Krankheitszahlen aus Deutschland vom 15. Februar bis zum 15. April. Wir suchen Parameter K und t, so dass die Exponentialfunktion
\[f(x)=K2^{\frac{x}{t}}\]diese Daten möglichst gut beschreibt (hier ist x die Anzahl der Tage, die seit dem 15. Februar vergangen sind).
Wir arbeiten wieder mit Tabellenkalkulationssoftware. Die Daten findest du hier zum Download:
Wenn du dir für die Funktion f eine Wertetabelle erzeugst, kannst du sowohl die Funktion als auch die Daten im selben Schaubild darstellen.
Glaubst du, dass es sinnvoll ist, diese Daten mit einer Exponentialfunktion zu fitten?
Aufgabe 4 (optional)
Betrachte noch einmal die Simulation der Krankheitsausbreitung mit dem logistischen Wachstum. Wie lange dauert es, bis die Zahl der Infektionen auf die Hälfte der Gesamtpopulation angewachsen ist? Erstelle drei Wertetabellen mit folgenden Eigenschaften:
- t und K sind fest, N wird verändert
- t und N sind fest, K wird verändert
- N und K sind fest, t wird verändert
Kannst du für jede der drei Wertetabellen eine Funktion an die Daten fitten? Daraus lässt sich erkennen, wie die Parameter die Ausbreitungsgeschwindigkeit der Krankheit beeinflussen.
Daten hinterfragen
Während der COVID-19 Pandemie wurde in den Medien, z.B. in den Fernsehnachrichten, ständig über tagesaktuelle Daten berichten. Beispielsweise wurden
- Infektionszahlen aus verschiedenen Ländern der Erde
- Todesfälle, die auf COVID-19 zurückzuführen sind
- die Anzahl genesener Patienten
statistisch erfasst. Dabei waren die Angaben in verschiedenen Nachrichtenportalen nicht immer identisch.
Aufgabe 5
Welche Schwierigkeiten können sich ergeben, wenn statistische Daten erfasst werden? Inwiefern kann sich das darauf auswirken, dass die Daten verschiedener Nachrichtensender oder Webseiten sich unterscheiden?
Näheres dazu findet man auch hier: https://www.tagesschau.de/faktenfinder/zahlen-coronavirus-101.html
Statistische Artefakte erkennen
Manche Probleme, die sich aus Statistiken ergeben, lassen sich sogar mit bloßem Auge erkennen.
Aufgabe
Betrachte aus den COVID-19 Daten aus Deutschland die Zahl der täglichen Neuinfektionen (Tipp: das lässt sich durch eine Tabellenkalkulation sehr einfach realisieren). In den Daten fällt auf, dass es im Abstand mehrerer Tage immer wieder hohe Werte an Neuinfektionen gibt, die an den darauf folgenden Tagen wieder zurück gehen. Bestimme die zeitlichen Abstände dieser Spitzenwerte. Welche Gründe könnte es für diese Abstände geben?
Optional: Mehr zum Thema "Daten in Schaubildern darstellen"
Wer sich für das Thema der logarithmischen Skalen interessiert, der kann in diesem kurzen Video mehr zur Darstellung der CODIV-19 Daten erfahren: https://www.youtube.com/watch?v=54XLXg4fYsc&t=9s.
Die Erstellung dieses Kursmaterials wurde durch den Europäischen Sozialfonds im Rahmen des Projekts Schulentwicklung für mathematische Modellierung in MINT-Fächern (SchuMaMoMINT) finanziell gefördert.