Wie gut waren die Vorhersagen wirklich? Hier treten die Wettermodelle
nachträglich gegen die echte Beobachtung an — KI gegen klassische Physik.
Wir vergleichen — Sie wissen besser.
Podcast · TÜV erklärt
Anna & Lukas
0:00–:––
Transkript
Sonderfolge · Skript & Stimmen: Google Gemini · Untertitel: Whisper · Visualisierung: Web Audio
Prognose-Liga · Spieltag
Die Hessen-Wetterliga
Wer sagt das Hessen-Wetter am besten voraus? Sechs Modelle, ein Tabellenstand —
bewertet gegen das wirklich eingetroffene Wetter. Je kleiner der mittlere Fehler in Grad, desto besser.
🏆 Tabellenführer
ECMWF AIFS
KI-Modell · ECMWF
Ø Fehler · 30 Tage
1,36 K
vor ECMWF IFS (1,48 K)
⚔ KI gegen Physik
KI vs Physik
ECMWF AIFS führt mit
1,36 K vor 1,48 K.
🎯 Volltreffer der Woche
NOAA GFS
traf Frankfurt am 22. Juni auf
den Punkt — 33,9° genau (3-Tage-Vorlauf).
💥 Größter Patzer
ECMWF IFS
lag in Kassel am 25. Juni um
9,4 K daneben
(23,7° statt 33,1°, 7-Tage-Vorlauf).
📈 Form (24 h · 14 Tage)
→ stabil
niedriger = treffsicherer
Tabellenstand = mittlerer Tageshöchst-Fehler (MAE) gegen die ERA5-Beobachtung über sechs hessische Städte,
30 Tage. Volltreffer/Patzer aus der jüngsten Auswertungswoche. Voller Tabellen-Drilldown in der Modell-Arena unten.
Prognose-TÜV
Wochenrückblick
22. Juni – 28. Juni 2026 · vier Episoden · 34 Sekunden
Sechs Modelle, sechs Städte, eine Woche — wer hat richtig vorhergesagt, wer
lag daneben? Die größten Treffer und Patzer als animierter Wochenrückblick.
Prognose-TÜV · Das Duell
Modell-Arena
Wer sagt das Wetter wirklich am besten voraus? · KI gegen Physik · Tageshöchst-MAE in Kelvin
ECMWF AIFS
Neuronales Netz
1,36
Ø MAE · 30 Tage · führt
vs
ECMWF IFS
Physik-Gleichungen
1,48
Ø MAE · 30 Tage
„KI punktet auf Distanz"
Wochenurteil · automatisch getextet von GPT-5.x
Worum geht es hier?
Wetterdienste sagen das Wetter mit verschiedenen Modellen voraus.
Klassische Physik-Modelle rechnen die Atmosphäre Schritt für
Schritt mit physikalischen Gleichungen durch — etwa ICON vom Deutschen Wetterdienst oder das Modell des ECMWF.
Neuere KI-Modelle rechnen nicht, sondern haben
Wettermuster aus jahrzehntelangen Daten gelernt — zum Beispiel ECMWF AIFS oder Googles WeatherNext.
Die Modell-Arena vergleicht beide Lager fair und im Nachhinein:
Jede Vorhersage wird gegen das tatsächlich eingetroffene Wetter gemessen (die ERA5-Beobachtung). Je kleiner der
mittlere Fehler in Grad (MAE), desto näher lag das Modell an der Wirklichkeit. So zeigt sich Woche für Woche, wer
wirklich am besten vorhersagt — und ob die KI die klassische Physik inzwischen schlägt.
Wochenurteil ·
Im 30-Tage-Rückblick über sechs hessische Städte bleibt das Bild gemischt: auf 24, 48 und 72 Stunden liegen die Physik-Modelle mit 1,09, 1,12 und 1,20 K MAE vor der KI mit 1,21, 1,21 und 1,27 K. Auf sieben Tage dreht sich das Urteil deutlich, dort kommt die KI auf 2,20 K, die Physik auf 3,32 K. Bester Allrounder über alle vier Vorlaufzeiten ist ECMWF AIFS mit 1,29 K; ICON-D2 hat zwar einen niedrigen Schnitt, liefert aber nur 24 Stunden und ist deshalb kein Allrounder. Statistisch ist das bei zwei KI-Modellen gegen vier Physik-Modelle eher eine Tendenz als ein Schlussspruch, zumal die Arena nun mit AIFS und Googles WeatherNext 2 auch ein KI-gegen-KI-Duell enthält. Das passt zum Branchenbild 2026: Das ECMWF hat Anfang des Jahres GraphCast, Pangu, Aurora und FourCastNet im Betrieb abgeschaltet und setzt auf AIFS, die Wetterdienste bauen ihre KI inzwischen selbst.
Im 30-Daach-Rückblick iwwer sechs hessische Städt bleibt’s e gemischtes Bild: uff 24, 48 un 72 Stunn liege die Physik-Modelle mit 1,09, 1,12 un 1,20 K MAE vor de KI mit 1,21, 1,21 un 1,27 K. Uff siebe Daach dreht sich’s dann deutlich: die KI kommt uff 2,20 K, die Physik uff 3,32 K. De beste Allrounder iwwer all vier Vorlaufzeite is ECMWF AIFS mit 1,29 K; ICON-D2 steht zwar mit niedrigem Schnitt do, sacht aber nur 24 Stunn voraus un is drum kaa Allrounder. Statistisch is des bei zwaa KI-Modell gege vier Physik-Modelle eher e Tendenz als e Schlusswort, zumal die Arena mit AIFS un Googles WeatherNext 2 jetzt aach e Duell KI gege KI hat. Des passt in die Branche 2026: Des ECMWF hat Anfang vom Jahr GraphCast, Pangu, Aurora un FourCastNet im Betrieb abgeschaltet un setzt uff AIFS, die Wetterdienste baue ihr KI mittlerweile selbst.
1
ICON-EU Physik DWD
▲ 0.36 K Bias
·
Niederschlag 1.1 mm
· 24–72 h
1.02
Ø MAE · K
2
ICON-D2 Physik DWD
▲ 0.86 K Bias
·
Niederschlag 1.2 mm
· nur 24 h
1.02
Ø MAE · K
3
ECMWF AIFS KI ECMWF
▲ 0.26 K Bias
·
Niederschlag 1.1 mm
· 24–7 Tage
1.26
Ø MAE · K
4
ECMWF IFS Physik ECMWF
· 0.02 K Bias
·
Niederschlag 1.2 mm
· 24–7 Tage
1.31
Ø MAE · K
5
NOAA GFS Physik NOAA
▼ 0.20 K Bias
·
Niederschlag 1.3 mm
· 24–7 Tage
1.71
Ø MAE · K
6
WeatherNext 2 KI Google DeepMind
▼ 1.42 K Bias
·
Niederschlag 1.2 mm
· 24–7 Tage
1.77
Ø MAE · K
Modell
24 h
48 h
72 h
7 Tage
ICON-EU
0.85
1.03
1.17
—
ICON-D2
1.02
—
—
—
ECMWF AIFS
0.82
0.86
0.99
2.37
ECMWF IFS
0.64
0.86
0.98
2.77
NOAA GFS
1.01
1.11
1.31
3.39
WeatherNext 2
1.43
1.51
1.57
2.56
1
ICON-D2 Physik DWD
▲ 1.01 K Bias
·
Niederschlag 1.3 mm
· nur 24 h
1.24
Ø MAE · K
2
ICON-EU Physik DWD
▲ 0.44 K Bias
·
Niederschlag 1.2 mm
· 24–72 h
1.25
Ø MAE · K
3
ECMWF AIFS KI ECMWF
▲ 0.29 K Bias
·
Niederschlag 1.2 mm
· 24–7 Tage
1.36
Ø MAE · K
4
ECMWF IFS Physik ECMWF
▲ 0.35 K Bias
·
Niederschlag 1.3 mm
· 24–7 Tage
1.48
Ø MAE · K
5
WeatherNext 2 KI Google DeepMind
▼ 1.38 K Bias
·
Niederschlag 1.3 mm
· 24–7 Tage
1.69
Ø MAE · K
6
NOAA GFS Physik NOAA
▲ 0.26 K Bias
·
Niederschlag 1.3 mm
· 24–7 Tage
1.80
Ø MAE · K
Modell
24 h
48 h
72 h
7 Tage
ICON-D2
1.24
—
—
—
ICON-EU
1.15
1.32
1.27
—
ECMWF AIFS
0.84
0.88
1.07
2.64
ECMWF IFS
0.78
1.00
1.10
3.03
WeatherNext 2
1.59
1.62
1.59
1.96
NOAA GFS
1.14
1.15
1.39
3.53
Score = mittlerer Tageshöchst-Fehler (MAE) gegen die ERA5-Beobachtung, gemittelt über sechs hessische Städte und alle vom Modell abgedeckten Vorlaufzeiten. Niedriger = besser. Niederschlag fließt nicht in den Score ein. Modelle mit kurzer Reichweite (z. B. ICON-D2 nur 24 h) werden nur auf ihren Vorlaufzeiten bewertet — die Reichweite steht in jeder Zeile.
Ø Tages-Niederschlagsfehler (MAE) gegen ERA5 · letzte 90 Tage · niedriger = besser · separat vom Temperatur-Score
1 ECMWF AIFS · KI 1.11 mm
2 ICON-EU · Physik 1.12 mm
3 ICON-D2 · Physik 1.18 mm
4 WeatherNext 2 · KI 1.19 mm
5 ECMWF IFS · Physik 1.25 mm
6 NOAA GFS · Physik 1.35 mm
Bewusst getrennt gewertet: Niederschlag ist punktgenau schwer vorherzusagen und alle Modelle sind hier schwächer — im Tageshöchst-Score würde er das Bild verzerren. Hier zeigt sich, wer beim Regen am nächsten dran war.
KI gegen Physik
Ø Tageshöchst-MAE je Lager · letzte 30 Tage · 2 KI-Modelle vs. 4 Physik-Modelle · kürzer = genauer
24 h
KI
1.21
Physik
1.08
48 h
KI
1.25
Physik
1.16
72 h
KI
1.33
Physik
1.25
7 Tage
KI
2.30
Physik
3.28
Kontext 2026: Das ECMWF hat Anfang des Jahres die externen KI-Modelle (GraphCast, Pangu, Aurora, FourCastNet) im Betrieb abgeschaltet und konzentriert sich auf sein eigenes AIFS — die Wetterdienste bauen ihre KI inzwischen selbst. Auf der KI-Seite treten hier ECMWF AIFS und Googles WeatherNext 2 (DeepMind, GenCast-Linie) an — damit ist es zugleich ein Duell KI gegen KI. WeatherNext liefert nur 6-stündliche Werte; sein Tageshöchstwert wird aus dem 12-UTC-Schritt (≈ 14 Uhr MESZ, nahe der üblichen Höchstwert-Zeit) genähert, was sehr kurze Vorlaufzeiten leicht unterschätzen kann.
Prognose-TÜV · Die Teilnehmer
Die Modelle im Steckbrief
Wer tritt in der Arena gegeneinander an? Sechs Wettermodelle aus vier Häusern — zwei
lernende KIs und vier klassische Physik-Modelle.
Künstliche Intelligenz
Aus Wetterdaten gelernt statt durchgerechnet
🇪🇺ECMWF · Reading / BonnKI
ECMWF AIFS
Das hauseigene KI-Modell des Europäischen Zentrums für mittelfristige Wettervorhersage. Statt die Atmosphäre durchzurechnen, hat es aus über 40 Jahren Wetterdaten gelernt. Seit Februar 2025 im offiziellen Betrieb — das Aushängeschild dafür, dass die Wetterdienste ihre KI inzwischen selbst bauen.
KI · ~0,25° Gitter · bis 7+ Tage
🌐Google DeepMindKI
WeatherNext 2
Googles KI-Wettermodell aus der GenCast-Familie. Es erzeugt ein ganzes Ensemble möglicher Wetterverläufe; wir nutzen das Ensemble-Mittel über Google Earth Engine. Die zweite KI in der Arena — damit wird der Vergleich auch zum Duell KI gegen KI.
KI · Ensemble (GenCast) · 6-stündlich
Klassische Physik
Die Atmosphäre mit physikalischen Gleichungen durchgerechnet
🇪🇺ECMWF · ReadingPhysik
ECMWF IFS
Das „Europäische Modell" — über Jahrzehnte der globale Goldstandard der klassischen Vorhersage. Es rechnet die Atmosphäre weltweit mit physikalischen Gleichungen durch und dient anderen Modellen oft als Referenz.
Physik · global · ~9 km
🇩🇪Deutscher Wetterdienst · OffenbachPhysik
ICON-EU
Das Europa-Regionalmodell des Deutschen Wetterdiensts. Feiner aufgelöst als globale Modelle und auf Europa zugeschnitten — ein verlässlicher Allrounder für Hessen über mehrere Tage.
Physik · Europa · ~7 km
🇩🇪Deutscher Wetterdienst · OffenbachPhysik
ICON-D2
Das hochauflösende Kürzestfrist-Modell des DWD mit rund 2 km Gitter. Stark im Detail — Gewitter, lokale Schauer — aber nur für die nächsten etwa zwei Tage. Deshalb kein Wochen-Allrounder, auch wenn es auf kurze Sicht oft vorn liegt.
Physik · ~2 km · nur ~2 Tage
🇺🇸NOAA · USAPhysik
NOAA GFS
Das US-amerikanische Global Forecast System. Frei verfügbar und weltweit verbreitet; es deckt den ganzen Globus ab, ist im Detail aber meist gröber als die europäischen Modelle.
Physik · global · ~13 km
Prognose-TÜV
Verifikation
Wer lag richtig? · letzte 28 Tage · Tageshöchst-MAE in Kelvin
ECMWF IFS liegt im 24-Stunden-Schnitt vorn — 0.78 K mittlerer Fehler, knapp vor ECMWF AIFS (0.84 K).