Ressort III

Prognose-TÜV

Wochenrückblick · Modell-Arena · Verifikation

Wie gut waren die Vorhersagen wirklich? Hier treten die Wettermodelle nachträglich gegen die echte Beobachtung an — KI gegen klassische Physik. Wir vergleichen — Sie wissen besser.

Podcast · TÜV erklärt

Anna & Lukas

0:00 –:––

Transkript

Sonderfolge · Skript & Stimmen: Google Gemini · Untertitel: Whisper · Visualisierung: Web Audio

Prognose-Liga · Spieltag

Die Hessen-Wetterliga

Wer sagt das Hessen-Wetter am besten voraus? Sechs Modelle, ein Tabellenstand — bewertet gegen das wirklich eingetroffene Wetter. Je kleiner der mittlere Fehler in Grad, desto besser.

🏆 Tabellenführer

ECMWF AIFS

KI-Modell · ECMWF

Ø Fehler · 30 Tage

1,36 K

vor ECMWF IFS (1,48 K)

⚔ KI gegen Physik

KI vs Physik

ECMWF AIFS führt mit 1,36 K vor 1,48 K.

🎯 Volltreffer der Woche

NOAA GFS

traf Frankfurt am 22. Juni auf den Punkt — 33,9° genau (3-Tage-Vorlauf).

💥 Größter Patzer

ECMWF IFS

lag in Kassel am 25. Juni um 9,4 K daneben (23,7° statt 33,1°, 7-Tage-Vorlauf).

📈 Form (24 h · 14 Tage)

→ stabil

niedriger = treffsicherer

Tabellenstand = mittlerer Tageshöchst-Fehler (MAE) gegen die ERA5-Beobachtung über sechs hessische Städte, 30 Tage. Volltreffer/Patzer aus der jüngsten Auswertungswoche. Voller Tabellen-Drilldown in der Modell-Arena unten.

Prognose-TÜV

Wochenrückblick

22. Juni – 28. Juni 2026 · vier Episoden · 34 Sekunden

Sechs Modelle, sechs Städte, eine Woche — wer hat richtig vorhergesagt, wer lag daneben? Die größten Treffer und Patzer als animierter Wochenrückblick.

Prognose-TÜV · Das Duell

Modell-Arena

Wer sagt das Wetter wirklich am besten voraus? · KI gegen Physik · Tageshöchst-MAE in Kelvin

ECMWF AIFS

Neuronales Netz

1,36

Ø MAE · 30 Tage · führt

ECMWF IFS

Physik-Gleichungen

1,48

Ø MAE · 30 Tage

„KI punktet auf Distanz"

Wochenurteil · automatisch getextet von GPT-5.x

Worum geht es hier?

Wetterdienste sagen das Wetter mit verschiedenen Modellen voraus. Klassische Physik-Modelle rechnen die Atmosphäre Schritt für Schritt mit physikalischen Gleichungen durch — etwa ICON vom Deutschen Wetterdienst oder das Modell des ECMWF. Neuere KI-Modelle rechnen nicht, sondern haben Wettermuster aus jahrzehntelangen Daten gelernt — zum Beispiel ECMWF AIFS oder Googles WeatherNext.

Die Modell-Arena vergleicht beide Lager fair und im Nachhinein: Jede Vorhersage wird gegen das tatsächlich eingetroffene Wetter gemessen (die ERA5-Beobachtung). Je kleiner der mittlere Fehler in Grad (MAE), desto näher lag das Modell an der Wirklichkeit. So zeigt sich Woche für Woche, wer wirklich am besten vorhersagt — und ob die KI die klassische Physik inzwischen schlägt.

Wochenurteil · Hochdeutsch uff Hessisch

Im 30-Tage-Rückblick über sechs hessische Städte bleibt das Bild gemischt: auf 24, 48 und 72 Stunden liegen die Physik-Modelle mit 1,09, 1,12 und 1,20 K MAE vor der KI mit 1,21, 1,21 und 1,27 K. Auf sieben Tage dreht sich das Urteil deutlich, dort kommt die KI auf 2,20 K, die Physik auf 3,32 K. Bester Allrounder über alle vier Vorlaufzeiten ist ECMWF AIFS mit 1,29 K; ICON-D2 hat zwar einen niedrigen Schnitt, liefert aber nur 24 Stunden und ist deshalb kein Allrounder. Statistisch ist das bei zwei KI-Modellen gegen vier Physik-Modelle eher eine Tendenz als ein Schlussspruch, zumal die Arena nun mit AIFS und Googles WeatherNext 2 auch ein KI-gegen-KI-Duell enthält. Das passt zum Branchenbild 2026: Das ECMWF hat Anfang des Jahres GraphCast, Pangu, Aurora und FourCastNet im Betrieb abgeschaltet und setzt auf AIFS, die Wetterdienste bauen ihre KI inzwischen selbst.

Im 30-Daach-Rückblick iwwer sechs hessische Städt bleibt’s e gemischtes Bild: uff 24, 48 un 72 Stunn liege die Physik-Modelle mit 1,09, 1,12 un 1,20 K MAE vor de KI mit 1,21, 1,21 un 1,27 K. Uff siebe Daach dreht sich’s dann deutlich: die KI kommt uff 2,20 K, die Physik uff 3,32 K. De beste Allrounder iwwer all vier Vorlaufzeite is ECMWF AIFS mit 1,29 K; ICON-D2 steht zwar mit niedrigem Schnitt do, sacht aber nur 24 Stunn voraus un is drum kaa Allrounder. Statistisch is des bei zwaa KI-Modell gege vier Physik-Modelle eher e Tendenz als e Schlusswort, zumal die Arena mit AIFS un Googles WeatherNext 2 jetzt aach e Duell KI gege KI hat. Des passt in die Branche 2026: Des ECMWF hat Anfang vom Jahr GraphCast, Pangu, Aurora un FourCastNet im Betrieb abgeschaltet un setzt uff AIFS, die Wetterdienste baue ihr KI mittlerweile selbst.

90 Tage 30 Tage

1

ICON-EU Physik DWD

▲ 0.36 K Bias · Niederschlag 1.1 mm · 24–72 h

1.02

Ø MAE · K
2

ICON-D2 Physik DWD

▲ 0.86 K Bias · Niederschlag 1.2 mm · nur 24 h

1.02

Ø MAE · K
3

ECMWF AIFS KI ECMWF

▲ 0.26 K Bias · Niederschlag 1.1 mm · 24–7 Tage

1.26

Ø MAE · K
4

ECMWF IFS Physik ECMWF

· 0.02 K Bias · Niederschlag 1.2 mm · 24–7 Tage

1.31

Ø MAE · K
5

NOAA GFS Physik NOAA

▼ 0.20 K Bias · Niederschlag 1.3 mm · 24–7 Tage

1.71

Ø MAE · K
6

WeatherNext 2 KI Google DeepMind

▼ 1.42 K Bias · Niederschlag 1.2 mm · 24–7 Tage

1.77

Ø MAE · K

Modell	24 h	48 h	72 h	7 Tage
ICON-EU	0.85	1.03	1.17	—
ICON-D2	1.02	—	—	—
ECMWF AIFS	0.82	0.86	0.99	2.37
ECMWF IFS	0.64	0.86	0.98	2.77
NOAA GFS	1.01	1.11	1.31	3.39
WeatherNext 2	1.43	1.51	1.57	2.56

1

ICON-D2 Physik DWD

▲ 1.01 K Bias · Niederschlag 1.3 mm · nur 24 h

1.24

Ø MAE · K
2

ICON-EU Physik DWD

▲ 0.44 K Bias · Niederschlag 1.2 mm · 24–72 h

1.25

Ø MAE · K
3

ECMWF AIFS KI ECMWF

▲ 0.29 K Bias · Niederschlag 1.2 mm · 24–7 Tage

1.36

Ø MAE · K
4

ECMWF IFS Physik ECMWF

▲ 0.35 K Bias · Niederschlag 1.3 mm · 24–7 Tage

1.48

Ø MAE · K
5

WeatherNext 2 KI Google DeepMind

▼ 1.38 K Bias · Niederschlag 1.3 mm · 24–7 Tage

1.69

Ø MAE · K
6

NOAA GFS Physik NOAA

▲ 0.26 K Bias · Niederschlag 1.3 mm · 24–7 Tage

1.80

Ø MAE · K

Modell	24 h	48 h	72 h	7 Tage
ICON-D2	1.24	—	—	—
ICON-EU	1.15	1.32	1.27	—
ECMWF AIFS	0.84	0.88	1.07	2.64
ECMWF IFS	0.78	1.00	1.10	3.03
WeatherNext 2	1.59	1.62	1.59	1.96
NOAA GFS	1.14	1.15	1.39	3.53

Score = mittlerer Tageshöchst-Fehler (MAE) gegen die ERA5-Beobachtung, gemittelt über sechs hessische Städte und alle vom Modell abgedeckten Vorlaufzeiten. Niedriger = besser. Niederschlag fließt nicht in den Score ein. Modelle mit kurzer Reichweite (z. B. ICON-D2 nur 24 h) werden nur auf ihren Vorlaufzeiten bewertet — die Reichweite steht in jeder Zeile.

Datenquellen: Vorhersagen über Open-Meteo (ECMWF · DWD · NOAA) und Google Earth Engine (WeatherNext 2 © Google DeepMind, CC BY 4.0); Beobachtung ERA5 (Copernicus / ECMWF).

Niederschlags-Wertung

Ø Tages-Niederschlagsfehler (MAE) gegen ERA5 · letzte 90 Tage · niedriger = besser · separat vom Temperatur-Score

1 ECMWF AIFS · KI 1.11 mm
2 ICON-EU · Physik 1.12 mm
3 ICON-D2 · Physik 1.18 mm
4 WeatherNext 2 · KI 1.19 mm
5 ECMWF IFS · Physik 1.25 mm
6 NOAA GFS · Physik 1.35 mm

Bewusst getrennt gewertet: Niederschlag ist punktgenau schwer vorherzusagen und alle Modelle sind hier schwächer — im Tageshöchst-Score würde er das Bild verzerren. Hier zeigt sich, wer beim Regen am nächsten dran war.

KI gegen Physik

Ø Tageshöchst-MAE je Lager · letzte 30 Tage · 2 KI-Modelle vs. 4 Physik-Modelle · kürzer = genauer

24 h

1.21

Physik

1.08

48 h

1.25

Physik

1.16

72 h

1.33

Physik

1.25

7 Tage

2.30

Physik

3.28

Kontext 2026: Das ECMWF hat Anfang des Jahres die externen KI-Modelle (GraphCast, Pangu, Aurora, FourCastNet) im Betrieb abgeschaltet und konzentriert sich auf sein eigenes AIFS — die Wetterdienste bauen ihre KI inzwischen selbst. Auf der KI-Seite treten hier ECMWF AIFS und Googles WeatherNext 2 (DeepMind, GenCast-Linie) an — damit ist es zugleich ein Duell KI gegen KI. WeatherNext liefert nur 6-stündliche Werte; sein Tageshöchstwert wird aus dem 12-UTC-Schritt (≈ 14 Uhr MESZ, nahe der üblichen Höchstwert-Zeit) genähert, was sehr kurze Vorlaufzeiten leicht unterschätzen kann.

Prognose-TÜV · Die Teilnehmer

Die Modelle im Steckbrief

Wer tritt in der Arena gegeneinander an? Sechs Wettermodelle aus vier Häusern — zwei lernende KIs und vier klassische Physik-Modelle.

Künstliche Intelligenz

Aus Wetterdaten gelernt statt durchgerechnet

🇪🇺ECMWF · Reading / BonnKI

ECMWF AIFS

Das hauseigene KI-Modell des Europäischen Zentrums für mittelfristige Wettervorhersage. Statt die Atmosphäre durchzurechnen, hat es aus über 40 Jahren Wetterdaten gelernt. Seit Februar 2025 im offiziellen Betrieb — das Aushängeschild dafür, dass die Wetterdienste ihre KI inzwischen selbst bauen.

KI · ~0,25° Gitter · bis 7+ Tage

🌐Google DeepMindKI

WeatherNext 2

Googles KI-Wettermodell aus der GenCast-Familie. Es erzeugt ein ganzes Ensemble möglicher Wetterverläufe; wir nutzen das Ensemble-Mittel über Google Earth Engine. Die zweite KI in der Arena — damit wird der Vergleich auch zum Duell KI gegen KI.

KI · Ensemble (GenCast) · 6-stündlich

Klassische Physik

Die Atmosphäre mit physikalischen Gleichungen durchgerechnet

🇪🇺ECMWF · ReadingPhysik

ECMWF IFS

Das „Europäische Modell" — über Jahrzehnte der globale Goldstandard der klassischen Vorhersage. Es rechnet die Atmosphäre weltweit mit physikalischen Gleichungen durch und dient anderen Modellen oft als Referenz.

Physik · global · ~9 km

🇩🇪Deutscher Wetterdienst · OffenbachPhysik

ICON-EU

Das Europa-Regionalmodell des Deutschen Wetterdiensts. Feiner aufgelöst als globale Modelle und auf Europa zugeschnitten — ein verlässlicher Allrounder für Hessen über mehrere Tage.

Physik · Europa · ~7 km

🇩🇪Deutscher Wetterdienst · OffenbachPhysik

ICON-D2

Das hochauflösende Kürzestfrist-Modell des DWD mit rund 2 km Gitter. Stark im Detail — Gewitter, lokale Schauer — aber nur für die nächsten etwa zwei Tage. Deshalb kein Wochen-Allrounder, auch wenn es auf kurze Sicht oft vorn liegt.

Physik · ~2 km · nur ~2 Tage

🇺🇸NOAA · USAPhysik

NOAA GFS

Das US-amerikanische Global Forecast System. Frei verfügbar und weltweit verbreitet; es deckt den ganzen Globus ab, ist im Detail aber meist gröber als die europäischen Modelle.

Physik · global · ~13 km

Prognose-TÜV

Verifikation

Wer lag richtig? · letzte 28 Tage · Tageshöchst-MAE in Kelvin

ECMWF IFS liegt im 24-Stunden-Schnitt vorn — 0.78 K mittlerer Fehler, knapp vor ECMWF AIFS (0.84 K).

24 h

48 h

72 h

7 Tage

ECMWF AIFS

0.84

· 0.03 K Bias

0.88

▼ 0.05 K Bias

1.07

▼ 0.07 K Bias

2.64

▲ 1.29 K Bias

WeatherNext 2

1.59

▼ 1.44 K Bias

1.62

▼ 1.51 K Bias

1.59

▼ 1.38 K Bias

1.96

▼ 1.20 K Bias

ECMWF IFS

0.78

▲ 0.11 K Bias

1.00

▲ 0.08 K Bias

1.10

· 0.00 K Bias

3.03

▲ 1.20 K Bias

ICON-EU

1.15

▲ 0.43 K Bias

1.32

▲ 0.35 K Bias

1.27

▲ 0.52 K Bias

—

ICON-D2

1.24

▲ 1.01 K Bias

—

NOAA GFS

1.14

▼ 0.12 K Bias

1.15

▼ 0.10 K Bias

1.39

▼ 0.12 K Bias

3.53

▲ 1.36 K Bias

Ø Tmax 30 d · FFM 26.9° · KS 24.6° · FD 24.3° · WI 26.7° · GI 25.0° · MA 24.9°

punktgenau nah dran ungefähr danebenraten kalter Kaffee

▲ Modell prognostiziert zu warm · ▼ zu kalt · ohne Vorzeichen: bias-frei

Aufgeschlüsselt nach Stadt ›

24 h · Forecast

FFM

Obs Ø

26.9°

24.6°

24.3°

26.7°

25.0°

24.9°

ECMWF AIFS

0.92

0.85

0.70

0.96

0.79

0.80

WeatherNext 2

1.65

1.92

2.05

1.53

0.99

1.39

ECMWF IFS

0.89

0.81

0.65

0.88

0.80

0.68

ICON-EU

1.19

0.96

1.07

1.05

1.36

1.26

ICON-D2

1.13

1.06

1.32

0.93

1.69

1.31

NOAA GFS

1.32

1.44

1.10

1.09

0.94

48 h · Forecast

FFM

Obs Ø

26.9°

24.6°

24.3°

26.7°

25.0°

24.9°

ECMWF AIFS

1.01

0.89

0.65

0.98

0.91

0.84

WeatherNext 2

1.67

1.96

2.19

1.65

1.01

1.26

ECMWF IFS

1.23

1.01

0.72

1.14

1.02

0.91

ICON-EU

1.39

1.17

1.20

1.50

1.49

ICON-D2

—

NOAA GFS

1.27

1.35

1.13

1.07

1.09

1.01

72 h · Forecast

FFM

Obs Ø

26.9°

24.6°

24.3°

26.7°

25.0°

24.9°

ECMWF AIFS

1.25

1.11

0.74

1.13

1.23

0.97

WeatherNext 2

1.58

1.92

2.19

1.70

0.98

1.15

ECMWF IFS

1.48

1.17

0.78

1.31

0.95

0.93

ICON-EU

1.35

1.21

1.24

1.26

1.35

1.20

ICON-D2

—

NOAA GFS

1.58

1.63

1.36

1.26

1.32

1.22

7 Tage · Forecast

FFM

Obs Ø

26.9°

24.6°

24.3°

26.7°

25.0°

24.9°

ECMWF AIFS

2.75

2.49

2.61

2.37

2.85

2.76

WeatherNext 2

1.91

2.21

2.33

2.12

1.50

1.70

ECMWF IFS

2.92

3.32

3.27

2.91

2.75

3.00

ICON-EU

—

ICON-D2

—

NOAA GFS

4.31

2.99

3.59

3.66

3.42

3.20