Energie sparen heißt zunächst einmal, den Energieverbrauch zu messen

Sparen ist angesagt

Seit Monaten wird darüber gesprochen, dass im jetzt kommenden Winter ein Energieproblem auf Deutschland zukommen wird oder kann – je nach dem, was man als „Problem“ betrachtet und wem man zuhört. Es scheint eine relativ einhellige Meinung darüber zu bestehen, dass wir unseren Energieverbrauch um ca. 20% reduzieren müssen, um das Risiko eines Blackouts zu reduzieren.

Wo steht mein Haushalt eigentlich?

Ein Blick in unsere Strom- und Gasabrechnungen der letzten Jahre zeigt, dass unser drei-Personen-Haushalt im Mittel der letzten Jahre pro Jahr

  • ca. 10.000 kWh Gas und
  • ca. 2.500 kWh Strom

verbraucht hat. Laut unserem Anbieter scheinen wir damit deutlich unter dem Durchschnitt zu liegen.

Messen einfach gemacht: Strom- und Gaszähler

Gerade für Strom gibt es allerhand Messgeräte, die man direkt vor den Verbraucher, z.B. den Fernseher, schalten und so die vom Gerät entnommene Leistung messen kann. Aber wie machen wir das für die Mikrowelle oder den E-Herd (den wir kaum benutzen)? Lohnt es sich also, so ein Gerät anschaffen? Und warum für Strom, wenn es für Gas nichts vergleichbares zu geben scheint (für den individuellen Verbrauch von Gasherd, -heizung und für Warmwasser)?

Wir haben deshalb beschlossen, einfach direkt an Strom- und Gaszähler abzulesen. Der Nachteil liegt auf der Hand: Rückschlüsse auf einzelne Verbraucher sind nicht ohne weiteres zu haben. Wieviel verbraucht zum Beispiel mein Computer im Laufe von 24 Stunden, wenn ich ihn nachts nicht ausschalte? Gleichzeitig können wir beliebig lange – und auch beliebig genaue Zeitreihen erfassen. Die sehen dann wie folgt aus:

Wir erfassen also

  • das Datum
  • die Uhrzeit
  • den Zählerstand Strom in Kilowatt-Stunden
  • den Zählerstand Gas in Kubikmeter und
  • „Bemerkungen“.

Dank der „Bemerkungen“ können wir – zumindest im Prinzip und falls wir „fleißig genug“ sind – zum Beispiel den Verbrauch der Waschmaschine erfassen, indem wir jeweils vor- und einem Waschgang den Strom ablesen.

Der Gaszähler zeigt Kubikmeter an – wir bezahlen aber Kilowattstunden!

Wenn man einmal anfängt, den Dingen auf den Grund zu gehen, dann erlebt man Überraschung: ablesen können wir am Gaszähler die Kubikmeter, wir bezahlen aber Kilowattstunden. Was die Umrechnung angeht, da vertrauen wir also dem Gaslieferanten (und dem zuständigen Eichamt).

In unserer Gasrechnung findet sich dazu eine sparsame Erklärung: der „Brennwert“, also wieviel Energie das Gas je Kubikmeter enthält, hängt von der Zusammensetzung des Gases ab. Im Internet erfahre ich, dass es auch eine „Zustandszahl“ gibt, die Temperatur und Druck berücksichtigt. Nun wird die Temperatur im Winter vermutlich geringer sein als im Sommer und der Kubikmeter Gas enthält dann auch mehr Energie. Welche Werte für welchen Zeitraum unserer Abrechnung zugrunde gelegt werden, darüber schweigt sich unsere Abrechnung aus. Im Internet finden sich einige interessante Referenzen, zum Beispiel auch diese hier. Man könne, so heißt es dort, den Abrechnungsbrennwert „regelmäßig“ beim Gaslieferanten erfragen.

Ein Anruf dort stößt tatsächlich auf Verständnis: „Ich finde gut, dass Sie nachfragen.“ Für unseren Wohnort wird uns ein Brennwert von 10,5 – 10,6 genannt und eine Zustandszahl von 0,976. Also rechne ich wie folgt um:

Verbrauchte Energie [kWh] = 10,6 * 0,976 * Verbrauchtes Gas [m^3]

Wir wollen unsere Freiheiten bei der Datenerfassung und -auswertung

Der Teufel steckt bekanntlich im Detail.
Das wird nach den ersten Tagen schon  klar.

Ich habe unsere Daten in ein Excelblatt übertragen und möchte sie auswerten. Zur Analyse würde man sich wünschen, dass die Werte regelmäßig, zum Beispiel täglich um 08:00 Uhr, erfasst werden. So könnte man dann den Verbrauch innerhalb von 24 Stunden bestimmen und vergleichen. Diese Disziplin bringen wir als Familie jedoch nicht auf. Bei uns liegt vielmehr der oben abgebildete Zettel in der Küche und wer auch immer möchte kann kurz in den Hauswirtschaftsraum herübergehen und eine neue Zeile eintragen.

Ich habe deshalb beschlossen, die Daten stattdessen mit einem R-Skript auszuwerten. Da ich noch nicht genau weiß, welche Auswertungen ich im Laufe der Zeit erstellen möchte, bleibe ich so flexibel. Das Skript kann zudem im Laufe der Zeit in einen Markdown-Report übertragen werden und so würden dann alle Auswertungen „per Knopfdruck“ zur Verfügung stehen. Das Excel-Blatt dient dabei lediglich als „Datenbank“. Das Programm Power-BI wäre dazu eine mögliche Alternative.

Erste Auswertung: einfacher Zeitverlauf

Mein Skript liest zunächst die Rohdaten aus dem Excelblatt ein und ich überführe die Daten in eine „aufgeräumte Struktur“, sodass jeweils eine Spalte entsteht für:

  • Datum und Uhrzeit
  • Energieverbrauch in kWh
  • Energieform (Gas oder Strom).

Dafür werden die Spalten jeweils „gestapelt“. Unter Verwendung des ggplot-Pakets in R lässt sich so mit folgenden Befehlszeilen (Formatierungsanweisungen habe ich der Einfachheit halber herausgenommen)

ggplot(data = plotdat, 
       aes(x = Datum, 
           y = kWh, 
           colour = Energie)) + 
geom_line()

diese Graphik erstellen:

Im betrachteten Zeitraum erkennen wir zunächst einen ziemlich gleichmäßigen Verbrauch. Im Jahr 2022 war der Oktober sehr warm und wir haben bis Ende Oktober nicht (mit Gas) geheizt: tagsüber scheint die Sonne herein, abends ziehen wir die Vorhänge zu, um die Wärme im Haus zu behalten. Dank guter Isolierung hat das bisher gereicht. Ein Vergleich zu später wird also interessant werden.

Ganz zu Beginn unserer Messungen steht ein Experiment: wir haben für einige Tage das Gas vollständig aus- und nur dann kurz wieder eingeschaltet, wenn das Duschwasser zu kalt geworden ist. Das Ergebnis ist anhand des bis zum 18. Oktober deutlich flacheren Verlaufs des Gasverbrauchs zu erkennen.

Der durchschnittliche Verbrauch lässt sich nun über eine Regressionsanalyse ermitteln:

model <- lm(StromverbrauchkWh ~ DatumUhrzeit, data = t)
summary(model)

So ergibt sich, dass (R-Quadrat) 99,9% der beobachteten Variation im Stromverbrauch mit dem Fortschreiten der Zeit zusammenhängen und nur 0,1% mit „Spezialeffekten“, wenn wir die Waschmaschine, einen Laubpuster oder den Trockner (kurz) laufen lassen. Der durchschnittliche tägliche Verbrauch lässt sich anhand der Steigung ermitteln. Wir erhalten:

  • Gas: 4,9 kWh/24h (R^2 = 99,1%)
  • Strom: 6,9 kWh/24h (R^2 = 99,9%)

Mit Blick auf das nun angekündigte kühlere Wetter – und wir haben heute die Heizung von „Schutzbetrieb“ auf „Eco“ umgeschaltet – liegt jedoch folgender Wunsch nahe: Wir wollen diese Regressionsanalyse nicht einfach nur über den gesamten Betrachtungszeitraum durchführen. Das wäre ohne weiteres auch in Excel möglich. Vielmehr möchten wir in der Lage sein, über ein wählbares Zeitfenster, zum Beispiel über 7 Tage hinweg, solch eine Regression durchzuführen, um die dadurch entstehende Zeitreihe untersuchen zu können. Schwankungen im durchschnittlichen Verbrauch sollten so erkennbar sein.

Bei diesem – relativ einfachen – Wunsch steigen meinem Kenntnisstand nach jedoch Excel, Power-BI und jegliche „Klick-Software“ aus – es sei denn, man erstellt ein Skript. Genau das tun wir von Anfang an in R.

Das Ergebnis wollen wir uns beim nächsten Mal anschauen.

Obama oder Romney? Was sagen die Daten?

Der Economist hat am 13. Oktober 2012 eine (externer LinkGraphik veröffentlicht, um Daten zur Beantwortung dieser Frage heranzuziehen. Bitte nehmen Sie sich die Zeit und schauen Sie sich diese Daten an. Vermutlich werden auch Sie die Augen zusammen kneifen müssen, um die Aussage des Economist herauszulesen: die Wirtschaftsdaten legen eine Wahlniederlage Obamas nahe.

Davon abgesehen: der Economist formuliert die Problemstellung sehr geschickt: welche Faktoren könnten bestimmen, ob der aktuelle Präsident (so er denn kandidiert) wieder- oder abgewählt wird? So gefragt kann man Daten sammeln und analysieren.

Ihnen fallen sicher sofort „Wirtschaftswachstum“, „Arbeitslosenquote“, „Inflationsrate“ ,
„Kosten der Wahlkampagne“ und ähnliches ein. Wir wollen nicht spekulieren, und
sie einfach in einem (externer LinkIshikawa-Diagramm strukturiert aufzählen. Die Krux dabei ist jedoch folgende: je mehr dieser möglichen Einflussfaktoren Sie auf Signifikanz testen wollen, desto mehr Daten brauchen Sie: zwei Punkte für eine Gerade, drei spannen eine Ebene auf – und so weiter. Sie müssen schließlich auch ein paar Punkte „übrig haben“, um zu testen, ob alles stimmig ist. (Wem sich bei dieser Beschreibung einer Regressionsanalyse die Nackenhaare sträuben, der weiß mehr als ich hier voraus setzen möchte).

Der Economist geht sehr vorsichtig an die Sache heran:
1) Er zieht lediglich die Wahlergebnisse nach dem II. Weltkrieg heran: es könnte ja sein, dass sonst „Äpfel mit Birnen verglichen“ würden.
2) Er testet lediglich einen Faktor, das wirtschaftliche Wachstum (in einer getrennten Graphik auch die Arbeitslosenquote) – und zwar für die letzten 6 Monate vor der Wahl.

Die sodann präsentierte (externer LinkGraphik stellt das Wirtschaftswachstum Quartal für Quartal vor Präsidentschaftswahlen dar, die entweder gewonnen (hellblau) oder verloren (rosa) wurden. Die Chancen von Obama werden eher schlechter bewertet, da seine Kurve in der Nähe des Mittelwerts der historischen Wahlverlierer liegt (blaue Kurve).

Aus Sicht einer Statistikerin stellt das aber lediglich die Formulierung einer Hypothese dar: die Daten könnten nahe legen, dass Obama verliert. Wie groß seine Gewinnchancen tatsächlich sind, das lässt sich so nicht ermitteln.

Die hier betrachtete Problemstellung ist ein Beispiel für „kontinuierliches x“ (das
Wirtschaftswachstum kann ein Kontinuum von Werten annehmen) gegen ein
„diskretes Y“ (die Wahl wird entweder gewonnen oder verloren). Gesucht ist Y =
f(x). Berühmt geworden ist die dahinter stehende (externer Link) „Logistische Regression“ über die (externer LinkChallenger-Katastrophe 1986: dem NASA-Team lagen Daten zwar vor zur Brüchigkeit von Dichtungsringen („gebrochen, nicht gebrochen“) in Abhängigkeit von der Temperatur. Diese Daten konnten aber nur unzulänglich interpretiert werden – mit fatalen Folgen.

Die oben vom Economist zitierten Daten habe ich mittels logistischer Regression ausgewertet. Weder der Trend des Wirtschaftswachstums noch der Wert eines bestimmten Quartals spielen (bei 95% Signifikanz) eine Rolle. Zieht man jedoch den
Mittelwert des Wirtschaftswachstums der letzten 6 Quartale heran, dann ergibt
sich ein  „(externer LinkP-Wert“ von 0,009. In anderen Worten: mit 99.1% Wahrscheinlichkeit ist die so aufgedeckte Korrelation von Wirtschaftswachstum zu Wiederwahl kein „Zufallsprodukt“.

Die logistische Regression erlaubt zudem, eine Vorhersage-Gleichung abzuleiten. So ergibt sich folgende Kurve:

Chancen der Wiederwahl

Chancen der Wiederwahl

 

Für Barack Obama liegen bisher nur die Wirtschaftsdaten der Quartale 6..2 vor der Wahl vor. Der Durchschnitt aus diesen liegt bei zwei Prozent. Ups…

Was (im Gegensatz zur „gewöhnlichen“) die logistische Regression nicht zulässt ist, einen R^2-Wert zu bestimmen. Dieser besagt, wie viel der beobachteten Variation in Y sich über eine Variation in x erklären lässt. Konkret hier: wie viel Spielraum lässt der beobachtete Zusammenhang anderen Faktoren als nur dem Wirtschaftswachstum? Angemerkt sei, dass die logistische Regression solche Faktoren durchaus mit einbeziehen kann, also Y = f(x1, x2, …).

Zurück zur Aussage des Diagramms. Wenn ich diese Dinge hier schreibe, dann nicht, weil etwa diese statistische Beurteilung meinem Wunsch oder meiner Abneigung
entspräche. Einer der besten politischen Prognostiker, (externer LinkNate Silver, sagt zudem das Gegenteil des Schlusses voraus, den wir hier ziehen. Es geht mir einzig darum: wir wollen Zahlen die in ihnen steckenden Botschaften entlocken. Wir können dafür im Kaffeesatz einiger Excel-Graphiken rühren. Oder wir verwenden das quantitative Werkzeuge. Es kann in der Tat gelegentlich sehr wichtig sein, so seine Schlüsse zu ziehen.

Mein „Kochrezept“ zur Datenanalyse lautet deshalb:
1) Graphische Analyse, um so viele Hypothesen zu formulieren wie möglich
2) Statistische Analyse, um diese zu prüfen
3) Erneute graphische Darstellung, in der nur noch signifikante Signale vorkommen
4) Diese Darstellungen verwenden, um Veränderung zu initiieren.