Blog

Hundert Gramm LEGO, bitte.

Hundert Gramm LEGO, bitte. Was macht das? – Kommt drauf an.

Nachdem meine Beschäftigung mit Lego-Baukästen über Jahrzehnte brach lag, habe ich mich in letzter Zeit dann doch noch mal intensiv mit Lego beschäftigt. Die Beschäftigung besteht jetzt aber weniger im Bauen von Lego-Modellen, sondern in der Analyse der Preise von Lego-Sets.

Wenn der Vater mit dem Sohne

Das kam so: Mein sechsjähriger Sohn ist begeisterter Lego-Fan. Lego-Prospekte gehören zu seiner bevorzugten Lektüre und ein gemeinsamer Kaufhausbesuch ist ohne das Abgehen der Lego-Regale unvorstellbar. Beim wiederholten Betrachten der Regale verfestigte sich mein Eindruck, dass Sets aus unterschiedlichen Lego-Themenwelten unterschiedlich teuer sind. Die empirische Probe, nämlich der im Kaufhaus vorgenommene Packungsgrößenvergleich gleich teurer Produkte, bestätigte diesen Eindruck.

Und schlagartig hatte das Thema Lego eine neue Dimension: Data Science. Her mit den Bausatz-Daten, weg vom Vergleich im Kaufhaus. Meine anschließende Recherche zeigte, dass ich nicht der einzige große Junge bin, der in einer ‚neuen Dimension‘ Lego spielt. Es gibt Lego-CAD-Programme, mit denen man zunächst virtuell eigene Modelle entwickeln kann, um anschließend per Explosionszeichnung eine genaue Übersicht über die verwendeten Teile zu erhalten. Auf rebrickable.com kann man prüfen, welche Modelle aus anderen Bausätzen sich mit den im eigenen Besitz befindlichen Bausätzen (unter optionaler Wahrung der Farbtreue) nachbauen lassen. brickset.com bietet nicht nur News aus dem Lego-Universum, sondern auch Detailinformationen zu über 10000 Sets aus den letzten 50 Jahren. Und eine API.

Die Information ist irgendwo da draußen, man muss sie nur holen (und putzen)

Schnell waren, automatisiert über die entdeckte Brickset-API, die 3057 Lego-Sets der letzten fünf Jahre in R eingelesen. Das „Putzen“ der Daten war dann der deutlich aufwändigere Schritt, Data Science eben. Weggeputzt wurden Einträge mit fehlenden Werten, Lego-Video-Spiele, Schlüsselanhänger, etc. Also alles, was die Vergleichbarkeit der Sets gefährdet hätte. Am Ende blieben 153 Bausätze der Themenwelten City, Legends of Chima und Star Wars für die weitere Untersuchung übrig. Die Eingrenzung auf diese drei Themen liegt in den ganz subjektiven Vorlieben meines Sohnes begründet. Eine Übersicht über die betrachteten Lego Sets findet sich hier.

CityLegends of ChimaStar Wars
# Sets842643153

Auf dieser Grundlage lässt sich der Einfluss von Packungsgröße, Teilezahl, Gewicht und Themenwelt auf den Preis nun endlich systematisch untersuchen.

LEGO Preisvergleich - Preis versus Volumen / Teile / Gewicht

Was die Daten sagen

Die Tatsache, dass der Preis mit den drei untereinander stark korrelierten Größen Packungsgröße, Teileanzahl und Gewicht steigt, stellt nicht wirklich eine Überraschung dar. Mehr Lego, teureres Set.

Interessanter ist da schon der Eindruck, den man beim Vergleich der drei dargestellten Panels in Abb. 1 erhält: Es zeigen sich relativ große Unterschiede zwischen den Lego-Themen beim Einfluss von Packungsgröße und Gewicht auf den Kaufpreis. Diese Unterschiede erscheinen deutlich schwächer beim Einfluss der Teilezahl auf den Setpreis. Dies wird sehr gut deutlich bei Betrachtung der Lego-Sets zum Preis von 69.99 € (horizontale schwarze Linie).

Bedeutet dies, dass Lego Star Wars-Sets tendenziell aus kleineren und damit leichteren Lego Teilen bestehen? Eine Antwort darauf gibt folgende Grafik:

Preis pro Teil - Gewicht pro Teil

In der Grafik ist der durchschnittliche Teilepreis (also Setpreis/#Teile) gegen das durchschnittliche Teilegewicht (Gewicht/#Teile) der einzelnen Sets aufgetragen. Die Größe der Kreise ist proportional zur Teilezahl im Bausatz. Die Randverteilung der beiden Größen lässt sich den seitlich angefügten Boxplots entnehmen. Es ist offensichtlich, dass Lego Star Wars-Teile deutlich teurer und deutlich leichter sind als Teile aus Lego City-Sets. Der Einfluss der Marke bzw. Themenwelt auf den mittleren Teilepreis lässt sich mittels einer Regressionsanalyse bestimmen. Hierbei beschränke ich mich auf einen Datensatz, der die in den Boxplots gekennzeichneten Extremwerte nicht mehr enthält. Der Einfluss des Gewichts und der Themenwelt auf den Teilepreis ist wie folgt:

EinflussgrößeRegressionsergebnis
Gewicht2.92 Cent/Gramm
City - Aufschlag5.06 Cent
Legends of Chima - Aufschlag5.61 Cent
Star Wars - Aufschlag9.17 Cent

Inwieweit das Gewicht oder die Zugehörigkeit zu einer Themenwelt der Legoteile für den Teilepreis verantwortlich sind, lässt sich elegant anhand des Shapley-Werts für den Erklärungsgehalt der beiden Regressoren bestimmen. So wird die Varianz in den Daten durch das Modell zur Hälfte erklärt (R² = 0.49). Der Erklärungsgehalt verteilt sich im Verhältnis 1:3 auf die Größen Gewicht und Lego-Themenwelt.

Was kosten 100 Gramm LEGO?

Was kosten denn nun 100g Lego? Kommt drauf an. Auf die Themenwelt und auf die Anzahl der Teile. Orientieren wir uns an 2g schweren Teilen, so berechnet sich der zu erwartende Preis gemäß

Das ergibt:

Preis je 100g Lego
City5.45 €
Legends of Chima5.73 €
Star Wars7.50 €

Selbstverständlich entkräftet das alles nicht das Argument meines Sohnes, dass er nun mal am liebsten mit Lego Star Wars spielt.