„Der Wettbewerb wird immer härter“. So heißt es.
So fühlt es sich angesichts Energie-, Lieferketten- und anderer Krisen vielerorts auch an. Wie aber lässt sich dieser Eindruck in Zahlen fassen?
Die „Fortune 500“ Liste
Seit dem Jahr 1955 gibt es die „Fortune 500“ Liste der jeweils 500 größten US-amerikanischen Unternehmen. Jahr für Jahr werden deren Umsatz, Profit und Marge zusammengetragen und in dieser Liste veröffentlicht. Im Laufe der Zeit ist so eine beachtliche Datengrundlage entstanden.
Du kannst die Daten zu dem einen oder anderen Jahr im Internet finden. Manche Anbieter verkaufen sie auch. Dankenswerterweise hat der Nutzer cmusam die Datensätze der Jahre 1955 bis 2019 zusammengetragen und stellt sie auf Github zur Verfügung.
Mit einer kleinen Schleife habe ich diese Jahresscheiben heruntergeladen und in einer einzigen Datei von immerhin 32500 Zeilen (65 Jahre, 500 Zeilen pro Jahr) zusammengefasst. Das Ergebnis sieht wie folgt aus:
Ausschnitt aus den Daten. Wir sehen den Jahresübergang zwischen 2018 und 2019.
Wir verwenden R für unsere OSAN-Analysen
Wir betreiben „Open Source Analytics“ (OSAN) und verwenden dafür frei verfügbare Datenquellen und die Skript-, Berichts- und Webapplikationssprache R, die speziell für die Handhabung von Daten, Texten und Bildern entwickelt wurde. Du kannst Sie kostenfrei installieren. Sprachen wie R oder Python bieten Dir viele Vorteile, zum Beispiel diese:
- Du hast auf einen Schlag Zugang zu den neuesten und besten Analysewerkzeugen inklusive Dokumentation.
- Du kannst Dich bequem von „generativer“ künstlicher Intelligenz wie ChatGPT bei der Erstellung Deines Skripts coachen lassen.
- Du kannst Deine Analysen ohne viel Aufwand ständig aktuell halten: Einmal „Run“ gedrückt und schon lädt Dein Skript wieder die neuesten Daten herunter und wertet sie für Dich aus.
- Als Team ist Eure Lernkurve steiler: Anders als bei „Klicksoftware“ kannst Du Dein Vorgehen inklusive aller „Tricks und Kniffe“ in Deinem Skript festhalten. So könnt Ihr beste Praktiken leicht untereinander teilen.
- Eventuelle Fehler in Deiner Analyse können von Dir oder anderen aufgespürt und korrigiert werden: Denn anhand des Skriptes können alle Dein Vorgehen genau nachvollziehen.
Wie viele Unternehmen fallen Jahr für Jahr aus der Fortune 500 Liste heraus?
Wenn es tatsächlich immer schwerer wäre, an der Spitze zu bleiben, dann müssten wir das anhand der Fortune 500 Liste erkennen. Wir stellen deshalb zunächst die Frage: wie viele Unternehmen fallen Jahr für Jahr aus der Liste heraus? Ein Anstieg dieses „Ausfallrate“ wäre ein Maß für die Schwierigkeit, sich unter den größten 500 Unternehmen zu halten.
Wir wollen diese Frage zunächst für ein einziges Jahr beantworten. Dafür gehen wir wie folgt vor:
- Erstelle eine Liste der Unternehmen für das Jahr selbst („yearlist“)
- Erstelle eine weitere Liste für das Vorgängerjahr („previous.yearlist“).
- Ermittele aus diesen beiden Listen die „dropouts“.
Mit „Dropouts“ meinen wir diejenigen Unternehmen, die zwar in der „previous.yearlist“, nicht aber in der „yearlist“ selbst aufgeführt werden. In R-Code übersetzt sieht diese Überlegung wie folgt aus:
y <- 2000 # "Dropouts" für das Jahr 2000 yearlist <- t %>% filter(Year == y) %>% select(Company) %>% pull() previous.yearlist <- t %>% filter(Year == y-1) %>% select(Company) %>% pull() dropouts <- previous.yearlist[(previous.yearlist %notin% yearlist)]
Hier habe ich die Funktion %notin% als Negation der in dplyr verfügbaren Funktion %in% erstellt. So sehen wir, dass im Jahr 2000 immerhin 50, also 10% aller im Jahr 1999 aufgeführten Unternehmen von der Liste genommen wurden.
Diese „dropout“-Liste möchten wir nun Jahr für Jahr erstellen und ihre jeweilige Länge bestimmen: die Anzahl der in einem gegebenen Jahr „ausgeschiedenen“ Unternehmen. Es mag dafür elegantere Wege geben, der Einfachheit halber verwende ich jedoch die vorherigen Codezeilen und baue sie in eine Schleife ein, mit der ich alle Jahre durchlaufe.
Für das Jahr 1995 finde ich so einen „Ausreißer“: in diesem Jahr werden sage und schreibe 291 Unternehmen auf der Liste ausgetauscht: Ergebnis einer neuen Bewertungsmethode? Eine Krise? Das wäre zu klären. Ich nehme diesen Datenpunkt aus den Daten heraus und erhalte mittels ggplot folgende Darstellung:
Anzahl der Unternehmen, die Jahr für Jahr von der Fortune 500 Liste genommen werden.
Man könnte hier den Eindruck gewinnen, die Situation wäre bis etwa zum Jahr 1980 mehr oder weniger stabil – und als wäre seither die Anzahl der „Dropouts“ angestiegen. Um das zu überprüfen, verwende ich eine Regelkarte.
Regelkarten erlauben, das Signal im Rauschen zu finden
Wenn Du in der Produktion oder im Qualitätsmanagement arbeitest, dann kennst Du dieses Werkzeug. Regelkarten wurden vor ziemlich genau 100 Jahren von Walter A. Shewhart entwickelt. Sie erlauben, statistisch signifikante Prozessschwankungen schnell und sicher zu identifizieren: Wenn Du zum Beispiel mit 10 Würfeln würfelst, dann hast Du mal mehr und mal weniger Sechser. Es handelt sich hier um kein „Signal“ sondern um reines „Rauschen“. Wenn Du dann jedoch bei Deinen Würfeln hinter den Einsern kleine Gewichte einarbeiten würdest, dann würde in der Folge die Wahrscheinlichkeit, eine Sechs zu würfeln, ansteigen. In dem „Rauschen“ dieser neuen „Phase“ wäre dann im Vergleich zu den Vorgängerdaten ein „Signal“ versteckt. Solche Signale kannst Du mit Regelkarten aufdecken.
Je nach Art der vorliegenden Daten gibt es jeweils angepasste Regelkarten. Da wir hier eine konstante Stichprobe von 500 Unternehmen („sizes“) vorliegen haben und wir das Herausfallen eines Unternehmens als „Defekt“ zählen, verwende ich die np-Regelkarte, zunächst einmal für alle Daten.
In R ist das dank des qcc-Pakets ein Einzeiler. „Dropouts“ und „Sizes“ sind jeweils Vektoren. Einige „Verschönerungen“, die die Graphik lesbarer machen, habe ich der Einfachheit halber hier weggelassen:
qcc(data = Dropouts, sizes = Sizes, type = "np")
np-Regelkarte für die jährlich von der Fortune 500 Liste heruntergenommenen Unternehmen.
In dieser Darstellung erkennen wir, dass die Werte der meisten Jahre vor 1980 unterhalb der Mittellinie (CL = Center Line, bei 34,3) liegen. Weil das „erstaunlich viele“ sind, markiert die np-Karte diese gelb. In den späteren Jahren finden wir auch drei Ereignisse, die überhaupt nicht zu der allgemein beobachteten Variation passen und deutlich oberhalb der „oberen Eingreifgrenze“ (UCL, „upper control limit“) von 51,2 ausgetauschten Unternehmen pro Jahr liegen. Diese Ereignisse werden rot markiert.
Mit Beginn der 1980er Jahre scheint die Welt anders auszusehen als vorher. Was hat sich da geändert? Unsere Daten geben keine Antwort – sie werfen aber diese Frage auf: Unternehmen in die Zukunft zu führen scheint seither schwerer geworden zu sein. Warum ist das so?
Um diese Änderung graphisch deutlicher herauszuarbeiten erlaube ich mir, mit dem Jahr 1980 eine neue „Phase“ beginnen zu lassen. Ich eiche die Regelkarte mit den vorherigen Jahren und bewerte mit der so erhaltenen Kalibrierung diese neue Phase:
np-Regelkarte für die jährlich von der Fortune 500 Liste heruntergenommenen Unternehmen. Wir „eichen“ die Regelkarte mit den Jahren bis 1979 und betrachten damit die Jahre seit 1980.
In den Jahren 1955-1979 werden Jahr für Jahr im Durchschnitt 26,2 Unternehmen von der Fortune 500 Liste genommen. Für die Jahre 1980-2019 steigt diese Zahl auf durchschnittlich 39,7 Unternehmen an. Das entspricht einer Steigerung um etwa 50%.
Ziemlich harter Tobak. Oder?
Es ist also tatsächlich schwerer geworden, in der Gruppe der 500 größten Unternehmen zu verbleiben: Seit 1980 um ca. 50% schwerer.
Auf ihrer „Reise nach Jerusalem“, wenn man so will, hat es bis Anfang der 1980er Jahre jedes Jahr etwa 26 Unternehmen auf der Fortune 500 Liste „erwischt“ und sie waren im Folgejahr nicht mehr dabei. Seither ist diese Zahl auf etwa 40 Unternehmen pro Jahr angestiegen.
Als nächstes wollen wir eine „Lebensdauerbetrachtung“ durchführen. Wenn Du Dich mit Produktzuverlässigkeit auskennst, dann weißt Du, wie das geht. Für den vorliegenden Fall brauchst Du dazu nicht einmal besonders ausgefuchste Werkzeuge. Aber das ist eine andere Geschichte. Und die soll beim nächsten Mal erzählt werden.