Hilfe
abbrechen
Suchergebnisse werden angezeigt für 
Stattdessen suchen nach 
Meintest du: 

Benford-Analyse, oder: die Eins gewinnt immer!

nmh
Legende
9.960 Beiträge

Liebe Zahlenfreunde, Zahlendreher und Zahlando-Fans* (m/w),

 

mein neuer Großrechner ist seit gut zwei Wochen im Einsatz. Das Monster ist so irre schnell, daß die Auswertungen jetzt immer schon viel früher fertig sind und der Rechner sich dann langweilt. Um ihm die Langeweile zu vertreiben, habe ich mal meine Kursdatenbank statistisch auswerten lassen.

 

Unter anderem habe ich mir angesehen, wie oft die Ziffern "1" bis "9" als erste Ziffer in den gut 60 Millionen historischen Börsenkursen meiner Hauptdatenbank vorkommen. Das Ergebnis dürfte viele überraschen. Die Ziffern sind nicht gleich häufig, sondern die Ziffer "1" kommt viel öfters vor als die Ziffer "2", und die "2" ist viel häufer als die "3". So geht das weiter bis zur Ziffer "9", die am seltensten vorkommt. Das folgende Diagramm zeigt die Auswertung für alle Aktien:

 

Benford-Verteilung der BörsenkurseBenford-Verteilung der Börsenkurse

Von allen 60 Millionen Börsenkursen, die ich ausgewertet habe, fangen also knapp 29% mit der Ziffer "1" an (zum Beispiel 17,36 Euro oder 0,018 Euro), aber nur 4,8% mit der Ziffer "9". Bei Zahlen, die vor dem Komma eine Null haben, zählt die erste Ziffer nach dem Komma, die nicht Null ist.

 

Ist schon erstaunlich, oder? Aber wissenschaftlich zu erklären. Dahinter steckt das sogenannte "Benford-Gesetz". Unter diesem Stichwort findet man in diesem "Internet" ganz viel Informationen darüber.

 

Kurz gesagt geht es dabei um eine Gesetzmäßigkeit in der Verteilung der Ziffernstrukturen von Zahlen in empirischen Datensätzen, zum Beispiel ihrer ersten Ziffern. Das Gesetz lässt sich etwa in Datensätzen über Einwohnerzahlen von Städten, Länge von Flüssen, Hausnummern in einer Stadt, Geldbeträge in der Buchhaltung, Naturkonstanten und so weiter beobachten. Ganz konkret:

 

Stellt Euch eine Stadt mit 1500 Straßen vor. Die erste Straße hat 20 Häuser, von 1 bis 20 nummeriert. Die nächste Straße hat 77 Häuser von 1 bis 77. Straße Nummer 3 hat 143 Häuser mit den Hausnummern 1 bis 143. Was alle Straßen gemeinsam haben: Alle haben eine Hausnummer "1", die meisten auch eine Hausnummer "2" und so weiter. Wenn Ihr jetzt die Hausnummern aller 1500 Straßen untereinander schreibt, stellt Ihr fest, daß es in jeder Straße eine Hausnummer 1 gibt, aber nicht in jeder Straße eine Hausnummer 99. In der Stadt kommt die Hausnummer "1" viel häufiger (nämlich genau 1500 mal) vor als höhere Hausnummern. Eine Straße mit der Hausnummer 254 hat auch ein Haus Nummer 183, aber nicht automatisch auch umgekehrt. Wenn man sich das so verdeutlicht, wird klar, warum die Ziffer 1 an erster Stelle aller Hausnummern der Stadt öfters vorkommen muss als höhere Ziffern.

 

Und das gilt eben auch für Börsenkurse, wie meine kleine Statistik eindrucksvoll beweist.

 

Was bringt das jetzt? Mir bringt es in erster Linie Klickzahlen, weil Ihr meinen dümmlich-wichtigtuerisch-langweiligen Beitrag angeklickt habt. Übrigens dürfte auch eine Auswertung der Klickzahlen der Beiträge in der Community dem Benford-Gesetz entsprechen. Es gibt wesentlich mehr Beiträge mit 12, 19, 1, 178 oder 1857 Klicks (nämlich gut 30 Prozent) als Beiträge mit 9, 95 oder 9284 Klicks (nämlich knapp 5 Prozent).

 

Und eine ganz handfeste Anwendung findet das Benford-Gesetz in der Finanzverwaltung. Unsere Finanzämter verwenden eine Software, die die Zahlen in Steuererklärungen überprüft und dabei auch die erste Stelle statistisch untersucht. Wenn die Verteilung der ersten Ziffer in einer Steuererklärung ungefähr dem Benford-Gesetz entspricht, handelt es sich um empirische Daten. Wenn jedoch die Verteilung völlig anders ist, dann liegt der Verdacht einer Manipulation nahe: Zahlen, die sich jemand ausgedacht hat, sind nicht empirisch und erfüllen nicht das Benford-Gesetz. Der Steuerprüfer schaut sich dann diese Steuererklärung besonders gründlich an.

 

Noch etwas: das obige Diagramm zeigt die Verteilung der ersten Ziffer für alle Aktien. Wenn man die Verteilung über alle Wertpapiere analysiert, tritt die Ziffer "1" an erster Stelle der Börsenkurse sogar mit einer Wahrscheinlichkeit von 34% auf. Außerdem zeigt sich eine erhöhte Wahrscheinlichkeit bei der Ziffer "9", nämlich knapp 7%. Das liegt daran, daß es an der Börse wesentlich mehr Anleihen als Aktien gibt. Und Anleihen haben nun mal gerne Börsenkurse von 101, 109, 117 oder 125 Prozent, oder auch 98, 96 oder 92 Prozent. Das erklärt die besondere Häufung der "1" und der "9" an der ersten Stelle der Börsenkurse von Anleihen.

 

Wer jetzt Lust auf Zahlenspiele bekommen hat und die Hintergründe besser verstehen möchte, googelt nach "Benford". Viel Spaß - das lohnt sich wirklich!

 

Herzliche Grüße aus einem sonnig-warmen,

aber seit heute vom Oktoberfest befallenen München

 

nmh

 

_____________

*)  Bei der letzten Redaktionssitzung war das nmh-Team der Ansicht, dass die nmh-Beiträge in letzter Zeit lustlos und humorlos und blutlos äh blutleer geworden sind. Etwas mehr Humor sollte rein. Das habt Ihr jetzt davon: billigste Sparwitze.

Disclaimer: Ich habe leider kein scharfes ß auf meiner Schweizer Tastatur.
14 ANTWORTEN

Gevatter_Tod
Experte ★★★
647 Beiträge

Danke, @nmh, für die Abhandlung über das Benford-Gesetz. Ich kann bestätigen, dass die Finanzverwaltung dies umfangreich für die (automatisierte) Prüfung von Steuererklärungen einsetzt. Ist die statistische Abweichung der einzelnen Zahlen in den Anlagen zu hoch, setzt die Prüfsoftware einen Checkpunkt und der Sachbearbeiter muss sich die Erklärung ansehen.

 

Es gibt also bei Kosten, die ihr in eurer Steuererkläung ansetzt, gerade keine Gleichverteilung.

 

Edit: Wer wirklich an Benford und Wirtschaftsprüfung interessiert ist, liest diese Bachelorarbeit (klick). Nicht nur die Finanzämter sondern auch der Zoll nutzt "IDEA".

 

"Es gibt keine Gerechtigkeit, es gibt nur mich!"
Gevatter Tod

nmh
Legende
9.960 Beiträge

Aha -- dachte ich's mir doch, daß @Gevatter_Tod   ... äääh ... keine Steuern bezahlt. Ich übrigens auch nicht.

 

Noch was: Auch Versicherungen setzen entsprechende Software ein, um Schadenmeldungen (ohne Fugen-"s") zu untersuchen. Wenn die Zahlen in einer Schadenmeldung nicht Benford-verteilt sind, dann hat sie sich möglicherweise jemand ausgedacht. Versicherungsbetrug!!!

 

Entsprechende Software für Versicherungen gibt es von Fair Isaac. Die Aktie (WKN 873369) habe ich kürzlich hier vorgestellt. Die machen auch Software für die Polizei, um vorherzusagen, in welchem Gebiet als nächstes eingebrochen wird ("predictive policing"). Der Aktienkurs hat korrigiert, erholt sich aber. Die 200-Tage-Linie bei ca. 248 Euro ist nicht in Gefahr. Ein guter Zeitpunkt, um einzusteigen.

 

nmh

 

Disclaimer: Ich habe leider kein scharfes ß auf meiner Schweizer Tastatur.

Gevatter_Tod
Experte ★★★
647 Beiträge

@nmh  schrieb:

Aha -- dachte ich's mir doch, daß @Gevatter_Tod   ... äääh ... keine Steuern bezahlt. Ich übrigens auch nicht.


Was du alles von mir denkst, @nmh; ich habe extra meine Steuer-ID gepostet (klick) und meine Unterlagen liegen sogar dem Orange Guy vor.*

 

Seitdem DU keine Steuern mehr zahlst, ist Ede "ähm" Stoiber irre geworden, der Södermarkus® hat sich an die Macht getrunken geputscht wählen lassen und Sachsen ist der wichtigste Freistaat Deutschlands geworden.

 

*) Wenn der Kongress die Trump'schen Steuerunterlagen erhält, würde ich mich als Abgeordneter fragen, warum Donald sie in der Sprache seiner Vorfahren ausstellt. Und dieser Tipp-Ex auf dem Papier... komisch

Chrissel
Mentor
950 Beiträge

Hahahaha nmh, dein neuer Rechner gibt dir anscheinend zuviel Zeit.

habe herrlich viel geschmunzelt beim Lesen des Beitrages und auch öfter mit dem Kopf geschüttelt. Aber auch hier wieder eine interessante Info versteckt, das Benford-Gesetz war mir neu. 😃
jetzt weiß ich endlich wie ich korrekt meine Versicherung verarschen kann! Jipiie

nmh
Legende
9.960 Beiträge

@Gevatter_Tod:

 

Ich bin gerührt, dass Du meine lieblos dahingerotzten Beiträge so genau liest und sogar an das ®-Symbol beim Södermarkus® gedacht hast. Jetzt neu: Der Öko-Södermarkus! Grün wie noch nie! Auf allgemeinen Wunsch hier nochmal sein Lichtbild:

 

der Södermarkus™der Södermarkus™

 

Schönen Abend an alle, die wo das hier lesen müssen

 

nmh

 

Disclaimer: Ich habe leider kein scharfes ß auf meiner Schweizer Tastatur.

nmh
Legende
9.960 Beiträge

@Gevatter_Tod:

 

Hochinteressant, diese Bachelor-Arbeit, vielen Dank für den Link.

 

nmh

 

Disclaimer: Ich habe leider kein scharfes ß auf meiner Schweizer Tastatur.

bullange
Autor ★
10 Beiträge

O.T.:

Stehe derzeit kurz vor der Bachelorthesis und bekomme wieder einmal gehörigen Respekt.

Noxx
Legende
7.051 Beiträge

nmh schrieb unter anderem:

...

 

Was bringt das jetzt? Mir bringt es in erster Linie Klickzahlen, weil Ihr meinen dümmlich-wichtigtuerisch-langweiligen Beitrag angeklickt habt.

...

_____________

*)  Bei der letzten Redaktionssitzung war das nmh-Team der Ansicht, dass die nmh-Beiträge in letzter Zeit lustlos und humorlos und blutlos äh blutleer geworden sind. Etwas mehr Humor sollte rein. Das habt Ihr jetzt davon: billigste Sparwitze.

 

Ich fand, das waren die wichtigsten Aussagen in dem Beitrag und natürlich die Bestätigung des Guru-Status, was man an 10 "Dankes" sieht.

 

Es ist wie bei Bhagwan, es war egal was der sagte, die Groupies klatschten immer, weil sie mit ihm ins Bett wollen

 

(:-)

stormbreaker
Autor ★
7 Beiträge

@nmh  schrieb:

 

Entsprechende Software für Versicherungen gibt es von Fair Isaac. Die Aktie (WKN 873369) habe ich kürzlich hier vorgestellt. Die machen auch Software für die Polizei, um vorherzusagen, in welchem Gebiet als nächstes eingebrochen wird ("predictive policing"). Der Aktienkurs hat korrigiert, erholt sich aber. Die 200-Tage-Linie bei ca. 248 Euro ist nicht in Gefahr. Ein guter Zeitpunkt, um einzusteigen.

 

nmh

 


Hallo nmh,

vielen Dank für Deine super Beiträge. Normalerweise bin ich nur stiller Mitleser, habe jetzt aber eine kleine Anfängerfrage.
Ich habe mir die oben genannte Aktie mal etwas genauer angesehen und, mangels eigenem Rechenzentrum, die GD200-Linie mit dem boerse.de Charttool anzeigen lassen. Jetzt ist mir aufgefallen, dass die GD200 bei L+S andere Werte anzeigt als bspw. Stuttgart oder auch den von Dir genanntem Wert. Leider fällt mir keine sinnvolle Erklärung dafür ein. Ist das ein Fehler von dem Tool oder gibt es einen anderen Grund?

Kannst du vielleicht sogar ein Chartanalysetool empfehlen?

 

grafik.png