Beispiele aus der Praxis für gängige Verteilungen

Ich bin ein Student, der ein Interesse für Statistik entwickelt. Ich mag das Material insgesamt, aber manchmal fällt es mir schwer, über Anwendungen im wirklichen Leben nachzudenken. Insbesondere geht es bei meiner Frage um häufig verwendete statistische Verteilungen (Normal – Beta-Gamma usw.). Ich denke, für einige Fälle bekomme ich die besonderen Eigenschaften, die die Verteilung sehr schön machen – zum Beispiel die memorylose Eigenschaft von Exponential. In vielen anderen Fällen habe ich jedoch keine Ahnung von der Bedeutung und den Anwendungsbereichen der gemeinsamen Verteilungen, die wir in Lehrbüchern sehen.

Es gibt wahrscheinlich viele gute Quellen, die sich mit meinen Bedenken befassen, ich Ich würde mich freuen, wenn Sie diese teilen könnten. Ich wäre viel motivierter für das Material, wenn ich es mit Beispielen aus der Praxis verknüpfen könnte.

Kommentare

  • Vierzehn Arten von Anwendungen, die einen weiten Bereich von Distributionen abdecken, werden unter “ Anwendungen “ auf der Hilfeseite für Mathematica ‚ s EstimatedDistribution -Funktion .

Antwort

Wikipedia hat eine Seite, auf der viele Wahrscheinlichkeitsverteilungen mit Links zu mehr Details zu jeder Distribution. Sie können die Liste durchsehen und den Links folgen, um ein besseres Gefühl für die Typen o zu bekommen f Anwendungen, für die die verschiedenen Verteilungen üblicherweise verwendet werden.

Denken Sie daran, dass diese Verteilungen zur Modellierung der Realität verwendet werden und wie Box sagte: „Alle Modelle sind falsch, einige Modelle sind nützlich“.

Hier sind einige der gängigen Verteilungen und einige der Gründe, warum sie nützlich sind:

Normal: Dies ist nützlich, um Mittelwerte und andere lineare Kombinationen zu betrachten (z Regressionskoeffizienten) aufgrund der CLT. Im Zusammenhang damit ist, wenn bekannt ist, dass etwas aufgrund additiver Wirkungen vieler verschiedener kleiner Ursachen entsteht, die Normalverteilung eine vernünftige Verteilung sein kann: Beispielsweise sind viele biologische Maßnahmen das Ergebnis mehrerer Gene und mehrerer Umweltfaktoren und daher häufig ungefähr normal .

Gamma: Rechts schief und nützlich für Dinge mit einem natürlichen Minimum bei 0. Wird häufig für verstrichene Zeiten und einige finanzielle Variablen verwendet.

Exponentiell: Sonderfall des Gammas. Es ist memorylos und lässt sich leicht skalieren.

Chi-Quadrat ($ \ chi ^ 2 $): Sonderfall des Gamma. Entsteht als Summe der quadratischen Normalvariablen (wird also für Varianzen verwendet).

Beta: Definiert zwischen 0 und 1 (kann aber auch zwischen anderen Werten transformiert werden), nützlich für Proportionen oder andere Größen, die zwischen liegen müssen 0 und 1.

Binomial: Wie viele „Erfolge“ aus einer bestimmten Anzahl unabhängiger Versuche mit derselben Wahrscheinlichkeit des „Erfolgs“.

Poisson: Häufig für Zählungen. Schöne Eigenschaften: Wenn die Anzahl der Ereignisse in einem Zeitraum oder Bereich einem Poisson folgt, folgt die Anzahl in der doppelten Zeit oder dem doppelten Bereich immer noch dem Poisson (mit dem doppelten Mittelwert): Dies funktioniert zum Hinzufügen von Poissons oder zum Skalieren mit anderen Werten als 2.

Beachten Sie, dass, wenn Ereignisse im Laufe der Zeit auftreten und die Zeit zwischen den Ereignissen einem Exponential folgt, die Anzahl, die in einem Zeitraum auftritt, einem Poisson folgt.

Negatives Binomial: Zählt mit Minimum 0 (oder ein anderer Wert, abhängig von der Version) und keine Obergrenze. Konzeptionell ist es die Anzahl der „Fehler“ vor k „Erfolgen“. Das negative Binom ist auch eine Mischung aus Poisson-Variablen, deren Mittelwerte aus einer Gammaverteilung stammen.

Geometrisch: Sonderfall für das negative Binom, bei dem es sich um die Anzahl der „Fehler“ vor dem ersten „Erfolg“ handelt. Wenn Sie eine Exponentialvariable abschneiden (abrunden), um sie diskret zu machen, ist das Ergebnis geometrisch.

Kommentare

  • Vielen Dank für Ihre Antwort. Wikipedia bietet jedoch eine allgemeinere Beschreibung, die mir ‚ gefallen würde. Grundsätzlich ist meine Frage, warum einige Distributionen nett sind? Um eine mögliche Antwort im Falle einer Normalverteilung zu geben, kann dies mit dem zentralen begrenzten Theorem zusammenhängen – das besagt, wenn Sie eine unendliche Anzahl von Beobachtungen abtasten, können Sie tatsächlich in Asympotik erkennen, dass eine ausreichende Statistik dieser Beobachtungen bei gegebener Unabhängigkeit eine Normalverteilung aufweist . Ich suche nach weiteren Beispielen wie diesen.
  • Nicht gerade eine echte Distribution, aber was ist mit bimodal? Ich kann ‚ an keine Beispiele aus dem wirklichen Leben denken, nachdem ich festgestellt habe, dass die vielen geschlechtsspezifischen Unterschiede beim Menschen nicht bimodal sind.
  • Multinomial hinzufügen

Antwort

Kaufen und lesen Sie mindestens die ersten 6 Kapitel (erste 218 Seiten) von William J. Feller “ Eine Einführung in die Wahrscheinlichkeitstheorie und ihre Anwendungen, Band 2 „ http://www.amazon.com/dp/0471257095/ref=rdr_ext_tmb .Lesen Sie mindestens alle Probleme zur Lösung und versuchen Sie vorzugsweise, so viele wie möglich zu lösen. Sie müssen Band 1 nicht gelesen haben, was meiner Meinung nach nicht besonders verdienstvoll ist.

Obwohl der Autor vor 45 1/2 Jahren gestorben ist, bevor das Buch überhaupt fertig war, ist dies einfach das Das beste Buch gibt es, abgesehen von keinem, um eine Intuition in Wahrscheinlichkeits- und stochastischen Prozessen zu entwickeln und ein Gefühl für verschiedene Verteilungen zu verstehen und zu entwickeln, wie sie sich auf Phänomene der realen Welt und verschiedene stochastische Phänomene beziehen, die auftreten können und auch. Und mit dem Festkörper Fundament, das Sie daraus aufbauen, Sie werden in der Statistik gut bedient sein.

Wenn Sie es durch nachfolgende Kapitel schaffen, was etwas schwieriger wird, sind Sie fast allen Lichtjahre voraus. Einfach ausgedrückt: Wenn Sie Feller Vol 2 kennen, kennen Sie die Wahrscheinlichkeit (und die stochastischen Prozesse), was bedeutet, dass Sie alles, was Sie nicht wissen, wie z. B. neue Entwicklungen, schnell erlernen und beherrschen können, indem Sie auf diesem soliden Fundament aufbauen.

Fast alles, was zuvor in diesem Thread erwähnt wurde, ist in Feller Vol 2 (nicht das gesamte Material in Kendall Advanced Theory of Statistics, aber das Lesen dieses Buches wird nach Feller Vol 2 ein Kinderspiel sein) und vieles mehr auf eine Weise, die Ihr stochastisches Denken entwickeln sollte und Intuition. Johnson und Kotz sind gut für Kleinigkeiten bei verschiedenen Wahrscheinlichkeitsverteilungen. Feller Vol. 2 ist nützlich, um zu lernen, wie man probabilistisch denkt und was man aus Johnson und Kotz extrahiert und wie man es verwendet.

Antwort

Die asymptotische Theorie führt zur Normalverteilung, den Extremwerttypen, den stabilen Gesetzen und dem Poisson. Das Exponential und das Weibull treten tendenziell als parametrische Zeit für Ereignisverteilungen auf. Beim Weibull handelt es sich um einen Extremwerttyp für das Minimum einer Stichprobe. In Bezug auf die parametrischen Modelle für normalverteilte Beobachtungen ergeben sich die Chi-Quadrat-, t- und F-Verteilungen beim Testen von Hypothesen und bei der Schätzung des Konfidenzintervalls. Zur Untersuchung der Testkraft haben wir die nichtzentralen t- und F-Verteilungen. Die hypergeometrische Verteilung ergibt sich aus Fischers genauem Test für Kontingenztabellen. Die Binomialverteilung ist wichtig, wenn Experimente zur Schätzung der Proportionen durchgeführt werden. Das negative Binomial ist eine wichtige Verteilung, um die Überdispersion in einem Punktprozess zu modellieren. Dies sollte Ihnen einen guten Einstieg in die Praxis ermöglichen parametrische Verteilungen. Für nichtnegative Zufallsvariablen auf (0, ∞) ist die Gamma-Verteilung flexibel, um eine Vielzahl von Formen bereitzustellen, und die logarithmische Normalen werden ebenfalls häufig verwendet. Auf [0,1] liefert die Beta-Familie symmetrische Verteilungen, einschließlich der Uniform Als Verteilungen nach links oder rechts verzerrt.

Ich sollte auch erwähnen, dass es die klassischen Buchreihen von Johnson und Kotz gibt, die diskrete Verteilungen enthalten, wenn Sie alle wichtigen Details zu Verteilungen in der Statistik wissen möchten. kontinuierliche univariate Verteilungen und kontinuierliche multivariate Verteilungen sowie Band 1 der Advanced Theory of Statistics von Kendall und Stuart.

Kommentare

  • Vielen Dank für die Antwort, dies ist äußerst nützlich. Nochmals vielen Dank, es hat mir wirklich geholfen.

Antwort

Nur um die anderen hervorragenden Antworten zu ergänzen.

Die Poisson-Verteilung ist nützlich, wenn wir Zählvariablen haben, wie andere erwähnt haben. Aber es sollte noch viel mehr gesagt werden! Das Poisson entsteht asymptotisch aus einer binomial verteilten Variablen, wenn $ n $ (die Anzahl der Bernoulli-Experimente) grenzenlos zunimmt und $ p $ (die Erfolgswahrscheinlichkeit jedes einzelnen Experiments () so auf Null geht, dass $ \ lambda = np $ bleibt konstant, von Null und unendlich begrenzt. Dies zeigt uns, dass es nützlich ist, wenn wir eine große Anzahl von individuell sehr unwahrscheinlichen Ereignissen haben. Einige gute Beispiele sind: Unfälle, wie die Anzahl der Autounfälle in New York in ein Tag, da jedes Mal, wenn zwei Autos vorbeifahren / sich treffen, die Wahrscheinlichkeit eines Absturzes sehr gering ist und die Anzahl solcher Gelegenheiten tatsächlich astronomisch ist! Jetzt können Sie selbst über andere Beispiele nachdenken, wie beispielsweise die Gesamtzahl der Flugzeugabstürze in der Welt in einem Jahr. Das klassische Beispiel, bei dem die Anzahl der Todesfälle durch Tritte in der preußischen Kavallerie!

Wenn der Poisson in der Epidemiologie zur Modellierung der Anzahl von Krankheitsfällen verwendet wird, findet man ihn oft nicht passend gut: Die Varianz ist auch groß! Das Poisson hat Varianz = Mittelwert, was leicht an der Grenze des Binomials zu erkennen ist: Im Binomial ist die Varianz $ np (1-p) $, und wenn $ p $ auf Null geht, geht $ 1-p $ notwendigerweise auf Eins, Die Varianz geht also zu $ np $, was die Erwartung ist, und beide gehen zu $ \ lambda $.Eine Möglichkeit besteht darin, nach einer Alternative zum Poisson mit größerer Varianz zu suchen, die nicht dem Mittelwert entspricht, wie z. B. dem negativen Binomial. ¿Aber warum tritt dieses Phänomen größerer Varianz auf? Eine Möglichkeit besteht darin, dass die individuellen Krankheitswahrscheinlichkeiten $ p $ für eine Person nicht konstant sind und auch nicht von einer beobachteten Kovariate abhängen (z. B. Alter, Beruf, Raucherstatus, …). Dies wird als unbeobachtete Heterogenität bezeichnet und manchmal als verwendete Modelle denn es heißt Gebrechlichkeitsmodelle oder gemischte Modelle. Eine Möglichkeit, dies zu tun, besteht darin, anzunehmen, dass die $ p $ in der Population aus einer bestimmten Verteilung stammen, und unter der Annahme, dass es sich beispielsweise um eine Gammaverteilung handelt (was die Mathematik vereinfacht …), erhalten wir die Gamma-Poisson-Verteilung – – das das negative Binomial wiederherstellt!

Antwort

Kürzlich veröffentlichte Forschung legt nahe, dass die menschliche Leistung entgegen allgemeiner Meinung NICHT normal verteilt ist. Daten aus vier Bereichen wurden analysiert: (1) Akademiker in 50 Disziplinen, basierend auf der Veröffentlichungshäufigkeit in den wichtigsten fachspezifischen Fachzeitschriften. (2) ) Entertainer wie Schauspieler, Musiker und Schriftsteller sowie die Anzahl der prestigeträchtigen Auszeichnungen, Nominierungen oder Auszeichnungen. (3) Politiker in 10 Nationen und Wahl- / Wiederwahlergebnisse. (4) College- und Profisportler, die sich die individuellsten ansehen verfügbare Maßnahmen, wie die Anzahl der Heimläufe, Empfänge in Mannschaftssportarten und Gesamtsiege in Einzelpersonen Häfen. Der Autor schreibt: „Wir haben in jeder Studie eine klare und konsistente Verteilung des Potenzgesetzes gesehen, unabhängig davon, wie eng oder breit wir die Daten analysiert haben …“

Kommentare

  • Wer hat vorgeschlagen, dass die menschliche Leistung normal verteilt ist?! Das 80-20-Prinzip wurde von Pareto (1906!) Vorgeschlagen.

Antwort

Cauchy-Verteilung wird häufig verwendet in der Finanzierung zur Modellierung von Vermögensrenditen. Bemerkenswert sind auch Johnsons Bounded- und Unbounded-Verteilungen aufgrund ihrer Flexibilität (ich habe sie bei der Modellierung von Vermögenspreisen, Stromerzeugung und Hydrologie angewendet).

Antwort

Einige häufige Wahrscheinlichkeitsverteilungen

Einige häufige Wahrscheinlichkeitsverteilungen; Von hier

Gleichmäßige Verteilung (diskret) – Sie haben 1 Würfel gewürfelt und die Wahrscheinlichkeit, 1, 2, 3, 4, 5 und 6 zu fallen, ist gleich.

Uniform discrete (von hier )

Gleichmäßige Verteilung (kontinuierlich) – Sie haben etwas sehr feines Pulver gegen eine Wand gesprüht. Für einen kleinen Bereich an der Wand ist die Wahrscheinlichkeit, dass Staub auf eine Stelle an der Wand fällt, gleichmäßig.

Sie haben eine große Gasflasche. Für jede Flächeneinheit scheint die Anzahl der Gasmoleküle, die pro Quadratzentimeter pro Sekunde auf die Innenwand treffen, gleichmäßig zu sein.

Wikipedia-Bild zur Gaskollision von hier

Bernoulli-Verteilung – Der Bernoulli-Versuch ist (oder ein Binomialversuch) ein zufälliges Experiment mit genau zwei möglichen Ergebnissen, “ Erfolg “ und “ Fehler „. In einem solchen Versuch beträgt die Erfolgswahrscheinlichkeit p, die Ausfallwahrscheinlichkeit q = 1-p.

Zum Beispiel können wir bei einem Münzwurf zwei Ergebnisse haben: Kopf oder Schwanz. Für eine faire Münze beträgt die Wahrscheinlichkeit eines Kopfes 1/2; Die Wahrscheinlichkeit eines Schwanzes beträgt 1/2. Dies ist eine Art von Bernoulli-Verteilung, die ebenfalls gleichmäßig ist.

Wenn die Münze bei einem Münzwurf unfair ist, wie z. B. die Wahrscheinlichkeit, den Kopf zu bekommen, beträgt die Wahrscheinlichkeit, einen Schwanz zu fallen, 0,9 wird 0,1 sein.

Bernauli Bernauli-Verteilung mit Wahrscheinlichkeiten 0,6 und 0,4; von hier

Binomialverteilung – Wenn ein Bernoulli-Versuch (mit 2 Ergebnissen bzw. mit Wahrscheinlichkeiten p und q = 1-p) n-mal durchgeführt wird; (zum Beispiel, wenn eine Münze n Mal geworfen wird); Es wird eine kleine Wahrscheinlichkeit geben, alle Köpfe zu bekommen, und es wird eine kleine Wahrscheinlichkeit geben, alle Schwänze zu bekommen. Ein bestimmter Wert des Kopfes und ein bestimmter Wert des Schwanzes wären maximal. Diese Verteilung wird als Binomialverteilung bezeichnet.

BINOMIAL Binomialverteilung mit Schachbrett.Bild geändert von WP

Poissons Verteilung Beispiel aus Wikipedia: Eine Person, die die Menge an E-Mails verfolgt, die sie jeden Tag erhält, kann feststellen, dass sie durchschnittlich 4 Briefe pro Tag erhalten. Wenn die E-Mails aus unabhängigen Quellen stammen Dann entspricht die Anzahl der an einem Tag empfangenen Poststücke einer Poisson-Verteilung. Das heißt, es besteht eine vernachlässigbare Chance, null oder 100 Post pro Tag zu erhalten, jedoch maximal eine bestimmte Anzahl (hier 4) Post pro Tag.

Ähnlich: Nehmen wir an, auf einer imaginären Wiese erhalten wir ungefähr 10 Kieselsteine in 1 km². Mit proportional mehr Fläche erhalten wir proportional mehr Kieselsteine. Für eine bestimmte Probe von 1 km² ist es jedoch sehr unwahrscheinlich, dass 0 oder 100 Kieselsteine erhalten werden. wahrscheinlich folgt es einer Poisson-Verteilung.

Laut Wikipedia folgt die Anzahl der Zerfallsereignisse pro Sekunde aus einer radioaktiven Quelle der Verteilung eines Poisson.

Poisson Poissons Verteilung aus Wikipedia

Normalverteilung oder Gaußsche Verteilung – wenn n Anzahl Würfel gleichzeitig gewürfelt werden und vorausgesetzt, dass n sehr groß ist; Die Summe der Ergebnisse jedes Würfels würde sich tendenziell um einen zentralen Wert gruppieren. Nicht zu groß, nicht zu klein. Diese Verteilung wird als Normalverteilung oder glockenförmige Kurve bezeichnet.

dreieckige Summe von 2 Dies, von hier

CLT
Mit zunehmender Anzahl gleichzeitiger Chips nähert sich die Verteilung Gauß. Aus zentraler Grenzwertsatz

Wenn n Anzahl von Münzen gleichzeitig geworfen wird und n sehr groß ist, besteht für uns eine kleine Chance wird zu vielen Köpfen oder zu vielen Schwänzen bekommen. Die Anzahl der Köpfe wird um einen bestimmten Wert zentriert. Das ist ähnlich wie bei der Binomialverteilung, aber die Anzahl der Münzen ist noch größer.

Kommentare

  • Bitte erwähnen Sie, ob bei meinen obigen Bemühungen ein Missverständnis vorliegt, weil Ich habe Angst vor der Komplexität der Statistiken.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.