Logarithmische Verteilung. Siehe Seiten, auf denen der Begriff Log-Normalverteilung erwähnt wird

Abschnitte der Website

Wahl des Herausgebers:

So entfernen Sie Avast vollständig. Programm zum Entfernen von Avast
Aliexpress-Mobilanwendung
QWERTY- und AZERTY-Tastaturlayout Spezielle Versionen der Dvorak-Tastatur
Insel Sao Vicente Insel Sao Vicente
Die Regeln, die wir brechen. Ist es in Ordnung, die Ellbogen auf den Tisch zu legen?
Welche USB-Sticks sind die zuverlässigsten und schnellsten?
Anschließen eines Laptops an einen Fernseher über ein USB-Kabel zum Anschließen eines Laptops an einen VGA-Fernseher
Änderung der Steam-Oberfläche – von einfachen Bildern bis zur gesamten Darstellung auf dem Bildschirm Neues Steam-Design
So kündigen Sie ein Megogo-Abonnement im Fernsehen: detaillierte Anleitung So kündigen Sie Megogo-Abonnements
So partitionieren Sie eine Festplatte mit installiertem Windows, ohne Daten zu verlieren. Partitionieren Sie die Festplatte 7

Die Zufallsvariable Y hat einen Logarithmus Normalverteilung mit den Parametern μ und σ, wenn die Zufallsvariable X = lnY eine Normalverteilung mit den gleichen Parametern μ und σ hat. Wenn wir die Art der Beziehung zwischen den Variablen X und Y kennen, können wir leicht einen Wahrscheinlichkeitsdichtegraphen einer Zufallsvariablen mit einer Lognormalverteilung erstellen (Abbildung 4.2).

Abbildung 4.2 – Dichtekurven der Lognormalverteilung für verschiedene Werte der Parameter μ und σ

Wenn eine Zufallsvariable X eine What, die durch Formel (4.6) definiert ist, und wenn X = lnY, dann:

Wo gilt für y > 0:

Aus der Definition folgt, dass eine Zufallsvariable, die einer Lognormalverteilung unterliegt, nur positive Werte annehmen kann. Wie in Abbildung 4.2 dargestellt, weisen die Kurven der Funktion f(y) eine linksseitige Asymmetrie auf, die umso stärker ist, je größer die Werte der Parameter μ und σ sind. Jede Kurve hat ein Maximum und ist für alle positiven Werte von y definiert.

Die Berechnung des mathematischen Erwartungswerts und der Varianz einer Zufallsvariablen mit einer Lognormalverteilung ist nicht besonders schwierig:

Durch Substitutionen und Einführung neuer Variablen in den Integralen 4.15 und 4.16 erhalten wir:

Um die Wahrscheinlichkeit zu berechnen, dass eine Zufallsvariable Y mit einer logarithmischen Normalverteilung und der Dichte f(y, μ, σ) einen Wert im Intervall (a, b) annimmt, sollte man im Allgemeinen das Integral nehmen:

In der Praxis ist es jedoch bequemer, die Tatsache zu nutzen, dass der Logarithmus der Zufallsvariablen Y eine Normalverteilung hat. Die Wahrscheinlichkeit, dass a ≤ Y ≤ b, entspricht der Wahrscheinlichkeit, dass
lna ≤ lnY ≤ lnb.

Berechnen wir die Wahrscheinlichkeit, dass eine Zufallsvariable mit einer logarithmischen Verteilung μ = 1, σ = 0,5 einen Wert im Intervall (2, 5) annimmt. Wir haben:

Aus den Logarithmentabellen finden wir ln2 = 0,6932 und ln5 = 1,6094.

Wenn wir lnY = X bezeichnen, können wir schreiben:

Darüber hinaus unterliegt die Zufallsvariable X einer Normalverteilung mit einem Mittelwert μ = 1 und einer Standardabweichung σ = 0,5. Nun lässt sich die gewünschte Wahrscheinlichkeit einfach aus den Tabellen der Integralfunktion der Normalverteilung berechnen:

Fragen zur Selbstkontrolle

1 Definition der Rechteckverteilung.

2 Weiner Zufallsvariablen mit Rechteckverteilung

3 Grundlegende Bedeutung der Rechteckverteilung.

4 Erwartung und die Varianz einer Zufallsvariablen in einer Rechteckverteilung.

5 Die Rolle der Normalverteilung in der mathematischen Statistik.

6 Was ist die Normalverteilung und wie hängt sie mit dem Binomial zusammen?

7 Weiner Zufallsvariablen mit Normalverteilung.

8 Welche statistischen Parameter können zur Definition einer Normalverteilung verwendet werden?

9 Warum ist die Normalverteilung stetig?

10 Gleichung einer Normalkurve.

11 Was ist eine normalisierte Abweichung?

12 Gleichung der Normalverteilungskurve in normalisierter Form.

13 Welche Werte von μ und σ charakterisieren eine Normalpopulation in normalisierter Form?

14 Welcher Anteil der Probendaten liegt innerhalb der Grenzen von ±1σ, ±2σ, ±3σ?

15 Was zeigt die Tabelle des Normalwahrscheinlichkeitsintegrals?

16 Gleichung einer Lognormalkurve.

17 Weiner Zufallsvariablen mit einer Lognormalverteilung.

18 Welche Transformationen müssen durchgeführt werden, um aus einer Lognormalverteilung eine Normalverteilung zu erhalten?

19 Welche statistischen Parameter definieren eine Lognormalverteilung?

THEMA 5 Verteilungen von Stichprobenparametern

5,1 t – Studentenverteilung

5.2 Fisher-Snedecor-F-Verteilung

5.3 χ 2 – Verteilung

5,1 t – Studentenverteilung

Das Gesetz der Normalverteilung tritt auf, wenn die Anzahl der Merkmale n > 20–30 ist. Der Experimentator führt jedoch häufig eine begrenzte Anzahl von Messungen durch und stützt seine Schlussfolgerungen auf kleine Proben. Bei einer geringen Anzahl von Beobachtungen liegen die Ergebnisse in der Regel nahe beieinander und große Abweichungen treten selten auf. Dies lässt sich leicht mit dem Gesetz der Normalverteilung erklären, wonach die Wahrscheinlichkeit kleiner Abweichungen größer ist als die Wahrscheinlichkeit großer Abweichungen. Somit beträgt die Wahrscheinlichkeit von Abweichungen, die ±2σ in absoluten Werten überschreiten, 0,05, oder ein Fall pro 20 Messungen, und Abweichungen von ± 3σ – 0,01, oder ein Fall pro 100.

Wenn der Feldversuch beispielsweise in 4–6 Wiederholungen durchgeführt wird, ist es selbstverständlich, dass es keine allzu großen Abweichungen zwischen den Ertragswerten auf Parallelparzellen geben wird. Daher ist die aus einer kleinen Stichprobe berechnete Standardabweichung s in den meisten Fällen geringer als die der gesamten Grundgesamtheit. Daher können Sie sich in diesen Fällen bei Ihren Schlussfolgerungen nicht auf Normalverteilungskriterien verlassen.

Seit Beginn des 20. Jahrhunderts begann sich in der mathematischen Statistik eine neue Richtung zu entwickeln, die als Statistik kleiner Stichproben bezeichnet werden kann. Von größter praktischer Bedeutung für experimentelle Arbeiten war die 1908 vom englischen Statistiker und Chemiker W. Gosset entdeckte t-Verteilung, die als Student-Verteilung (englisch Student-Student, Pseudonym von W. Gosset) bezeichnet wurde.

Die Student-t-Verteilung für Stichprobenmittelwerte wird durch die Gleichung bestimmt:

Der Zähler der Formel bedeutet die Abweichung des Stichprobenmittelwerts vom Mittelwert der gesamten Grundgesamtheit und der Nenner:

– ist ein Indikator, der den Standardfehler der durchschnittlichen Stichprobenpopulation schätzt.

Somit wird der Wert von t anhand der Abweichung des Stichprobenmittelwerts vom Grundgesamtheitsmittelwert gemessen, ausgedrückt in Anteilen des Stichprobenfehlers, angenommen als Einheit.

Die Häufigkeitsmaxima der Normal- und T-Verteilung fallen zusammen, die Form der T-Verteilungskurve hängt jedoch vollständig von der Anzahl der Freiheitsgrade ab. Bei sehr kleinen Werten der Freiheitsgrade nimmt es die Form einer Kurve mit flacher Spitze an, und die durch die Kurve begrenzte Fläche ist größer als bei einer Normalverteilung und mit zunehmender Anzahl von Beobachtungen (n > 30), nähert sich die t-Verteilung der Normalverteilung und geht bei n = ∞ in diese über.

Abbildung 1.1 zeigt die Differential- und Integralverteilung von t-Student bei 10 Freiheitsgraden.

Abbildung 5.1 – Differential- (links) und integrale (rechts) t-Student-Verteilung

Die t-Student-Verteilung ist wichtig, wenn Sie mit kleinen Stichproben arbeiten: Sie ermöglicht die Bestimmung eines Konfidenzintervalls, das den Mittelwert der Grundgesamtheit abdeckt , und testen Sie die eine oder andere Hypothese bezüglich der Allgemeinbevölkerung. In diesem Fall ist es nicht erforderlich, die Parameter der Grundgesamtheit zu kennen Und , reicht es aus, ihre Schätzungen μ und σ für eine bestimmte Stichprobengröße n zu haben.

5.1.1 Behrens-Fisher-Problem

Das Testen der Hypothese über die allgemeinen Mittelwerte zweier Gruppen mit Normalverteilung und ungleichen Varianzen in der mathematischen Statistik wird als Behrens-Fisher-Problem bezeichnet und hat derzeit nur Näherungslösungen. Warum ist die Forderung nach Varianzgleichheit in verglichenen Gruppen so wichtig? Ohne näher auf dieses Problem einzugehen, stellen wir fest, dass die Verteilung des „berechneten T-Tests“ umso stärker von der Verteilung des „Student-T-Tests“ abweicht, je stärker sich die Varianzen und Stichprobengrößen voneinander unterscheiden. In diesem Fall haben sowohl das t-Kriterium selbst als auch ein Parameter dieser Verteilungen wie die Anzahl der Freiheitsgrade unterschiedliche Werte. Die Anzahl der Freiheitsgrade wiederum beeinflusst den Wert des erreichten (kritischen) Signifikanzniveaus (S< ...) определяемого для вычисленного значения t-критерия.

Die Vernachlässigung der oben genannten Bedingungen für die Zulässigkeit der Verwendung des Student-T-Tests durch Forscher führt zu einer erheblichen Verzerrung der Ergebnisse der Prüfung von Hypothesen über die Gleichheit der Mittelwerte. Daher gibt es in Arbeiten, in denen die Prüfung von Hypothesen über die Gleichheit zweier Mittelwerte mit dem Student-t-Test durchgeführt wurde und die Kriterien für die Prüfung der Normalverteilung und der Varianzgleichheit nicht erwähnt werden, Grund zu der Annahme, dass dies der Fall ist Die Autoren haben dieses Kriterium falsch verwendet und daher sind ihre erklärten Schlussfolgerungen zweifelhaft.

Andere häufiger Fehler– Anwendung des Student-t-Tests, um Hypothesen über die Gleichheit von drei oder mehr Gruppenmittelwerten zu testen. In diesem Fall ist es notwendig, das sogenannte allgemeine lineare Modell anzuwenden, das im Verfahren der einseitigen Varianzanalyse mit festen Effekten implementiert ist.

Schauen wir uns die Funktionen des Student-T-Tests genauer an. Der t-Test wird am häufigsten in zwei Fällen verwendet. Im ersten Fall wird es verwendet, um die Hypothese über die Gleichheit der allgemeinen Mittelwerte zweier unabhängiger, nicht zusammenhängender Stichproben zu testen (der sogenannte Zwei-Stichproben-t-Test). Dabei gibt es eine Kontrollgruppe und eine Versuchsgruppe, bestehend aus unterschiedlichen Objekten, deren Anzahl in Gruppen unterschiedlich sein kann. Im zweiten Fall wird der sogenannte gepaarte t-Test verwendet, bei dem dieselbe Gruppe von Objekten numerisches Material generiert, um Hypothesen über Durchschnittswerte zu testen. Daher werden diese Stichproben als abhängig, verwandt bezeichnet. Beispielsweise wird die Anzahl der weißen Blutkörperchen bei gesunden Tieren und dann bei denselben Tieren nach einer bestimmten Strahlendosis gemessen. In beiden Fällen muss die Anforderung der Normalverteilung des untersuchten Merkmals in jeder der verglichenen Gruppen erfüllt sein. Die Dominanz des Student-t-Tests in der überwiegenden Mehrheit der Arbeiten spiegelt zwei wichtige Aspekte wider.

Zweitens deutet dies auch darauf hin, dass diese Autoren keine Alternativen zu diesem Kriterium kennen oder diese nicht selbst anwenden können. Man kann ohne Übertreibung sagen, dass die gedankenlose Verwendung des Student-t-Tests in den meisten biologischen Arbeiten derzeit mehr schadet als nützt.

5.2 Fisher-Snedecor-F-Verteilung

Nehmen wir zwei unabhängige Stichproben der Größe n 1 und n 2 aus einer normalverteilten Grundgesamtheit und berechnen die Varianzen Und mit Freiheitsgraden ν 1 = n –1 und ν 2 = n 2 –1, dann lässt sich das Varianzverhältnis bestimmen:

Das Verhältnis der Varianzen wird so gewählt, dass es eine große Varianz im Zähler gibt und daher F ≥ 1 ist.

Die Verteilung von F hängt nur von der Anzahl der Freiheitsgrade ν 1 und ν 2 ab (das Gesetz der F-Verteilung wurde von R. A. Fisher entdeckt). Wenn zwei verglichene Stichproben zufällig unabhängig von der Gesamtbevölkerung mit einem allgemeinen Durchschnitt sind, wird der tatsächliche Wert von F bestimmte Grenzen nicht überschreiten und den theoretischen Wert des Kriteriums F nicht überschreiten, das für die Daten ν 1 und ν 2 kritisch ist (F Tatsache< F теор). Если генеральные параметры сравниваемых групп различны, то F факт >F-Theor. Theoretische F-Werte für die Signifikanzniveaus 5 % und 1 % sind in der Tabelle angegeben, wobei nur die richtigen kritischen Punkte für F ≥ 1 aufgeführt sind, da es immer üblich ist, das Verhältnis der größeren Varianz zur kleineren zu ermitteln .

Die aus der Verteilungsfunktion erhaltenen Kurven für alle möglichen Werte von F, insbesondere bei einer kleinen Anzahl von Beobachtungen, haben eine asymmetrische Form – einen langen „Schwanz“ großer Werte und eine große Konzentration kleiner F-Werte ( Abbildung 5.2).

Abbildung 5.2 – Differential (links) und Integral (rechts)
Fisher-Snedecor-F-Verteilung

Beachten Sie, dass die Student-t-Verteilung ein Sonderfall der F-Verteilung mit der Anzahl der Freiheitsgrade ν 1 = 1 und ν 2 = ν ist, d. h. gleich der Anzahl der Freiheitsgrade für die t-Verteilung. In diesem Fall wird der folgende Zusammenhang zwischen F und t beobachtet:

5.3 χ 2 – Verteilung

Viele tatsächliche Verteilungen entsprechen theoretischen Verteilungsmodellen (Normal-, Binomial-, Poisson-Verteilungen). In der Praxis gibt es jedoch Verteilungen, die stark von der Normalverteilung abweichen. Um den Grad der Diskrepanz bzw. den Grad der Übereinstimmung zwischen den Zahlen tatsächlicher und theoretischer Verteilungen zu beurteilen, werden statistische Übereinstimmungskriterien eingeführt, beispielsweise das χ 2-Kriterium. Dieses Kriterium wird zur Lösung von Problemen verwendet statistische Analyse, zum Beispiel, um Hypothesen zu testen: über die Unabhängigkeit zweier Prinzipien, die der Gruppierung von Beobachtungsergebnissen aus einer Population zugrunde liegen; über die Homogenität von Gruppen im Hinblick auf bestimmte identifizierbare Merkmale; zur Übereinstimmung zwischen den theoretischen und experimentellen Häufigkeitskurven. Das χ 2 -Kriterium kann sowohl als Übereinstimmungskriterium als auch als Unabhängigkeitskriterium, als Homogenitätskriterium bezeichnet werden. Das Verteilungsgesetz χ 2 (Chi-Quadrat) wurde von K. Pearson entdeckt. Aus der Chi-Quadrat-Funktion erhaltene Verteilungskurve:

Dabei sind f die tatsächlichen und F die theoretischen Häufigkeiten der Anzahl der Probenobjekte. Sein Aussehen hängt stark von der Anzahl der Freiheitsgrade ab. Für eine kleine Anzahl von Freiheitsgraden ν ist die Kurve asymmetrisch (Abbildung 5.3), aber wenn ν zunimmt, nimmt die Asymmetrie ab und bei ν = ∞ wird die Kurve zur normalen Gaußschen Kurve.

Die χ 2 -Verteilung sowie die t-Verteilung sind ein Sonderfall
F – Verteilungen für ν 1 = ν und ν 2 = ∞.

Abbildung 5.3 – Differential (links) und Integral (rechts)
χ 2 – Verteilung

Fragen zur Selbstkontrolle

1 In welchen Fällen ist die Verwendung der Student-t-Verteilung der Normalverteilung vorzuziehen?

2 Welche Mengen müssen geschätzt werden, um die Student-t-Verteilung zu verwenden?

3 Was ist der Kern des Behrens-Fisher-Problems?

4 Wie wird die F-Verteilung für zwei numerisch ausgedrückt? unabhängige Stichproben aus dem Gesamtsatz der Variablen?

5 Von welchen charakteristischen Werten von Zufallsvariablen hängt die F-Verteilung ab?

6 Welche Fragen kann der Wert des χ 2 -Kriteriums bei der statistischen Verarbeitung experimenteller Daten beantworten?

THEMA 6 Grundlagen der mathematischen Statistik

6.1 Durchschnittswerte

6.2 Arithmetisches Mittel

6.3 Geometrisches Mittel

6.4 Harmonisches Mittel

Die Zufallsvariable Y hat eine Lognormalverteilung mit den Parametern μ und σ, wenn die Zufallsvariable X = lnY eine Normalverteilung mit den gleichen Parametern μ und σ hat. Wenn wir die Art der Beziehung zwischen den Variablen X und Y kennen, können wir leicht einen Wahrscheinlichkeitsdichtegraphen einer Zufallsvariablen mit einer Lognormalverteilung erstellen (Abbildung 4.2).

Abbildung 4.2 – Dichtekurven der Lognormalverteilung für verschiedene Werte der Parameter μ und σ

Wenn eine Zufallsvariable X eine What, die durch Formel (4.6) definiert ist, und wenn X = lnY, dann:

Wo gilt für y > 0:

Die Berechnung des mathematischen Erwartungswerts und der Varianz einer Zufallsvariablen mit einer Lognormalverteilung ist nicht besonders schwierig:

Durch Substitutionen und Einführung neuer Variablen in den Integralen 4.15 und 4.16 erhalten wir:

Berechnen wir die Wahrscheinlichkeit, dass eine Zufallsvariable mit einer logarithmischen Verteilung μ = 1, σ = 0,5 einen Wert im Intervall (2, 5) annimmt. Wir haben:

Aus den Logarithmentabellen finden wir ln2 = 0,6932 und ln5 = 1,6094.

Wenn wir lnY = X bezeichnen, können wir schreiben:

Fragen zur Selbstkontrolle

1 Definition der Rechteckverteilung.

2 Weiner Zufallsvariablen mit Rechteckverteilung

3 Grundlegende Bedeutung der Rechteckverteilung.

4 Erwartungswert und Varianz einer Zufallsvariablen in einer Rechteckverteilung.

5 Die Rolle der Normalverteilung in der mathematischen Statistik.

6 Was ist die Normalverteilung und wie hängt sie mit dem Binomial zusammen?

7 Weiner Zufallsvariablen mit Normalverteilung.

8 Welche statistischen Parameter können zur Definition einer Normalverteilung verwendet werden?

9 Warum ist die Normalverteilung stetig?

10 Gleichung einer Normalkurve.

11 Was ist eine normalisierte Abweichung?

12 Gleichung der Normalverteilungskurve in normalisierter Form.

13 Welche Werte von μ und σ charakterisieren eine Normalpopulation in normalisierter Form?

14 Welcher Anteil der Probendaten liegt innerhalb der Grenzen von ±1σ, ±2σ, ±3σ?

15 Was zeigt die Tabelle des Normalwahrscheinlichkeitsintegrals?

16 Gleichung einer Lognormalkurve.

17 Weiner Zufallsvariablen mit einer Lognormalverteilung.

18 Welche Transformationen müssen durchgeführt werden, um aus einer Lognormalverteilung eine Normalverteilung zu erhalten?

19 Welche statistischen Parameter definieren eine Lognormalverteilung?

THEMA 5 Verteilungen von Stichprobenparametern

5,1 t – Studentenverteilung

5.2 Fisher-Snedecor-F-Verteilung

5.3 χ 2 – Verteilung

5,1 t – Studentenverteilung

Die Student-t-Verteilung für Stichprobenmittelwerte wird durch die Gleichung bestimmt:

Der Zähler der Formel bedeutet die Abweichung des Stichprobenmittelwerts vom Mittelwert der gesamten Grundgesamtheit und der Nenner:

– ist ein Indikator, der den Standardfehler der durchschnittlichen Stichprobenpopulation schätzt.

Somit wird der Wert von t anhand der Abweichung des Stichprobenmittelwerts vom Grundgesamtheitsmittelwert gemessen, ausgedrückt in Anteilen des Stichprobenfehlers, angenommen als Einheit.

Abbildung 1.1 zeigt die Differential- und Integralverteilung von t-Student bei 10 Freiheitsgraden.

Abbildung 5.1 – Differential- (links) und integrale (rechts) t-Student-Verteilung

5.1.1 Behrens-Fisher-Problem

Ein weiterer häufiger Fehler ist die Verwendung des Student-t-Tests zum Testen von Hypothesen über die Gleichheit von drei oder mehr Gruppenmittelwerten. In diesem Fall ist es notwendig, das sogenannte allgemeine lineare Modell anzuwenden, das im Verfahren der einseitigen Varianzanalyse mit festen Effekten implementiert ist.

5.2 Fisher-Snedecor-F-Verteilung

Das Verhältnis der Varianzen wird so gewählt, dass es eine große Varianz im Zähler gibt und daher F ≥ 1 ist.

Abbildung 5.2 – Differential (links) und Integral (rechts)
Fisher-Snedecor-F-Verteilung

5.3 χ 2 – Verteilung

Viele tatsächliche Verteilungen entsprechen theoretischen Verteilungsmodellen (Normalverteilung, Binomialverteilung, Poissonverteilung). In der Praxis gibt es jedoch Verteilungen, die stark von der Normalverteilung abweichen. Um den Grad der Diskrepanz bzw. den Grad der Übereinstimmung zwischen den Zahlen tatsächlicher und theoretischer Verteilungen zu beurteilen, werden statistische Übereinstimmungskriterien eingeführt, beispielsweise das χ 2-Kriterium. Dieses Kriterium wird verwendet, um Probleme der statistischen Analyse zu lösen, beispielsweise um Hypothesen zu testen: über die Unabhängigkeit zweier Prinzipien, die der Gruppierung von Beobachtungsergebnissen aus derselben Population zugrunde liegen; über die Homogenität von Gruppen im Hinblick auf bestimmte identifizierbare Merkmale; zur Übereinstimmung zwischen den theoretischen und experimentellen Häufigkeitskurven. Das χ 2 -Kriterium kann sowohl als Übereinstimmungskriterium als auch als Unabhängigkeitskriterium, als Homogenitätskriterium bezeichnet werden. Das Verteilungsgesetz χ 2 (Chi-Quadrat) wurde von K. Pearson entdeckt. Aus der Chi-Quadrat-Funktion erhaltene Verteilungskurve:

Die χ 2 -Verteilung sowie die t-Verteilung sind ein Sonderfall
F – Verteilungen für ν 1 = ν und ν 2 = ∞.

Abbildung 5.3 – Differential (links) und Integral (rechts)
χ 2 – Verteilung

Fragen zur Selbstkontrolle

1 In welchen Fällen ist die Verwendung der Student-t-Verteilung der Normalverteilung vorzuziehen?

2 Welche Mengen müssen geschätzt werden, um die Student-t-Verteilung zu verwenden?

3 Was ist der Kern des Behrens-Fisher-Problems?

4 Wie wird die F-Verteilung für zwei unabhängige Stichproben aus einem Gesamtsatz von Variablen numerisch ausgedrückt?

5 Von welchen charakteristischen Werten von Zufallsvariablen hängt die F-Verteilung ab?

6 Welche Fragen kann der Wert des χ 2 -Kriteriums bei der statistischen Verarbeitung experimenteller Daten beantworten?

THEMA 6 Grundlagen der mathematischen Statistik

6.1 Durchschnittswerte

6.2 Arithmetisches Mittel

6.3 Geometrisches Mittel

6.4 Harmonisches Mittel

Das logarithmische Verteilungsmodell des berühmten englischen Mathematikers Fisher war der erste Versuch, den Zusammenhang zwischen der Artenzahl und der Individuenzahl dieser Arten zu beschreiben. Dieses Modell war vor allem in der entomologischen Forschung erfolgreich und wurde erstmals von Fisher als theoretisches Modell zur Beschreibung der Artenverteilung in Sammlungen verwendet. Dieses Modell und die Diversitätsstatistik waren Gegenstand einer detaillierten Studie von L. R. Taylor et al.

Die Häufigkeitsverteilung von Arten für eine logarithmische Verteilung wird durch die folgende Reihenfolge beschrieben:

wo  X– die Anzahl der Arten, die durch ein Individuum repräsentiert werden, x 2 /2 – die Anzahl der Arten, die durch zwei Individuen repräsentiert werden usw.

Das logarithmische Modell hat zwei Parameter  und X. Dies bedeutet für eine Stichprobengröße N und Anzahl der Arten S Es gibt nur eine mögliche Häufigkeitsverteilung von Arten basierend auf ihrer relativen Häufigkeit, da sowohl  als auch X sind Funktionen N Und S. Je größer die Stichprobe aus einer bestimmten Community ist, desto größer ist der Wert X und je kleiner der Anteil der Individuen ist, die einer Art angehören, die ein Individuum in der Stichprobe repräsentiert. Zwei Parameter S Und N(Gesamtzahl der Individuen) sind durch Abhängigkeit miteinander verbunden
, wobei der Diversitätsindex ist, der aus der Gleichung erhalten werden kann:

Wo ist die Summe aller Individuen? N Zugehörigkeit S Typen:

Das logarithmische Verteilungsmodell, das durch eine kleine Anzahl häufiger Arten und einen großen Anteil „seltener“ Arten gekennzeichnet ist, beschreibt am ehesten Gemeinschaften, deren Struktur durch einen oder mehrere Umweltfaktoren bestimmt wird.

Wie Untersuchungen von Magharran in Irland zeigen, entspricht diese Reihe der Häufigkeitsverteilung von Bodenpflanzenarten in Nadelbäumen unter schlechten Lichtverhältnissen.

5.3.3. Lognormalverteilung

Die meisten Gemeinschaften weisen eine logarithmische Normalverteilung der Artenhäufigkeit auf, aber dieses Muster deutet im Allgemeinen auf eine große, reife und vielfältige Gemeinschaft hin. Diese Verteilung ist typisch für Systeme, bei denen der Wert einer bestimmten Variablen durch eine Vielzahl von Faktoren bestimmt wird.

Dieses Modell wurde erstmals von Preston auf die Verteilung der Artenhäufigkeit angewendet. Anhand verschiedener empirischer Materialien zeigte er, dass die Artenhäufigkeit in großen Stichproben gemäß dem Lognormalgesetz verteilt ist. Nach der von ihm entwickelten Methodik werden Arten, deren Individuenzahl in Intervallen liegt, die durch geometrische Progressionszahlen begrenzt sind, in Häufigkeitsklassen eingeteilt. Preston zeichnete die Artenhäufigkeit auf einer Logarithmus-Basis-2-Skala (log 2) auf und nannte die resultierenden Klassen Oktaven. Zur Beschreibung des Modells können Sie jedoch jede logarithmische Basis verwenden. In der Grafik entspricht die Verteilung der Artenhäufigkeiten nach den so ermittelten Häufigkeitsklassen der bekannten, links abgeschnittenen Normalverteilungskurve im Häufigkeitsbereich seltener Arten.

Die Verteilung wird normalerweise in der Form geschrieben:

, Wo

S R – die theoretische Anzahl der Arten in einer Oktave, angeordnet in R-Oktaven ab der modalen Oktave; S Mo– Anzahl der Arten in der Modaloktave;  – Standardabweichung der theoretischen Log-Normalkurve, ausgedrückt in Oktaven.

Reis. 5.3.2. Log-Normalverteilung

Die logarithmische Normalverteilung wird durch eine symmetrische „Normale“, also eine glockenförmige Kurve, beschrieben (Abb. 5.3.2.). Wenn die entsprechenden Daten jedoch aus einer begrenzten Stichprobe stammen, ist die linke Seite der Kurve (d. h. seltene, nicht gemeldete Arten) unklar. Preston nannte diesen Schnittpunkt auf der linken Seite die „Vorhanglinie“. Die „Vorhanglinie“ kann sich mit zunehmender Stichprobengröße nach links verschieben. Dies ist in der Abbildung durch einen Pfeil gekennzeichnet. Bei den meisten Beispielen wird nur der Teil der Kurve rechts vom Modus ausgedrückt. Nur mit riesigen Datenmengen, die in riesigen biogeografischen Gebieten gesammelt werden, kann die vollständige Kurve verfolgt werden. S Die -förmige Kurve zeigt die komplexe Natur der Differenzierung und Nischenüberlappung. Die meisten Arten in natürlichen offenen Ökosystemen konkurrieren eher um Ressourcen als in direkter Konkurrenz; Viele Anpassungen ermöglichen die Aufteilung von Nischen ohne Konkurrenzausschluss aus dem Lebensraum. Dieses Muster ist am wahrscheinlichsten für ungestörte Gemeinschaften.

Wahrscheinlichkeitsfunktion
Verteilungsfunktion
Bezeichnung	$\mathrm(Log)(p)$
Optionen	$0 < p < 1$
Träger	$k \in $1,2,3,\dots$$
Wahrscheinlichkeitsfunktion	$\frac(-1)(\ln(1-p)) \; \frac(\;p^k)(k)$
Verteilungsfunktion	$1 + \frac(\Beta_p(k+1,0))(\ln(1-p))$
Erwartung	$\frac(-1)(\ln(1-p)) \; \frac(p)(1-p)$
Mittlere
Mode	$1$
Streuung	$-p \;\frac(p + \ln(1-p))((1-p)^2\,\ln^2(1-p))$
Asymmetriekoeffizient
Kurtosis-Koeffizient
Differenzielle Entropie
Erzeugende Funktion von Momenten	$\frac(\ln(1 - p\,\exp(t)))(\ln(1-p))$
Charakteristische Funktion	$\frac(\ln(1 - p\,\exp(i\,t)))(\ln(1-p))$

Logarithmische Verteilung in der Wahrscheinlichkeitstheorie – eine Klasse diskreter Verteilungen. Die logarithmische Verteilung wird in einer Vielzahl von Anwendungen verwendet, darunter in der mathematischen Genetik und Physik.

Definition

Lassen Sie die Verteilung einer Zufallsvariablen $Y$ ist durch die Wahrscheinlichkeitsfunktion gegeben:

$p_Y(k) \equiv \mathbb(P)(Y=k) = -\frac(1)(\ln(1-p)) \frac(p^k)(k),\; k=1,2,3,\ldots$ ,

Wo $0 Dann sagen sie das Y hat eine logarithmische Verteilung mit dem Parameter P . Sie schreiben: Y\sim\mathrm(Log)(p) .$

Zufällige Variablenverteilungsfunktion $Y$ Stückweise Konstante mit Sprüngen an natürlichen Punkten:

$F_Y(y) = \left\(\begin(matrix) 0, & y< 1 & \\
1 + \frac{\mathrm{B}_p(k+1,0)}{\ln (1-p)},\; & y \in ,\; 0 \sum\limits_(k=1)^(\infty)p_Y(k) = 1 .$

Momente

Erzeugende Funktion von Momenten einer Zufallsvariablen $Y\sim\mathrm(Log)(p)$ ergibt sich aus der Formel

$M_Y(t) = \frac(\ln\left)(\ln)$ ,

$\mathbb(E)[Y] = - \frac(1)(\ln(1-p)) \frac(p)(1-p)$ , $\mathrm(D)[Y] = -p \;\frac(p + \ln(1-p))((1-p)^2\,\ln^2(1-p))$ .

Beziehung zu anderen Distributionen

Die Poisson-Summe unabhängiger logarithmischer Zufallsvariablen weist eine negative Binomialverteilung auf. Lassen $$X_i$_(i=1)^n$ eine Folge unabhängiger, identisch verteilter Zufallsvariablen, so dass $X_i \sim \mathrm(Log)(p), \; i=1,2,\ldots$ . Lassen $N\sim\mathrm(P)(\lambda)$ - Poisson-Zufallsvariable. Dann

$Y = \sum\limits_(i=1)^N X_i \sim \mathrm(NB)$ .

Anwendungen

	N Wahrscheinlichkeitsverteilungen
	Eindimensional	Mehrdimensional
Diskret:	Bernoulli \| Binomial \| Geometrisch \| Hypergeometrisch \| Logarithmisch\| Negatives Binomial \| Poisson \| Diskrete Uniform	Multinomial
Absolut kontinuierlich:	Beta \| Weibull \| Gamma \| Hyperexponentiell \| Gompertz-Verteilung \| Kolmogorov \| Cauchy \| Laplace \| Lognormal \| Normal (Gauß) \| Logistik \| Nakagami \| Pareto \| Pearson \| Halbrund \| Kontinuierliche Uniform \| Reis \| \| Kopula

Schreiben Sie eine Rezension zum Artikel „Logarithmische Verteilung“

Ein Auszug, der die logarithmische Verteilung beschreibt

- Rückzug! Alle ziehen sich zurück! – schrie er aus der Ferne. Die Soldaten lachten. Eine Minute später traf der Adjutant mit demselben Befehl ein.
Es war Prinz Andrei. Das erste, was er sah, als er in den Raum ritt, der von Tuschins Geschützen eingenommen wurde, war ein ungegurtetes Pferd mit gebrochenem Bein, das in der Nähe der angeschnallten Pferde wieherte. Aus ihrem Bein floss Blut wie aus einem Schlüssel. Zwischen den Gliedmaßen lagen mehrere Tote. Eine Kanonenkugel nach der anderen flog über ihn hinweg, als er sich näherte, und er spürte, wie ihm ein nervöser Schauer über den Rücken lief. Aber allein der Gedanke, dass er Angst hatte, ließ ihn wieder aufstehen. „Ich kann keine Angst haben“, dachte er und stieg zwischen den Kanonen langsam von seinem Pferd. Er übermittelte den Befehl und verließ die Batterie nicht. Er beschloss, die Waffen mit ihm aus der Stellung zu entfernen und zurückzuziehen. Zusammen mit Tushin begann er, über die Leichen zu gehen und unter schrecklichem Feuer der Franzosen zu stehen, die Waffen zu säubern.
„Und dann kamen gerade die Behörden, also brachen sie in Tränen aus“, sagte der Feuerwerksmann zu Prinz Andrei, „nicht wie Euer Ehren.“
Prinz Andrei sagte Tuschin nichts. Sie waren beide so beschäftigt, dass es schien, als würden sie sich nicht einmal sehen. Als sie, nachdem sie die überlebenden zwei der vier Geschütze auf die Protze gesetzt hatten, den Berg hinunterzogen (eine kaputte Kanone und das Einhorn blieben übrig), fuhr Prinz Andrei nach Tuschin hinauf.
„Nun, auf Wiedersehen“, sagte Prinz Andrei und reichte Tuschin die Hand.
„Auf Wiedersehen, mein Lieber“, sagte Tuschin, „liebe Seele!“ „Auf Wiedersehen, mein Lieber“, sagte Tuschin mit Tränen, die ihm aus einem unbekannten Grund plötzlich in die Augen traten.

Der Wind ließ nach, schwarze Wolken hingen tief über dem Schlachtfeld und verschmolzen am Horizont mit Schießpulverrauch. Es wurde dunkel und an zwei Stellen war der Schein der Feuer umso deutlicher zu erkennen. Die Kanonade wurde schwächer, aber das Knistern der Kanonen hinter und rechts war noch häufiger und näher zu hören. Sobald Tuschin mit seinen Waffen umherfuhr und die Verwundeten überrannte, aus dem Beschuss hervorkam und in die Schlucht hinabstieg, trafen ihn seine Vorgesetzten und Adjutanten, darunter ein Stabsoffizier und Scherkow, der zweimal und nie geschickt wurde erreichte Tushins Batterie. Sie alle unterbrachen einander, gaben und gaben Anweisungen, wie und wohin sie gehen sollten, und machten ihm Vorwürfe und Bemerkungen. Tuschin gab keine Befehle und ritt schweigend, aus Angst zu sprechen, weil er bei jedem Wort bereit war, ohne zu wissen warum, zu weinen, auf seinem Artillerie-Nörgler hinterher. Obwohl befohlen wurde, die Verwundeten zurückzulassen, liefen viele von ihnen hinter den Truppen her und verlangten, zu den Geschützen eingesetzt zu werden. Derselbe schneidige Infanterieoffizier, der vor der Schlacht aus Tuschins Hütte sprang, wurde mit einer Kugel im Bauch auf Matvevnas Kutsche gesetzt. Unter dem Berg näherte sich ein blasser Husarenkadett, der die andere mit einer Hand stützte, Tuschin und bat ihn, sich zu setzen.

Wenn Sie Messungen über einen längeren Zeitraum durchführen würden, würden Sie wahrscheinlich auf ein verzerrtes Verteilungsmuster stoßen. Beispielsweise stellen Sie möglicherweise fest, dass die Renditen über 100 % liegen und dass es keinen einzigen Fall gibt, in dem die Renditen unter 100 % liegen. Die Verteilung der Rückgabewerte über einen Zeitraum von beispielsweise einem Jahr würde am besten einer Lognormalverteilung entsprechen. Die Lognormalverteilung wird wie die Normalverteilung vollständig durch ihren Mittelwert und ihre Standardabweichung bestimmt.

Im linken Histogramm gehen wir davon aus, dass es für das Geschäft von Frau Charter nur zwei mögliche Ergebnisse gibt – hohe Nachfrage oder niedrige Nachfrage. Das Balkendiagramm zeigt den Barwert im ersten Jahr unter der Annahme, dass das Geschäft weitergeführt wird. Die logarithmische Normalverteilung in der rechten Abbildung ist realistischer, da sie einen unendlichen Bereich möglicher Barwertwerte impliziert und Zwischenergebnisse berücksichtigt. Das Black-Scholz-Modell basiert auf der logarithmischen Verteilung.

Die Hypothese über die logarithmische Normalverteilung elementarer Übergangskoeffizienten gewährleistet die Zweckmäßigkeit und Einfachheit des Pro-

Wie oben erwähnt, bestimmt die Annahme, dass die elementaren Übergangskoeffizienten a Zufallsvariablen mit der gleichen logarithmischen Normalverteilung mit den Parametern i, o2 (a,-e n(t,a2)) sind, die Gültigkeit der auf der Grundlage einer multiplikativen Stochastik erhaltenen Vorhersagen Modell über einen begrenzten Zeitraum mit unveränderten Bedingungen. Dies beinhaltet die Aufgabe, Methoden zu entwickeln, um den Zeitpunkt der Änderung von Faktoren, die die Dynamik der Ressource beeinflussen (den Zeitpunkt der Änderung der Werte von q, a2), schnell und effektiv zu bestimmen. Es kann gelöst werden, indem die Werte des mathematischen Erwartungswerts m, - Ma(i) und der Streuung s,2 = Da(z) der Zufallskoeffizienten des Elementarübergangs a(z), z überwacht (ständig verfolgt) werden = l,..., n, ....

Log-Normalverteilung. Die Verteilung einer Zufallsvariablen Y heißt logarithmisch normal, wenn der Logarithmus dieser Variablen nach dem Normalgesetz verteilt ist

Lognormalverteilung

Es ist zu beachten, dass die Form der für P(T, U) verwendeten Verteilung nicht mit dem Preismodell übereinstimmen muss, das zur Bestimmung der Werte von Z(T, U – Y) verwendet wird. Sie verwenden beispielsweise das Black-Scholes-Aktienoptionsmodell, um die Werte von Z(T, U – Y) zu bestimmen. Dieses Modell geht von einer logarithmischen Normalverteilung der Preisänderungen aus, Sie können jedoch eine andere Form der Verteilung verwenden, um das entsprechende P(T, U) zu bestimmen.

Lognormal, Lognormalverteilung 176

Sehr oft gehorchen physikalische Parameter der sogenannten Lognormalverteilung. Basierend auf der Analyse der Tabelle. 95 und 96 kann argumentiert werden, dass gepaarte Korrelationskoeffizienten, die aus Parametern auf einer logarithmischen Skala berechnet werden, sich nicht wesentlich von linearen gepaarten Korrelationskoeffizienten unterscheiden. In der Tabelle 95 und 96 zeigen gepaarte Korrelationskoeffizienten in linearen (obere Zeile) und logarithmischen (untere Zeile) Skalen. Ein Unterschied gilt als unbedeutend, wenn sich die Konfidenzintervalle für paarweise Korrelationskoeffizienten schneiden. Die Zellen, in denen sich der Unterschied in den paarweisen Korrelationskoeffizienten als signifikant herausstellte, sind eingekreist. Wie man sehen kann, ist die Beziehung zwischen dem 1. und 6., 2. und 6., 2. und 5. Parameter bei allen Geräten deutlich nichtlinear. Bei geeigneten Geräten gilt das Gleiche auch für den Zusammenhang zwischen 1. und 6., 2. und 6. Parameter.

Mathematische Werkzeuge zur Risikobewertung umfassen statistische Berechnungen, Normalverteilung, Lognormalverteilung, lineare Programmierung, ökonometrische Methoden usw.

Der Standard legt Regeln zur Bestimmung von Schätzungen und Konfidenzgrenzen für Parameter einer Lognormalverteilung für einen Satz statistischer Daten fest, wenn diese Daten einer Lognormalverteilung unterliegen.

Lognormalverteilung. Sei X N(m,a2). Die Zufallsvariable Y = ex heißt logarithmisch normal. Es lässt sich zeigen, dass die Verteilungsdichte dieser Größe durch die Formel bestimmt wird

Eine logarithmische Normalverteilung entsteht in einer Situation, in der die untersuchte Zufallsvariable unter dem Einfluss einer großen Anzahl multiplikativer Zufallsfaktoren gebildet wird. Das lässt sich zeigen

Mit dieser Modifikation wird die Normalverteilung in eine Lognormalverteilung umgewandelt. Der Preis eines öffentlich gehandelten Instruments hat einen Wert von Null als Untergrenze von 1. Wenn also der Preis dieses Instruments fällt und sich Null nähert, sollte es theoretisch immer schwieriger werden, den Preis des Instruments nach unten zu bewegen. Stellen Sie sich eine Aktie vor, die 10 $ kostet. Wenn eine Aktie um 5 $ auf 5 $ pro Aktie fallen würde (50 % Rückgang), dann könnte sie bei der Normalverteilung genauso gut von 5 $ auf 0 $ fallen. Bei einer logarithmischen Normalverteilung ergibt sich jedoch ein Rückgang um 50 % von 5 USD pro Aktie auf

Die Lognormalverteilung, Abbildung 3-15, funktioniert genauso wie die Normalverteilung, mit der Ausnahme, dass wir es bei der Lognormalverteilung mit prozentualen Änderungen und nicht mit absoluten Änderungen zu tun haben. Schauen wir uns nun die Aufwärtsbewegung an. Gemäß der Lognormalverteilung ist eine Änderung von 10 $ pro Aktie auf 20 $ pro Aktie dasselbe wie eine Änderung von 5 $ auf 10 $ pro Aktie, da beide Bewegungen eine Steigerung von 100 % darstellen. Dies bedeutet nicht, dass wir die Normalverteilung nicht verwenden werden. Wir führen einfach die Lognormalverteilung ein, zeigen, wie sie sich von der Normalverteilung unterscheidet (die Lognormalverteilung verwendet prozentuale statt absolute Preisänderungen) und sehen, dass sie normalerweise verwendet wird, wenn Preisbewegungen diskutiert werden oder wenn die Normalverteilung unten begrenzt ist null. Um die Lognormalverteilung zu verwenden, müssen Sie die Daten, mit denen Sie arbeiten, in natürliche Logarithmen1 umwandeln.

Wir haben ein wenig über die Mathematik von Normal- und Lognormalverteilungen gelernt und schauen uns nun an, wie man das optimale f aus normalverteilten Ergebnissen ermittelt. Kellys Formel ist ein Beispiel für ein parametrisches Optimum f, wobei f eine Funktion zweier Parameter ist. In der Kelly-Formel sind die Eingabeparameter der Prozentsatz der gewonnenen Wetten und das Verhältnis von Gewinnen zu Verlusten. Die Kelly-Formel liefert Ihnen jedoch nur dann das optimale f, wenn die möglichen Ergebnisse eine Bernoulli-Verteilung haben. Mit anderen Worten: Kellys Formel liefert Ihnen das richtige optimale f, wenn es nur zwei mögliche Ergebnisse gibt. Andernfalls liefert Ihnen Kellys Formel, wie bei normalverteilten Ergebnissen, nicht das richtige optimale f2.

Die Lognormalverteilung hängt von zwei Parametern des mathematischen Erwartungswerts a und der Standardabweichung o der Zufallsvariablen Y (Logarithmen des Einkommens) ab: a = E(Y) = E(InX), a2 = var(F) = var(hiA) . Die Berechnung des zweiten Parameters erfolgt auf Basis der Daten einer Stichproben-Budgeterhebung nach folgender Formel

Um die Merkmale der Differenzierung der Bevölkerung nach Einkommensniveau zu untersuchen, werden strukturelle Merkmale der Verteilungsbereiche verwendet, wie z. B. Modus, Median, Quartile, Dezile usw. Diese statistischen Merkmale können durch die Parameter der logarithmischen Normalverteilung ausgedrückt und berechnet werden ( a und o). Gleichzeitig kann eine ungefähre Einschätzung der Strukturmerkmale auf der Grundlage bereits erstellter statistischer Reihen durchgeführt werden, die von staatlichen Statistikämtern veröffentlicht werden.

LOGNORMAL, LOGARITHMISCH-NORMALVERTEILUNG – Verteilung einer Zufallsvariablen, deren Logarithmus durch eine Normalverteilung gekennzeichnet ist. Mit seiner Hilfe lassen sich einige wirtschaftliche Phänomene bequem beschreiben, beispielsweise Lohndifferenzierung, Einkommensverteilung.

Bei der Verwendung probabilistischer Risikomodelle gibt es zwei häufige Missverständnisse. Erstens: Wenn die Schadenshöhe von vielen Ursachen abhängt, sollte sie eine Normalverteilung aufweisen. Dies ist ein Missverständnis, da alles von der Art und Weise abhängt, wie sie interagieren. Wirken die Ursachen additiv (total), so ist die Schadenshöhe nach dem Zentralen Grenzwertsatz der Wahrscheinlichkeitstheorie tatsächlich annähernd normalverteilt (Gauß-verteilt). Wirken die Ursachen multiplikativ, so sollte nach demselben Theorem die Verteilung der Schadenshöhe X durch die Lognormalverteilung angenähert werden. Wenn der Haupteinfluss ist

Lesen:

Warum Verlage nicht alle Seiten bearbeiten können Pandao-Promocodes für Punkte Installieren von zusätzlichem RAM Was tun, wenn Kopfhörer auf einem Laptop keinen Ton wiedergeben? Diodenverzeichnis Hochleistungs-Gleichrichterdioden 220V