Abschnitte der Website
Wahl des Herausgebers:
- So entfernen Sie Avast vollständig. Programm zum Entfernen von Avast
- Aliexpress-Mobilanwendung
- QWERTY- und AZERTY-Tastaturlayout Spezielle Versionen der Dvorak-Tastatur
- Insel Sao Vicente Insel Sao Vicente
- Die Regeln, die wir brechen. Ist es in Ordnung, die Ellbogen auf den Tisch zu legen?
- Welche USB-Sticks sind die zuverlässigsten und schnellsten?
- Anschließen eines Laptops an einen Fernseher über ein USB-Kabel zum Anschließen eines Laptops an einen VGA-Fernseher
- Änderung der Steam-Oberfläche – von einfachen Bildern bis zur gesamten Darstellung auf dem Bildschirm Neues Steam-Design
- So kündigen Sie ein Megogo-Abonnement im Fernsehen: detaillierte Anleitung So kündigen Sie Megogo-Abonnements
- So partitionieren Sie eine Festplatte mit installiertem Windows, ohne Daten zu verlieren. Partitionieren Sie die Festplatte 7
Werbung
Logarithmische Verteilung. Siehe Seiten, auf denen der Begriff Log-Normalverteilung erwähnt wird |
Die Zufallsvariable Y hat einen Logarithmus Normalverteilung mit den Parametern μ und σ, wenn die Zufallsvariable X = lnY eine Normalverteilung mit den gleichen Parametern μ und σ hat. Wenn wir die Art der Beziehung zwischen den Variablen X und Y kennen, können wir leicht einen Wahrscheinlichkeitsdichtegraphen einer Zufallsvariablen mit einer Lognormalverteilung erstellen (Abbildung 4.2). Abbildung 4.2 – Dichtekurven der Lognormalverteilung für verschiedene Werte der Parameter μ und σ Wenn eine Zufallsvariable X eine What, die durch Formel (4.6) definiert ist, und wenn X = lnY, dann: Wo gilt für y > 0: Aus der Definition folgt, dass eine Zufallsvariable, die einer Lognormalverteilung unterliegt, nur positive Werte annehmen kann. Wie in Abbildung 4.2 dargestellt, weisen die Kurven der Funktion f(y) eine linksseitige Asymmetrie auf, die umso stärker ist, je größer die Werte der Parameter μ und σ sind. Jede Kurve hat ein Maximum und ist für alle positiven Werte von y definiert. Die Berechnung des mathematischen Erwartungswerts und der Varianz einer Zufallsvariablen mit einer Lognormalverteilung ist nicht besonders schwierig: Durch Substitutionen und Einführung neuer Variablen in den Integralen 4.15 und 4.16 erhalten wir: Um die Wahrscheinlichkeit zu berechnen, dass eine Zufallsvariable Y mit einer logarithmischen Normalverteilung und der Dichte f(y, μ, σ) einen Wert im Intervall (a, b) annimmt, sollte man im Allgemeinen das Integral nehmen: In der Praxis ist es jedoch bequemer, die Tatsache zu nutzen, dass der Logarithmus der Zufallsvariablen Y eine Normalverteilung hat. Die Wahrscheinlichkeit, dass a ≤ Y ≤ b, entspricht der Wahrscheinlichkeit, dass Berechnen wir die Wahrscheinlichkeit, dass eine Zufallsvariable mit einer logarithmischen Verteilung μ = 1, σ = 0,5 einen Wert im Intervall (2, 5) annimmt. Wir haben: Aus den Logarithmentabellen finden wir ln2 = 0,6932 und ln5 = 1,6094. Wenn wir lnY = X bezeichnen, können wir schreiben: Darüber hinaus unterliegt die Zufallsvariable X einer Normalverteilung mit einem Mittelwert μ = 1 und einer Standardabweichung σ = 0,5. Nun lässt sich die gewünschte Wahrscheinlichkeit einfach aus den Tabellen der Integralfunktion der Normalverteilung berechnen: Fragen zur Selbstkontrolle 1 Definition der Rechteckverteilung. 2 Weiner Zufallsvariablen mit Rechteckverteilung 3 Grundlegende Bedeutung der Rechteckverteilung. 4 Erwartung und die Varianz einer Zufallsvariablen in einer Rechteckverteilung. 5 Die Rolle der Normalverteilung in der mathematischen Statistik. 6 Was ist die Normalverteilung und wie hängt sie mit dem Binomial zusammen? 7 Weiner Zufallsvariablen mit Normalverteilung. 8 Welche statistischen Parameter können zur Definition einer Normalverteilung verwendet werden? 9 Warum ist die Normalverteilung stetig? 10 Gleichung einer Normalkurve. 11 Was ist eine normalisierte Abweichung? 12 Gleichung der Normalverteilungskurve in normalisierter Form. 13 Welche Werte von μ und σ charakterisieren eine Normalpopulation in normalisierter Form? 14 Welcher Anteil der Probendaten liegt innerhalb der Grenzen von ±1σ, ±2σ, ±3σ? 15 Was zeigt die Tabelle des Normalwahrscheinlichkeitsintegrals? 16 Gleichung einer Lognormalkurve. 17 Weiner Zufallsvariablen mit einer Lognormalverteilung. 18 Welche Transformationen müssen durchgeführt werden, um aus einer Lognormalverteilung eine Normalverteilung zu erhalten? 19 Welche statistischen Parameter definieren eine Lognormalverteilung? THEMA 5 Verteilungen von Stichprobenparametern 5,1 t – Studentenverteilung 5.2 Fisher-Snedecor-F-Verteilung 5.3 χ 2 – Verteilung 5,1 t – Studentenverteilung Das Gesetz der Normalverteilung tritt auf, wenn die Anzahl der Merkmale n > 20–30 ist. Der Experimentator führt jedoch häufig eine begrenzte Anzahl von Messungen durch und stützt seine Schlussfolgerungen auf kleine Proben. Bei einer geringen Anzahl von Beobachtungen liegen die Ergebnisse in der Regel nahe beieinander und große Abweichungen treten selten auf. Dies lässt sich leicht mit dem Gesetz der Normalverteilung erklären, wonach die Wahrscheinlichkeit kleiner Abweichungen größer ist als die Wahrscheinlichkeit großer Abweichungen. Somit beträgt die Wahrscheinlichkeit von Abweichungen, die ±2σ in absoluten Werten überschreiten, 0,05, oder ein Fall pro 20 Messungen, und Abweichungen von ± 3σ – 0,01, oder ein Fall pro 100. Wenn der Feldversuch beispielsweise in 4–6 Wiederholungen durchgeführt wird, ist es selbstverständlich, dass es keine allzu großen Abweichungen zwischen den Ertragswerten auf Parallelparzellen geben wird. Daher ist die aus einer kleinen Stichprobe berechnete Standardabweichung s in den meisten Fällen geringer als die der gesamten Grundgesamtheit. Daher können Sie sich in diesen Fällen bei Ihren Schlussfolgerungen nicht auf Normalverteilungskriterien verlassen. Seit Beginn des 20. Jahrhunderts begann sich in der mathematischen Statistik eine neue Richtung zu entwickeln, die als Statistik kleiner Stichproben bezeichnet werden kann. Von größter praktischer Bedeutung für experimentelle Arbeiten war die 1908 vom englischen Statistiker und Chemiker W. Gosset entdeckte t-Verteilung, die als Student-Verteilung (englisch Student-Student, Pseudonym von W. Gosset) bezeichnet wurde. Die Student-t-Verteilung für Stichprobenmittelwerte wird durch die Gleichung bestimmt: Der Zähler der Formel bedeutet die Abweichung des Stichprobenmittelwerts vom Mittelwert der gesamten Grundgesamtheit und der Nenner: – ist ein Indikator, der den Standardfehler der durchschnittlichen Stichprobenpopulation schätzt. Somit wird der Wert von t anhand der Abweichung des Stichprobenmittelwerts vom Grundgesamtheitsmittelwert gemessen, ausgedrückt in Anteilen des Stichprobenfehlers, angenommen als Einheit. Die Häufigkeitsmaxima der Normal- und T-Verteilung fallen zusammen, die Form der T-Verteilungskurve hängt jedoch vollständig von der Anzahl der Freiheitsgrade ab. Bei sehr kleinen Werten der Freiheitsgrade nimmt es die Form einer Kurve mit flacher Spitze an, und die durch die Kurve begrenzte Fläche ist größer als bei einer Normalverteilung und mit zunehmender Anzahl von Beobachtungen (n > 30), nähert sich die t-Verteilung der Normalverteilung und geht bei n = ∞ in diese über. Abbildung 1.1 zeigt die Differential- und Integralverteilung von t-Student bei 10 Freiheitsgraden. Abbildung 5.1 – Differential- (links) und integrale (rechts) t-Student-Verteilung Die t-Student-Verteilung ist wichtig, wenn Sie mit kleinen Stichproben arbeiten: Sie ermöglicht die Bestimmung eines Konfidenzintervalls, das den Mittelwert der Grundgesamtheit abdeckt , und testen Sie die eine oder andere Hypothese bezüglich der Allgemeinbevölkerung. In diesem Fall ist es nicht erforderlich, die Parameter der Grundgesamtheit zu kennen Und , reicht es aus, ihre Schätzungen μ und σ für eine bestimmte Stichprobengröße n zu haben. 5.1.1 Behrens-Fisher-Problem Das Testen der Hypothese über die allgemeinen Mittelwerte zweier Gruppen mit Normalverteilung und ungleichen Varianzen in der mathematischen Statistik wird als Behrens-Fisher-Problem bezeichnet und hat derzeit nur Näherungslösungen. Warum ist die Forderung nach Varianzgleichheit in verglichenen Gruppen so wichtig? Ohne näher auf dieses Problem einzugehen, stellen wir fest, dass die Verteilung des „berechneten T-Tests“ umso stärker von der Verteilung des „Student-T-Tests“ abweicht, je stärker sich die Varianzen und Stichprobengrößen voneinander unterscheiden. In diesem Fall haben sowohl das t-Kriterium selbst als auch ein Parameter dieser Verteilungen wie die Anzahl der Freiheitsgrade unterschiedliche Werte. Die Anzahl der Freiheitsgrade wiederum beeinflusst den Wert des erreichten (kritischen) Signifikanzniveaus (S< ...) определяемого для вычисленного значения t-критерия. Die Vernachlässigung der oben genannten Bedingungen für die Zulässigkeit der Verwendung des Student-T-Tests durch Forscher führt zu einer erheblichen Verzerrung der Ergebnisse der Prüfung von Hypothesen über die Gleichheit der Mittelwerte. Daher gibt es in Arbeiten, in denen die Prüfung von Hypothesen über die Gleichheit zweier Mittelwerte mit dem Student-t-Test durchgeführt wurde und die Kriterien für die Prüfung der Normalverteilung und der Varianzgleichheit nicht erwähnt werden, Grund zu der Annahme, dass dies der Fall ist Die Autoren haben dieses Kriterium falsch verwendet und daher sind ihre erklärten Schlussfolgerungen zweifelhaft. Andere häufiger Fehler– Anwendung des Student-t-Tests, um Hypothesen über die Gleichheit von drei oder mehr Gruppenmittelwerten zu testen. In diesem Fall ist es notwendig, das sogenannte allgemeine lineare Modell anzuwenden, das im Verfahren der einseitigen Varianzanalyse mit festen Effekten implementiert ist. Schauen wir uns die Funktionen des Student-T-Tests genauer an. Der t-Test wird am häufigsten in zwei Fällen verwendet. Im ersten Fall wird es verwendet, um die Hypothese über die Gleichheit der allgemeinen Mittelwerte zweier unabhängiger, nicht zusammenhängender Stichproben zu testen (der sogenannte Zwei-Stichproben-t-Test). Dabei gibt es eine Kontrollgruppe und eine Versuchsgruppe, bestehend aus unterschiedlichen Objekten, deren Anzahl in Gruppen unterschiedlich sein kann. Im zweiten Fall wird der sogenannte gepaarte t-Test verwendet, bei dem dieselbe Gruppe von Objekten numerisches Material generiert, um Hypothesen über Durchschnittswerte zu testen. Daher werden diese Stichproben als abhängig, verwandt bezeichnet. Beispielsweise wird die Anzahl der weißen Blutkörperchen bei gesunden Tieren und dann bei denselben Tieren nach einer bestimmten Strahlendosis gemessen. In beiden Fällen muss die Anforderung der Normalverteilung des untersuchten Merkmals in jeder der verglichenen Gruppen erfüllt sein. Die Dominanz des Student-t-Tests in der überwiegenden Mehrheit der Arbeiten spiegelt zwei wichtige Aspekte wider. Zweitens deutet dies auch darauf hin, dass diese Autoren keine Alternativen zu diesem Kriterium kennen oder diese nicht selbst anwenden können. Man kann ohne Übertreibung sagen, dass die gedankenlose Verwendung des Student-t-Tests in den meisten biologischen Arbeiten derzeit mehr schadet als nützt. 5.2 Fisher-Snedecor-F-Verteilung Nehmen wir zwei unabhängige Stichproben der Größe n 1 und n 2 aus einer normalverteilten Grundgesamtheit und berechnen die Varianzen Und mit Freiheitsgraden ν 1 = n –1 und ν 2 = n 2 –1, dann lässt sich das Varianzverhältnis bestimmen: Das Verhältnis der Varianzen wird so gewählt, dass es eine große Varianz im Zähler gibt und daher F ≥ 1 ist. Die Verteilung von F hängt nur von der Anzahl der Freiheitsgrade ν 1 und ν 2 ab (das Gesetz der F-Verteilung wurde von R. A. Fisher entdeckt). Wenn zwei verglichene Stichproben zufällig unabhängig von der Gesamtbevölkerung mit einem allgemeinen Durchschnitt sind, wird der tatsächliche Wert von F bestimmte Grenzen nicht überschreiten und den theoretischen Wert des Kriteriums F nicht überschreiten, das für die Daten ν 1 und ν 2 kritisch ist (F Tatsache< F теор). Если генеральные параметры сравниваемых групп различны, то F факт >F-Theor. Theoretische F-Werte für die Signifikanzniveaus 5 % und 1 % sind in der Tabelle angegeben, wobei nur die richtigen kritischen Punkte für F ≥ 1 aufgeführt sind, da es immer üblich ist, das Verhältnis der größeren Varianz zur kleineren zu ermitteln . Die aus der Verteilungsfunktion erhaltenen Kurven für alle möglichen Werte von F, insbesondere bei einer kleinen Anzahl von Beobachtungen, haben eine asymmetrische Form – einen langen „Schwanz“ großer Werte und eine große Konzentration kleiner F-Werte ( Abbildung 5.2). Abbildung 5.2 – Differential (links) und Integral (rechts) Beachten Sie, dass die Student-t-Verteilung ein Sonderfall der F-Verteilung mit der Anzahl der Freiheitsgrade ν 1 = 1 und ν 2 = ν ist, d. h. gleich der Anzahl der Freiheitsgrade für die t-Verteilung. In diesem Fall wird der folgende Zusammenhang zwischen F und t beobachtet: 5.3 χ 2 – Verteilung Viele tatsächliche Verteilungen entsprechen theoretischen Verteilungsmodellen (Normal-, Binomial-, Poisson-Verteilungen). In der Praxis gibt es jedoch Verteilungen, die stark von der Normalverteilung abweichen. Um den Grad der Diskrepanz bzw. den Grad der Übereinstimmung zwischen den Zahlen tatsächlicher und theoretischer Verteilungen zu beurteilen, werden statistische Übereinstimmungskriterien eingeführt, beispielsweise das χ 2-Kriterium. Dieses Kriterium wird zur Lösung von Problemen verwendet statistische Analyse, zum Beispiel, um Hypothesen zu testen: über die Unabhängigkeit zweier Prinzipien, die der Gruppierung von Beobachtungsergebnissen aus einer Population zugrunde liegen; über die Homogenität von Gruppen im Hinblick auf bestimmte identifizierbare Merkmale; zur Übereinstimmung zwischen den theoretischen und experimentellen Häufigkeitskurven. Das χ 2 -Kriterium kann sowohl als Übereinstimmungskriterium als auch als Unabhängigkeitskriterium, als Homogenitätskriterium bezeichnet werden. Das Verteilungsgesetz χ 2 (Chi-Quadrat) wurde von K. Pearson entdeckt. Aus der Chi-Quadrat-Funktion erhaltene Verteilungskurve: Dabei sind f die tatsächlichen und F die theoretischen Häufigkeiten der Anzahl der Probenobjekte. Sein Aussehen hängt stark von der Anzahl der Freiheitsgrade ab. Für eine kleine Anzahl von Freiheitsgraden ν ist die Kurve asymmetrisch (Abbildung 5.3), aber wenn ν zunimmt, nimmt die Asymmetrie ab und bei ν = ∞ wird die Kurve zur normalen Gaußschen Kurve. Die χ 2 -Verteilung sowie die t-Verteilung sind ein Sonderfall Abbildung 5.3 – Differential (links) und Integral (rechts) Fragen zur Selbstkontrolle 1 In welchen Fällen ist die Verwendung der Student-t-Verteilung der Normalverteilung vorzuziehen? 2 Welche Mengen müssen geschätzt werden, um die Student-t-Verteilung zu verwenden? 3 Was ist der Kern des Behrens-Fisher-Problems? 4 Wie wird die F-Verteilung für zwei numerisch ausgedrückt? unabhängige Stichproben aus dem Gesamtsatz der Variablen? 5 Von welchen charakteristischen Werten von Zufallsvariablen hängt die F-Verteilung ab? 6 Welche Fragen kann der Wert des χ 2 -Kriteriums bei der statistischen Verarbeitung experimenteller Daten beantworten? THEMA 6 Grundlagen der mathematischen Statistik 6.1 Durchschnittswerte 6.2 Arithmetisches Mittel 6.3 Geometrisches Mittel 6.4 Harmonisches Mittel Die Zufallsvariable Y hat eine Lognormalverteilung mit den Parametern μ und σ, wenn die Zufallsvariable X = lnY eine Normalverteilung mit den gleichen Parametern μ und σ hat. Wenn wir die Art der Beziehung zwischen den Variablen X und Y kennen, können wir leicht einen Wahrscheinlichkeitsdichtegraphen einer Zufallsvariablen mit einer Lognormalverteilung erstellen (Abbildung 4.2). Abbildung 4.2 – Dichtekurven der Lognormalverteilung für verschiedene Werte der Parameter μ und σ Wenn eine Zufallsvariable X eine What, die durch Formel (4.6) definiert ist, und wenn X = lnY, dann: Wo gilt für y > 0: Aus der Definition folgt, dass eine Zufallsvariable, die einer Lognormalverteilung unterliegt, nur positive Werte annehmen kann. Wie in Abbildung 4.2 dargestellt, weisen die Kurven der Funktion f(y) eine linksseitige Asymmetrie auf, die umso stärker ist, je größer die Werte der Parameter μ und σ sind. Jede Kurve hat ein Maximum und ist für alle positiven Werte von y definiert. Die Berechnung des mathematischen Erwartungswerts und der Varianz einer Zufallsvariablen mit einer Lognormalverteilung ist nicht besonders schwierig: Durch Substitutionen und Einführung neuer Variablen in den Integralen 4.15 und 4.16 erhalten wir: Um die Wahrscheinlichkeit zu berechnen, dass eine Zufallsvariable Y mit einer logarithmischen Normalverteilung und der Dichte f(y, μ, σ) einen Wert im Intervall (a, b) annimmt, sollte man im Allgemeinen das Integral nehmen: In der Praxis ist es jedoch bequemer, die Tatsache zu nutzen, dass der Logarithmus der Zufallsvariablen Y eine Normalverteilung hat. Die Wahrscheinlichkeit, dass a ≤ Y ≤ b, entspricht der Wahrscheinlichkeit, dass Berechnen wir die Wahrscheinlichkeit, dass eine Zufallsvariable mit einer logarithmischen Verteilung μ = 1, σ = 0,5 einen Wert im Intervall (2, 5) annimmt. Wir haben: Aus den Logarithmentabellen finden wir ln2 = 0,6932 und ln5 = 1,6094. Wenn wir lnY = X bezeichnen, können wir schreiben: Darüber hinaus unterliegt die Zufallsvariable X einer Normalverteilung mit einem Mittelwert μ = 1 und einer Standardabweichung σ = 0,5. Nun lässt sich die gewünschte Wahrscheinlichkeit einfach aus den Tabellen der Integralfunktion der Normalverteilung berechnen: Fragen zur Selbstkontrolle 1 Definition der Rechteckverteilung. 2 Weiner Zufallsvariablen mit Rechteckverteilung 3 Grundlegende Bedeutung der Rechteckverteilung. 4 Erwartungswert und Varianz einer Zufallsvariablen in einer Rechteckverteilung. 5 Die Rolle der Normalverteilung in der mathematischen Statistik. 6 Was ist die Normalverteilung und wie hängt sie mit dem Binomial zusammen? 7 Weiner Zufallsvariablen mit Normalverteilung. 8 Welche statistischen Parameter können zur Definition einer Normalverteilung verwendet werden? 9 Warum ist die Normalverteilung stetig? 10 Gleichung einer Normalkurve. 11 Was ist eine normalisierte Abweichung? 12 Gleichung der Normalverteilungskurve in normalisierter Form. 13 Welche Werte von μ und σ charakterisieren eine Normalpopulation in normalisierter Form? 14 Welcher Anteil der Probendaten liegt innerhalb der Grenzen von ±1σ, ±2σ, ±3σ? 15 Was zeigt die Tabelle des Normalwahrscheinlichkeitsintegrals? 16 Gleichung einer Lognormalkurve. 17 Weiner Zufallsvariablen mit einer Lognormalverteilung. 18 Welche Transformationen müssen durchgeführt werden, um aus einer Lognormalverteilung eine Normalverteilung zu erhalten? 19 Welche statistischen Parameter definieren eine Lognormalverteilung? THEMA 5 Verteilungen von Stichprobenparametern 5,1 t – Studentenverteilung 5.2 Fisher-Snedecor-F-Verteilung 5.3 χ 2 – Verteilung 5,1 t – Studentenverteilung Das Gesetz der Normalverteilung tritt auf, wenn die Anzahl der Merkmale n > 20–30 ist. Der Experimentator führt jedoch häufig eine begrenzte Anzahl von Messungen durch und stützt seine Schlussfolgerungen auf kleine Proben. Bei einer geringen Anzahl von Beobachtungen liegen die Ergebnisse in der Regel nahe beieinander und große Abweichungen treten selten auf. Dies lässt sich leicht mit dem Gesetz der Normalverteilung erklären, wonach die Wahrscheinlichkeit kleiner Abweichungen größer ist als die Wahrscheinlichkeit großer Abweichungen. Somit beträgt die Wahrscheinlichkeit von Abweichungen, die ±2σ in absoluten Werten überschreiten, 0,05, oder ein Fall pro 20 Messungen, und Abweichungen von ± 3σ – 0,01, oder ein Fall pro 100. Wenn der Feldversuch beispielsweise in 4–6 Wiederholungen durchgeführt wird, ist es selbstverständlich, dass es keine allzu großen Abweichungen zwischen den Ertragswerten auf Parallelparzellen geben wird. Daher ist die aus einer kleinen Stichprobe berechnete Standardabweichung s in den meisten Fällen geringer als die der gesamten Grundgesamtheit. Daher können Sie sich in diesen Fällen bei Ihren Schlussfolgerungen nicht auf Normalverteilungskriterien verlassen. Seit Beginn des 20. Jahrhunderts begann sich in der mathematischen Statistik eine neue Richtung zu entwickeln, die als Statistik kleiner Stichproben bezeichnet werden kann. Von größter praktischer Bedeutung für experimentelle Arbeiten war die 1908 vom englischen Statistiker und Chemiker W. Gosset entdeckte t-Verteilung, die als Student-Verteilung (englisch Student-Student, Pseudonym von W. Gosset) bezeichnet wurde. Die Student-t-Verteilung für Stichprobenmittelwerte wird durch die Gleichung bestimmt: Der Zähler der Formel bedeutet die Abweichung des Stichprobenmittelwerts vom Mittelwert der gesamten Grundgesamtheit und der Nenner: – ist ein Indikator, der den Standardfehler der durchschnittlichen Stichprobenpopulation schätzt. Somit wird der Wert von t anhand der Abweichung des Stichprobenmittelwerts vom Grundgesamtheitsmittelwert gemessen, ausgedrückt in Anteilen des Stichprobenfehlers, angenommen als Einheit. Die Häufigkeitsmaxima der Normal- und T-Verteilung fallen zusammen, die Form der T-Verteilungskurve hängt jedoch vollständig von der Anzahl der Freiheitsgrade ab. Bei sehr kleinen Werten der Freiheitsgrade nimmt es die Form einer Kurve mit flacher Spitze an, und die durch die Kurve begrenzte Fläche ist größer als bei einer Normalverteilung und mit zunehmender Anzahl von Beobachtungen (n > 30), nähert sich die t-Verteilung der Normalverteilung und geht bei n = ∞ in diese über. Abbildung 1.1 zeigt die Differential- und Integralverteilung von t-Student bei 10 Freiheitsgraden. Abbildung 5.1 – Differential- (links) und integrale (rechts) t-Student-Verteilung Die t-Student-Verteilung ist wichtig, wenn Sie mit kleinen Stichproben arbeiten: Sie ermöglicht die Bestimmung eines Konfidenzintervalls, das den Mittelwert der Grundgesamtheit abdeckt , und testen Sie die eine oder andere Hypothese bezüglich der Allgemeinbevölkerung. In diesem Fall ist es nicht erforderlich, die Parameter der Grundgesamtheit zu kennen Und , reicht es aus, ihre Schätzungen μ und σ für eine bestimmte Stichprobengröße n zu haben. 5.1.1 Behrens-Fisher-Problem Das Testen der Hypothese über die allgemeinen Mittelwerte zweier Gruppen mit Normalverteilung und ungleichen Varianzen in der mathematischen Statistik wird als Behrens-Fisher-Problem bezeichnet und hat derzeit nur Näherungslösungen. Warum ist die Forderung nach Varianzgleichheit in verglichenen Gruppen so wichtig? Ohne näher auf dieses Problem einzugehen, stellen wir fest, dass die Verteilung des „berechneten T-Tests“ umso stärker von der Verteilung des „Student-T-Tests“ abweicht, je stärker sich die Varianzen und Stichprobengrößen voneinander unterscheiden. In diesem Fall haben sowohl das t-Kriterium selbst als auch ein Parameter dieser Verteilungen wie die Anzahl der Freiheitsgrade unterschiedliche Werte. Die Anzahl der Freiheitsgrade wiederum beeinflusst den Wert des erreichten (kritischen) Signifikanzniveaus (S< ...) определяемого для вычисленного значения t-критерия. Die Vernachlässigung der oben genannten Bedingungen für die Zulässigkeit der Verwendung des Student-T-Tests durch Forscher führt zu einer erheblichen Verzerrung der Ergebnisse der Prüfung von Hypothesen über die Gleichheit der Mittelwerte. Daher gibt es in Arbeiten, in denen die Prüfung von Hypothesen über die Gleichheit zweier Mittelwerte mit dem Student-t-Test durchgeführt wurde und die Kriterien für die Prüfung der Normalverteilung und der Varianzgleichheit nicht erwähnt werden, Grund zu der Annahme, dass dies der Fall ist Die Autoren haben dieses Kriterium falsch verwendet und daher sind ihre erklärten Schlussfolgerungen zweifelhaft. Ein weiterer häufiger Fehler ist die Verwendung des Student-t-Tests zum Testen von Hypothesen über die Gleichheit von drei oder mehr Gruppenmittelwerten. In diesem Fall ist es notwendig, das sogenannte allgemeine lineare Modell anzuwenden, das im Verfahren der einseitigen Varianzanalyse mit festen Effekten implementiert ist. Schauen wir uns die Funktionen des Student-T-Tests genauer an. Der t-Test wird am häufigsten in zwei Fällen verwendet. Im ersten Fall wird es verwendet, um die Hypothese über die Gleichheit der allgemeinen Mittelwerte zweier unabhängiger, nicht zusammenhängender Stichproben zu testen (der sogenannte Zwei-Stichproben-t-Test). Dabei gibt es eine Kontrollgruppe und eine Versuchsgruppe, bestehend aus unterschiedlichen Objekten, deren Anzahl in Gruppen unterschiedlich sein kann. Im zweiten Fall wird der sogenannte gepaarte t-Test verwendet, bei dem dieselbe Gruppe von Objekten numerisches Material generiert, um Hypothesen über Durchschnittswerte zu testen. Daher werden diese Stichproben als abhängig, verwandt bezeichnet. Beispielsweise wird die Anzahl der weißen Blutkörperchen bei gesunden Tieren und dann bei denselben Tieren nach einer bestimmten Strahlendosis gemessen. In beiden Fällen muss die Anforderung der Normalverteilung des untersuchten Merkmals in jeder der verglichenen Gruppen erfüllt sein. Die Dominanz des Student-t-Tests in der überwiegenden Mehrheit der Arbeiten spiegelt zwei wichtige Aspekte wider. Zweitens deutet dies auch darauf hin, dass diese Autoren keine Alternativen zu diesem Kriterium kennen oder diese nicht selbst anwenden können. Man kann ohne Übertreibung sagen, dass die gedankenlose Verwendung des Student-t-Tests in den meisten biologischen Arbeiten derzeit mehr schadet als nützt. 5.2 Fisher-Snedecor-F-Verteilung Nehmen wir zwei unabhängige Stichproben der Größe n 1 und n 2 aus einer normalverteilten Grundgesamtheit und berechnen die Varianzen Und mit Freiheitsgraden ν 1 = n –1 und ν 2 = n 2 –1, dann lässt sich das Varianzverhältnis bestimmen: Das Verhältnis der Varianzen wird so gewählt, dass es eine große Varianz im Zähler gibt und daher F ≥ 1 ist. Die Verteilung von F hängt nur von der Anzahl der Freiheitsgrade ν 1 und ν 2 ab (das Gesetz der F-Verteilung wurde von R. A. Fisher entdeckt). Wenn zwei verglichene Stichproben zufällig unabhängig von der Gesamtbevölkerung mit einem allgemeinen Durchschnitt sind, wird der tatsächliche Wert von F bestimmte Grenzen nicht überschreiten und den theoretischen Wert des Kriteriums F nicht überschreiten, das für die Daten ν 1 und ν 2 kritisch ist (F Tatsache< F теор). Если генеральные параметры сравниваемых групп различны, то F факт >F-Theor. Theoretische F-Werte für die Signifikanzniveaus 5 % und 1 % sind in der Tabelle angegeben, wobei nur die richtigen kritischen Punkte für F ≥ 1 aufgeführt sind, da es immer üblich ist, das Verhältnis der größeren Varianz zur kleineren zu ermitteln . Die aus der Verteilungsfunktion erhaltenen Kurven für alle möglichen Werte von F, insbesondere bei einer kleinen Anzahl von Beobachtungen, haben eine asymmetrische Form – einen langen „Schwanz“ großer Werte und eine große Konzentration kleiner F-Werte ( Abbildung 5.2). Abbildung 5.2 – Differential (links) und Integral (rechts) Beachten Sie, dass die Student-t-Verteilung ein Sonderfall der F-Verteilung mit der Anzahl der Freiheitsgrade ν 1 = 1 und ν 2 = ν ist, d. h. gleich der Anzahl der Freiheitsgrade für die t-Verteilung. In diesem Fall wird der folgende Zusammenhang zwischen F und t beobachtet: 5.3 χ 2 – Verteilung Viele tatsächliche Verteilungen entsprechen theoretischen Verteilungsmodellen (Normalverteilung, Binomialverteilung, Poissonverteilung). In der Praxis gibt es jedoch Verteilungen, die stark von der Normalverteilung abweichen. Um den Grad der Diskrepanz bzw. den Grad der Übereinstimmung zwischen den Zahlen tatsächlicher und theoretischer Verteilungen zu beurteilen, werden statistische Übereinstimmungskriterien eingeführt, beispielsweise das χ 2-Kriterium. Dieses Kriterium wird verwendet, um Probleme der statistischen Analyse zu lösen, beispielsweise um Hypothesen zu testen: über die Unabhängigkeit zweier Prinzipien, die der Gruppierung von Beobachtungsergebnissen aus derselben Population zugrunde liegen; über die Homogenität von Gruppen im Hinblick auf bestimmte identifizierbare Merkmale; zur Übereinstimmung zwischen den theoretischen und experimentellen Häufigkeitskurven. Das χ 2 -Kriterium kann sowohl als Übereinstimmungskriterium als auch als Unabhängigkeitskriterium, als Homogenitätskriterium bezeichnet werden. Das Verteilungsgesetz χ 2 (Chi-Quadrat) wurde von K. Pearson entdeckt. Aus der Chi-Quadrat-Funktion erhaltene Verteilungskurve: Dabei sind f die tatsächlichen und F die theoretischen Häufigkeiten der Anzahl der Probenobjekte. Sein Aussehen hängt stark von der Anzahl der Freiheitsgrade ab. Für eine kleine Anzahl von Freiheitsgraden ν ist die Kurve asymmetrisch (Abbildung 5.3), aber wenn ν zunimmt, nimmt die Asymmetrie ab und bei ν = ∞ wird die Kurve zur normalen Gaußschen Kurve. Die χ 2 -Verteilung sowie die t-Verteilung sind ein Sonderfall Abbildung 5.3 – Differential (links) und Integral (rechts) Fragen zur Selbstkontrolle 1 In welchen Fällen ist die Verwendung der Student-t-Verteilung der Normalverteilung vorzuziehen? 2 Welche Mengen müssen geschätzt werden, um die Student-t-Verteilung zu verwenden? 3 Was ist der Kern des Behrens-Fisher-Problems? 4 Wie wird die F-Verteilung für zwei unabhängige Stichproben aus einem Gesamtsatz von Variablen numerisch ausgedrückt? 5 Von welchen charakteristischen Werten von Zufallsvariablen hängt die F-Verteilung ab? 6 Welche Fragen kann der Wert des χ 2 -Kriteriums bei der statistischen Verarbeitung experimenteller Daten beantworten? THEMA 6 Grundlagen der mathematischen Statistik 6.1 Durchschnittswerte 6.2 Arithmetisches Mittel 6.3 Geometrisches Mittel 6.4 Harmonisches Mittel Das logarithmische Verteilungsmodell des berühmten englischen Mathematikers Fisher war der erste Versuch, den Zusammenhang zwischen der Artenzahl und der Individuenzahl dieser Arten zu beschreiben. Dieses Modell war vor allem in der entomologischen Forschung erfolgreich und wurde erstmals von Fisher als theoretisches Modell zur Beschreibung der Artenverteilung in Sammlungen verwendet. Dieses Modell und die Diversitätsstatistik waren Gegenstand einer detaillierten Studie von L. R. Taylor et al. Die Häufigkeitsverteilung von Arten für eine logarithmische Verteilung wird durch die folgende Reihenfolge beschrieben: wo X– die Anzahl der Arten, die durch ein Individuum repräsentiert werden, x 2 /2 – die Anzahl der Arten, die durch zwei Individuen repräsentiert werden usw. Das logarithmische Modell hat zwei Parameter und X. Dies bedeutet für eine Stichprobengröße N und Anzahl der Arten S Es gibt nur eine mögliche Häufigkeitsverteilung von Arten basierend auf ihrer relativen Häufigkeit, da sowohl als auch X sind Funktionen N Und S. Je größer die Stichprobe aus einer bestimmten Community ist, desto größer ist der Wert X und je kleiner der Anteil der Individuen ist, die einer Art angehören, die ein Individuum in der Stichprobe repräsentiert. Zwei Parameter S Und N(Gesamtzahl der Individuen) sind durch Abhängigkeit miteinander verbunden , Wo ist die Summe aller Individuen? N Zugehörigkeit S Typen: Das logarithmische Verteilungsmodell, das durch eine kleine Anzahl häufiger Arten und einen großen Anteil „seltener“ Arten gekennzeichnet ist, beschreibt am ehesten Gemeinschaften, deren Struktur durch einen oder mehrere Umweltfaktoren bestimmt wird. Wie Untersuchungen von Magharran in Irland zeigen, entspricht diese Reihe der Häufigkeitsverteilung von Bodenpflanzenarten in Nadelbäumen unter schlechten Lichtverhältnissen. 5.3.3. LognormalverteilungDie meisten Gemeinschaften weisen eine logarithmische Normalverteilung der Artenhäufigkeit auf, aber dieses Muster deutet im Allgemeinen auf eine große, reife und vielfältige Gemeinschaft hin. Diese Verteilung ist typisch für Systeme, bei denen der Wert einer bestimmten Variablen durch eine Vielzahl von Faktoren bestimmt wird. Dieses Modell wurde erstmals von Preston auf die Verteilung der Artenhäufigkeit angewendet. Anhand verschiedener empirischer Materialien zeigte er, dass die Artenhäufigkeit in großen Stichproben gemäß dem Lognormalgesetz verteilt ist. Nach der von ihm entwickelten Methodik werden Arten, deren Individuenzahl in Intervallen liegt, die durch geometrische Progressionszahlen begrenzt sind, in Häufigkeitsklassen eingeteilt. Preston zeichnete die Artenhäufigkeit auf einer Logarithmus-Basis-2-Skala (log 2) auf und nannte die resultierenden Klassen Oktaven. Zur Beschreibung des Modells können Sie jedoch jede logarithmische Basis verwenden. In der Grafik entspricht die Verteilung der Artenhäufigkeiten nach den so ermittelten Häufigkeitsklassen der bekannten, links abgeschnittenen Normalverteilungskurve im Häufigkeitsbereich seltener Arten. Die Verteilung wird normalerweise in der Form geschrieben: , Wo S R – die theoretische Anzahl der Arten in einer Oktave, angeordnet in R-Oktaven ab der modalen Oktave; S Mo– Anzahl der Arten in der Modaloktave; – Standardabweichung der theoretischen Log-Normalkurve, ausgedrückt in Oktaven. Reis. 5.3.2. Log-Normalverteilung Die logarithmische Normalverteilung wird durch eine symmetrische „Normale“, also eine glockenförmige Kurve, beschrieben (Abb. 5.3.2.). Wenn die entsprechenden Daten jedoch aus einer begrenzten Stichprobe stammen, ist die linke Seite der Kurve (d. h. seltene, nicht gemeldete Arten) unklar. Preston nannte diesen Schnittpunkt auf der linken Seite die „Vorhanglinie“. Die „Vorhanglinie“ kann sich mit zunehmender Stichprobengröße nach links verschieben. Dies ist in der Abbildung durch einen Pfeil gekennzeichnet. Bei den meisten Beispielen wird nur der Teil der Kurve rechts vom Modus ausgedrückt. Nur mit riesigen Datenmengen, die in riesigen biogeografischen Gebieten gesammelt werden, kann die vollständige Kurve verfolgt werden. S Die -förmige Kurve zeigt die komplexe Natur der Differenzierung und Nischenüberlappung. Die meisten Arten in natürlichen offenen Ökosystemen konkurrieren eher um Ressourcen als in direkter Konkurrenz; Viele Anpassungen ermöglichen die Aufteilung von Nischen ohne Konkurrenzausschluss aus dem Lebensraum. Dieses Muster ist am wahrscheinlichsten für ungestörte Gemeinschaften.
Logarithmische Verteilung in der Wahrscheinlichkeitstheorie – eine Klasse diskreter Verteilungen. Die logarithmische Verteilung wird in einer Vielzahl von Anwendungen verwendet, darunter in der mathematischen Genetik und Physik. DefinitionLassen Sie die Verteilung einer Zufallsvariablen ist durch die Wahrscheinlichkeitsfunktion gegeben: , Wo |
Lesen: |
---|
Neu
- Aliexpress-Mobilanwendung
- QWERTY- und AZERTY-Tastaturlayout Spezielle Versionen der Dvorak-Tastatur
- Insel Sao Vicente Insel Sao Vicente
- Die Regeln, die wir brechen. Ist es in Ordnung, die Ellbogen auf den Tisch zu legen?
- Welche USB-Sticks sind die zuverlässigsten und schnellsten?
- Anschließen eines Laptops an einen Fernseher über ein USB-Kabel zum Anschließen eines Laptops an einen VGA-Fernseher
- Änderung der Steam-Oberfläche – von einfachen Bildern bis zur gesamten Darstellung auf dem Bildschirm Neues Steam-Design
- So kündigen Sie ein Megogo-Abonnement im Fernsehen: detaillierte Anleitung So kündigen Sie Megogo-Abonnements
- So partitionieren Sie eine Festplatte mit installiertem Windows, ohne Daten zu verlieren. Partitionieren Sie die Festplatte 7
- Warum Verlage nicht alle Seiten bearbeiten können