Acasă - Calculatoare
Distribuție logaritmică. Vedeți paginile în care este menționat termenul de distribuție log-normală

Variabila aleatoare Y are o logaritmică distributie normala cu parametrii μ și σ, dacă variabila aleatoare X = lnY are o distribuție normală cu aceiași parametri μ și σ. Cunoscând natura relației dintre variabilele X și Y, putem construi cu ușurință un grafic de densitate de probabilitate a unei variabile aleatoare cu o distribuție lognormală (Figura 4.2).

Figura 4.2 – Curbele de densitate ale distribuției lognormale pentru diferite valori ale parametrilor μ și σ

Dacă o variabilă aleatoare X are o funcție de densitate de probabilitate definită prin formula (4.6) și dacă X = lnY, atunci:

Unde avem pentru y > 0:

Din definiție rezultă că o variabilă aleatorie supusă unei distribuții lognormale poate lua numai valori pozitive. După cum se arată în figura 4.2, curbele funcției f(y) au o asimetrie din stânga, care este mai puternică, cu cât valorile parametrilor μ și σ sunt mai mari. Fiecare curbă are un maxim și este definită pentru toate valorile pozitive ale lui y.

Calcularea așteptărilor matematice și a varianței unei variabile aleatoare cu o distribuție lognormală nu este deosebit de dificilă:

Prin substituții și introducerea de noi variabile în integralele 4.15 și 4.16, obținem:

În general, pentru a calcula probabilitatea ca o variabilă aleatoare Y cu o distribuție lognormală și densitate f(y, μ, σ) să ia o valoare în intervalul (a, b), ar trebui să ia integrala:

Cu toate acestea, în practică este mai convenabil să se folosească faptul că logaritmul variabilei aleatoare Y are o distribuție normală. Probabilitatea ca a ≤ Y ≤ b este echivalentă cu probabilitatea ca
lna ≤ lnY ≤ lnb.

Să calculăm probabilitatea ca o variabilă aleatoare cu distribuție logaritmică μ = 1, σ = 0,5 să ia o valoare în intervalul (2, 5). Avem:

Din tabelele de logaritmi găsim ln2 = 0,6932 și ln5 = 1,6094.

Notând lnY = X, putem scrie:

Mai mult, variabila aleatoare X este supusă unei distribuții normale cu o valoare medie μ = 1 și o abatere standard σ = 0,5. Acum probabilitatea dorită poate fi calculată cu ușurință folosind tabelele funcției integrale a distribuției normale:

Întrebări pentru autocontrol

1 Definiția distribuției dreptunghiulare.

2 Graficul densității probabilității unei variabile aleatoare cu distribuție dreptunghiulară

3 Sensul fundamental al distribuției dreptunghiulare.

4 Aşteptareși varianța unei variabile aleatoare într-o distribuție dreptunghiulară.

5 Rolul distribuției normale în statistica matematică.

6 Care este distribuția normală și cum este legată de binom?

7 Graficul densității de probabilitate a unei variabile aleatoare cu distribuție normală.

8 Ce parametri statistici pot fi utilizați pentru a defini o distribuție normală?

9 De ce este distribuția normală continuă?

10 Ecuația unei curbe normale.

11 Ce este abaterea normalizată?

12 Ecuația curbei de distribuție normală în formă normalizată.

13 Ce valori ale lui μ și σ caracterizează o populație normală în formă normalizată?

14 Ce proporție din datele eșantionului se încadrează în limitele ±1σ, ±2σ, ±3σ?

15 Ce arată tabelul cu integrala probabilității normale?

16 Ecuația unei curbe lognormale.

17 Graficul densității probabilității unei variabile aleatoare cu o distribuție lognormală.

18 Ce transformări trebuie efectuate pentru a obține o distribuție normală dintr-o distribuție lognormală?

19 Ce parametri statistici definesc o distribuție lognormală?

TEMA 5 Distribuția parametrilor de eșantionare

5,1 t – Repartizarea elevilor

5.2 Distribuția Fisher–Snedecor F

5.3 χ 2 – distribuție

5,1 t – Repartizarea elevilor

Legea distribuției normale apare atunci când numărul de caracteristici este n > 20–30. Cu toate acestea, experimentatorul efectuează adesea un număr limitat de măsurători și își bazează concluziile pe eșantioane mici. Cu un număr mic de observații, rezultatele sunt de obicei apropiate și rareori apar abateri mari. Acest lucru poate fi explicat cu ușurință prin legea distribuției normale, conform căreia probabilitatea abaterilor mici este mai mare decât a abaterilor mari. Astfel, probabilitatea ca abaterile să depășească ±2σ în valoare absolută este de 0,05, sau un caz la 20 de măsurători, iar abaterile ± 3σ – 0,01, sau un caz la 100.

Dacă experimentul de teren se desfășoară, de exemplu, în 4-6 repetări, atunci este firesc să ne așteptăm că nu vor exista abateri foarte mari între citirile de randament pe parcele paralele. Prin urmare, abaterea standard s calculată dintr-un eșantion mic va fi în cele mai multe cazuri mai mică decât cea din întreaga populație. Prin urmare, în aceste cazuri, nu vă puteți baza pe criteriile normale de distribuție în concluziile dvs.

De la începutul secolului al XX-lea, o nouă direcție a început să se dezvolte în statistica matematică, care poate fi numită statistică a eșantioanelor mici. Distribuția t, descoperită în 1908 de statisticianul și chimistul englez W. Gosset, care a fost numită distribuția Student (student-student englez, pseudonimul lui W. Gosset), a avut cea mai mare importanță practică pentru munca experimentală.

Distribuția t a lui Student pentru mediile eșantionului este determinată de egalitatea:

Numărătorul formulei înseamnă abaterea mediei eșantionului de la media întregii populații, iar numitorul:

– este un indicator care estimează eroarea standard a populației medii din eșantion.

Astfel, valoarea lui t este măsurată prin abaterea mediei eșantionului de la media populației, exprimată în cote ale erorii de eșantionare luate ca unitate.

Maximele de frecvență ale distribuției normale și t coincid, dar forma curbei distribuției t depinde în întregime de numărul de grade de libertate. La valori foarte mici ale gradelor de libertate, acesta ia forma unei curbe cu vârf plat, iar aria delimitată de curbă este mai mare decât la o distribuție normală și cu o creștere a numărului de observații (n ​​> 30), distribuția t se apropie de normal și se transformă în ea la n = ∞.

Figura 1.1 prezintă distribuția diferențială și integrală a t-Student la 10 grade de libertate.

Figura 5.1 – Distribuția t-Student diferențială (stânga) și integrală (dreapta).

Distribuția t-Student este importantă atunci când lucrați cu eșantioane mici: vă permite să determinați un interval de încredere care acoperă media populației , și testați una sau alta ipoteză privind populația generală. În acest caz, nu este nevoie să cunoașteți parametrii populației Şi , este suficient să aveți estimările lor μ și σ pentru o anumită dimensiune a eșantionului n.

5.1.1 Problema Behrens–Fisher

Testarea ipotezei despre mediile generale a două grupuri cu o distribuție normală și varianțe inegale în statistica matematică se numește problema Behrens-Fisher și are în prezent doar soluții aproximative. De ce este atât de importantă cerința de egalitate a variațiilor în grupurile comparate? Fără a intra în detalii despre această problemă, observăm că, cu cât variațiile și dimensiunile eșantionului diferă între ele, cu atât distribuția „testului t calculat” diferă de distribuția „testului t al studentului”. În acest caz, atât criteriul t în sine, cât și un astfel de parametru al acestor distribuții precum numărul de grade de libertate au valori diferite. La rândul său, numărul de grade de libertate afectează valoarea nivelului de semnificație (critic) atins (p.< ...) определяемого для вычисленного значения t-критерия.

Neglijarea de către cercetători a condițiilor de mai sus pentru admisibilitatea utilizării testului t Student duce la o denaturare semnificativă a rezultatelor testării ipotezelor despre egalitatea mijloacelor. Prin urmare, în lucrările în care testarea ipotezelor despre egalitatea a două medii a fost efectuată utilizând testul t Student și nu există nicio mențiune despre criteriile de testare a normalității distribuției și a egalității varianțelor, există motive pentru a presupune că autorii au folosit incorect acest criteriu și, prin urmare, dubiul concluziilor lor declarate.

Alte greseala comuna– aplicarea testului t al lui Student pentru a testa ipoteze despre egalitatea a trei sau mai multe medii de grup. În acest caz, este necesar să se aplice așa-numitul model liniar general, implementat în procedura de analiză unidirecțională a varianței cu efecte fixe.

Să aruncăm o privire mai atentă la caracteristicile utilizării testului t Student. Testul t este folosit cel mai adesea în două cazuri. În primul caz, este folosit pentru a testa ipoteza despre egalitatea mediilor generale a două eșantioane independente, neînrudite (așa-numitul test t cu două eșantioane). În acest caz, există un grup de control și un grup experimental, format din diferite obiecte, al căror număr în grupuri poate fi diferit. În al doilea caz, se folosește așa-numitul test t pereche, când același grup de obiecte generează material numeric pentru a testa ipotezele despre medii. Prin urmare, aceste mostre se numesc dependente, legate. De exemplu, numărul de celule albe din sânge este măsurat la animale sănătoase și apoi la aceleași animale după expunerea la o anumită doză de radiații. În ambele cazuri, trebuie îndeplinită cerința de distribuție normală a caracteristicii studiate în fiecare dintre loturile comparate. Dominanța testului t Student în marea majoritate a lucrărilor reflectă două aspecte importante.

În al doilea rând, acest lucru sugerează, de asemenea, că acești autori nu cunosc alternative la acest criteriu sau nu sunt capabili să le folosească ei înșiși. Se poate spune fără exagerare că în prezent, utilizarea necugetă a testului t al lui Student în majoritatea lucrărilor biologice face mai mult rău decât bine.

5.2 Distribuția Fisher–Snedecor F

Dacă luăm două eșantioane independente de volum n 1 și n 2 dintr-o populație distribuită normal și calculăm varianțele Şi cu grade de libertate ν 1 = n –1 și ν 2 = n 2 –1, atunci se poate determina raportul de varianță:

Raportul varianțelor este luat astfel încât să existe o variație mare în numărător și, prin urmare, F ≥ 1.

Distribuția lui F depinde doar de numărul de grade de libertate ν 1 și ν 2 (legea distribuției F a fost descoperită de R. A. Fisher). Când două eșantioane comparate sunt aleatorii independente de populația generală cu o medie generală, atunci valoarea reală a lui F nu va depăși anumite limite și nu va depăși valoarea teoretică a criteriului F, critic pentru datele ν 1 și ν 2 (F fapt< F теор). Если генеральные параметры сравниваемых групп различны, то F факт >F teor. Valorile teoretice F pentru nivelurile de semnificație de 5% și 1% sunt date în tabel, unde sunt tabulate numai punctele critice corecte pentru F ≥ 1, deoarece este întotdeauna obișnuit să se găsească raportul dintre variația mai mare și cea mai mică. .

Curbele obținute din funcția de distribuție pentru toate valorile posibile ale lui F, în special cu un număr mic de observații, au o formă asimetrică - o „coadă” lungă de valori mari și o concentrație mare de valori F mici ( Figura 5.2).

Figura 5.2 – Diferenţial (stânga) şi integral (dreapta)
Distribuție Fisher–Snedecor F

Rețineți că distribuția t Student este un caz special al distribuției F cu numărul de grade de libertate ν 1 = 1 și ν 2 = ν, adică egal cu numărul de grade de libertate pentru distribuția t. În acest caz, se observă următoarea relație între F și t:

5.3 χ 2 – distribuție

Multe distribuții reale corespund modelelor de distribuție teoretice (normale, binomiale, Poisson). Cu toate acestea, în practică există distribuții foarte diferite de cele normale. Pentru a evalua gradul de discrepanță sau gradul de acord între numerele distribuțiilor reale și teoretice, sunt introduse criterii statistice de acord, de exemplu, criteriul χ 2. Acest criteriu este utilizat pentru rezolvarea problemelor analiza statistica, de exemplu, pentru a testa ipoteze: despre independența a două principii care stau la baza grupării rezultatelor observației de la o singură populație; despre omogenitatea grupurilor în raport cu anumite caracteristici identificabile; asupra acordului dintre curbele de abundenţă teoretică şi experimentală. Criteriul χ 2 poate fi numit atât criteriul acordului, cât și criteriul independenței, criteriul omogenității. Legea distribuției χ 2 (chi-pătrat) a fost descoperită de K. Pearson. Curba de distribuție obținută din funcția chi pătrat:

unde f este valoarea reală și F sunt frecvențele teoretice ale numărului de obiecte eșantion. Aspectul său depinde puternic de numărul de grade de libertate. Pentru un număr mic de grade de libertate ν, curba este asimetrică (Figura 5.3), dar pe măsură ce ν crește, asimetria scade și la ν = ∞ curba devine Gaussiană normală.

Distribuția χ 2, precum și distribuția t, este un caz special
F – distribuții pentru ν 1 = ν și ν 2 = ∞.

Figura 5.3 – Diferenţial (stânga) şi integral (dreapta)
χ 2 – distribuție

Întrebări pentru autocontrol

1 În ce cazuri este de preferat să folosiți distribuția t Student decât distribuția normală?

2 Ce cantități trebuie estimate pentru a utiliza distribuția t Student?

3 Care este esența problemei Behrens-Fisher?

4 Cum se exprimă numeric distribuția F pentru doi mostre independente din setul total de variabile?

5 De ce valori caracteristice ale variabilelor aleatoare depinde distribuția F?

6 La ce întrebări poate răspunde valoarea criteriului χ 2 în timpul prelucrării statistice a datelor experimentale?

TEMA 6 Fundamentele statisticii matematice

6.1 Valori medii

6.2 Media aritmetică

6.3 Media geometrică

6.4 Medie armonică

Variabila aleatoare Y are o distribuție lognormală cu parametrii μ și σ dacă variabila aleatoare X = lnY are o distribuție normală cu aceiași parametri μ și σ. Cunoscând natura relației dintre variabilele X și Y, putem construi cu ușurință un grafic de densitate de probabilitate a unei variabile aleatoare cu o distribuție lognormală (Figura 4.2).

Figura 4.2 – Curbele de densitate ale distribuției lognormale pentru diferite valori ale parametrilor μ și σ

Dacă o variabilă aleatoare X are o funcție de densitate de probabilitate definită prin formula (4.6) și dacă X = lnY, atunci:

Unde avem pentru y > 0:

Din definiție rezultă că o variabilă aleatorie supusă unei distribuții lognormale poate lua numai valori pozitive. După cum se arată în figura 4.2, curbele funcției f(y) au o asimetrie din stânga, care este mai puternică, cu cât valorile parametrilor μ și σ sunt mai mari. Fiecare curbă are un maxim și este definită pentru toate valorile pozitive ale lui y.

Calcularea așteptărilor matematice și a varianței unei variabile aleatoare cu o distribuție lognormală nu este deosebit de dificilă:

Prin substituții și introducerea de noi variabile în integralele 4.15 și 4.16, obținem:

În general, pentru a calcula probabilitatea ca o variabilă aleatoare Y cu o distribuție lognormală și densitate f(y, μ, σ) să ia o valoare în intervalul (a, b), ar trebui să ia integrala:

Cu toate acestea, în practică este mai convenabil să se folosească faptul că logaritmul variabilei aleatoare Y are o distribuție normală. Probabilitatea ca a ≤ Y ≤ b este echivalentă cu probabilitatea ca
lna ≤ lnY ≤ lnb.

Să calculăm probabilitatea ca o variabilă aleatoare cu distribuție logaritmică μ = 1, σ = 0,5 să ia o valoare în intervalul (2, 5). Avem:

Din tabelele de logaritmi găsim ln2 = 0,6932 și ln5 = 1,6094.

Notând lnY = X, putem scrie:

Mai mult, variabila aleatoare X este supusă unei distribuții normale cu o valoare medie μ = 1 și o abatere standard σ = 0,5. Acum probabilitatea dorită poate fi calculată cu ușurință folosind tabelele funcției integrale a distribuției normale:

Întrebări pentru autocontrol

1 Definiția distribuției dreptunghiulare.

2 Graficul densității probabilității unei variabile aleatoare cu distribuție dreptunghiulară

3 Sensul fundamental al distribuției dreptunghiulare.

4 Așteptarea și varianța unei variabile aleatoare într-o distribuție dreptunghiulară.



5 Rolul distribuției normale în statistica matematică.

6 Care este distribuția normală și cum este legată de binom?

7 Graficul densității de probabilitate a unei variabile aleatoare cu distribuție normală.

8 Ce parametri statistici pot fi utilizați pentru a defini o distribuție normală?

9 De ce este distribuția normală continuă?

10 Ecuația unei curbe normale.

11 Ce este abaterea normalizată?

12 Ecuația curbei de distribuție normală în formă normalizată.

13 Ce valori ale lui μ și σ caracterizează o populație normală în formă normalizată?

14 Ce proporție din datele eșantionului se încadrează în limitele ±1σ, ±2σ, ±3σ?

15 Ce arată tabelul cu integrala probabilității normale?

16 Ecuația unei curbe lognormale.

17 Graficul densității probabilității unei variabile aleatoare cu o distribuție lognormală.

18 Ce transformări trebuie efectuate pentru a obține o distribuție normală dintr-o distribuție lognormală?

19 Ce parametri statistici definesc o distribuție lognormală?

TEMA 5 Distribuția parametrilor de eșantionare

5,1 t – Repartizarea elevilor

5.2 Distribuția Fisher–Snedecor F

5.3 χ 2 – distribuție

5,1 t – Repartizarea elevilor

Legea distribuției normale apare atunci când numărul de caracteristici este n > 20–30. Cu toate acestea, experimentatorul efectuează adesea un număr limitat de măsurători și își bazează concluziile pe eșantioane mici. Cu un număr mic de observații, rezultatele sunt de obicei apropiate și rareori apar abateri mari. Acest lucru poate fi explicat cu ușurință prin legea distribuției normale, conform căreia probabilitatea abaterilor mici este mai mare decât a abaterilor mari. Astfel, probabilitatea ca abaterile să depășească ±2σ în valoare absolută este de 0,05, sau un caz la 20 de măsurători, iar abaterile ± 3σ – 0,01, sau un caz la 100.

Dacă experimentul de teren se desfășoară, de exemplu, în 4-6 repetări, atunci este firesc să ne așteptăm că nu vor exista abateri foarte mari între citirile de randament pe parcele paralele. Prin urmare, abaterea standard s calculată dintr-un eșantion mic va fi în cele mai multe cazuri mai mică decât cea din întreaga populație. Prin urmare, în aceste cazuri, nu vă puteți baza pe criteriile normale de distribuție în concluziile dvs.

De la începutul secolului al XX-lea, o nouă direcție a început să se dezvolte în statistica matematică, care poate fi numită statistică a eșantioanelor mici. Distribuția t, descoperită în 1908 de statisticianul și chimistul englez W. Gosset, care a fost numită distribuția Student (student-student englez, pseudonimul lui W. Gosset), a avut cea mai mare importanță practică pentru munca experimentală.

Distribuția t a lui Student pentru mediile eșantionului este determinată de egalitatea:

Numărătorul formulei înseamnă abaterea mediei eșantionului de la media întregii populații, iar numitorul:

– este un indicator care estimează eroarea standard a populației medii din eșantion.

Astfel, valoarea lui t este măsurată prin abaterea mediei eșantionului de la media populației, exprimată în cote ale erorii de eșantionare luate ca unitate.

Maximele de frecvență ale distribuției normale și t coincid, dar forma curbei distribuției t depinde în întregime de numărul de grade de libertate. La valori foarte mici ale gradelor de libertate, acesta ia forma unei curbe cu vârf plat, iar aria delimitată de curbă este mai mare decât la o distribuție normală și cu o creștere a numărului de observații (n ​​> 30), distribuția t se apropie de normal și se transformă în ea la n = ∞.

Figura 1.1 prezintă distribuția diferențială și integrală a t-Student la 10 grade de libertate.

Figura 5.1 – Distribuția t-Student diferențială (stânga) și integrală (dreapta).

Distribuția t-Student este importantă atunci când lucrați cu eșantioane mici: vă permite să determinați un interval de încredere care acoperă media populației , și testați una sau alta ipoteză privind populația generală. În acest caz, nu este nevoie să cunoașteți parametrii populației Şi , este suficient să aveți estimările lor μ și σ pentru o anumită dimensiune a eșantionului n.

5.1.1 Problema Behrens–Fisher

Testarea ipotezei despre mediile generale a două grupuri cu o distribuție normală și varianțe inegale în statistica matematică se numește problema Behrens-Fisher și are în prezent doar soluții aproximative. De ce este atât de importantă cerința de egalitate a variațiilor în grupurile comparate? Fără a intra în detalii despre această problemă, observăm că, cu cât variațiile și dimensiunile eșantionului diferă între ele, cu atât distribuția „testului t calculat” diferă de distribuția „testului t al studentului”. În acest caz, atât criteriul t în sine, cât și un astfel de parametru al acestor distribuții precum numărul de grade de libertate au valori diferite. La rândul său, numărul de grade de libertate afectează valoarea nivelului de semnificație (critic) atins (p.< ...) определяемого для вычисленного значения t-критерия.

Neglijarea de către cercetători a condițiilor de mai sus pentru admisibilitatea utilizării testului t Student duce la o denaturare semnificativă a rezultatelor testării ipotezelor despre egalitatea mijloacelor. Prin urmare, în lucrările în care testarea ipotezelor despre egalitatea a două medii a fost efectuată utilizând testul t Student și nu există nicio mențiune despre criteriile de testare a normalității distribuției și a egalității varianțelor, există motive pentru a presupune că autorii au folosit incorect acest criteriu și, prin urmare, dubiul concluziilor lor declarate.

O altă greșeală comună este utilizarea testului t al lui Student pentru a testa ipotezele despre egalitatea a trei sau mai multe medii de grup. În acest caz, este necesar să se aplice așa-numitul model liniar general, implementat în procedura de analiză unidirecțională a varianței cu efecte fixe.

Să aruncăm o privire mai atentă la caracteristicile utilizării testului t Student. Testul t este folosit cel mai adesea în două cazuri. În primul caz, este folosit pentru a testa ipoteza despre egalitatea mediilor generale a două eșantioane independente, neînrudite (așa-numitul test t cu două eșantioane). În acest caz, există un grup de control și un grup experimental, format din diferite obiecte, al căror număr în grupuri poate fi diferit. În al doilea caz, se folosește așa-numitul test t pereche, când același grup de obiecte generează material numeric pentru a testa ipotezele despre medii. Prin urmare, aceste mostre se numesc dependente, legate. De exemplu, numărul de celule albe din sânge este măsurat la animale sănătoase și apoi la aceleași animale după expunerea la o anumită doză de radiații. În ambele cazuri, trebuie îndeplinită cerința de distribuție normală a caracteristicii studiate în fiecare dintre loturile comparate. Dominanța testului t Student în marea majoritate a lucrărilor reflectă două aspecte importante.

În al doilea rând, acest lucru sugerează, de asemenea, că acești autori nu cunosc alternative la acest criteriu sau nu sunt capabili să le folosească ei înșiși. Se poate spune fără exagerare că în prezent, utilizarea necugetă a testului t al lui Student în majoritatea lucrărilor biologice face mai mult rău decât bine.

5.2 Distribuția Fisher–Snedecor F

Dacă luăm două eșantioane independente de volum n 1 și n 2 dintr-o populație distribuită normal și calculăm varianțele Şi cu grade de libertate ν 1 = n –1 și ν 2 = n 2 –1, atunci se poate determina raportul de varianță:

Raportul varianțelor este luat astfel încât să existe o variație mare în numărător și, prin urmare, F ≥ 1.

Distribuția lui F depinde doar de numărul de grade de libertate ν 1 și ν 2 (legea distribuției F a fost descoperită de R. A. Fisher). Când două eșantioane comparate sunt aleatorii independente de populația generală cu o medie generală, atunci valoarea reală a lui F nu va depăși anumite limite și nu va depăși valoarea teoretică a criteriului F, critic pentru datele ν 1 și ν 2 (F fapt< F теор). Если генеральные параметры сравниваемых групп различны, то F факт >F teor. Valorile teoretice F pentru nivelurile de semnificație de 5% și 1% sunt date în tabel, unde sunt tabulate numai punctele critice corecte pentru F ≥ 1, deoarece este întotdeauna obișnuit să se găsească raportul dintre variația mai mare și cea mai mică. .

Curbele obținute din funcția de distribuție pentru toate valorile posibile ale lui F, în special cu un număr mic de observații, au o formă asimetrică - o „coadă” lungă de valori mari și o concentrație mare de valori F mici ( Figura 5.2).

Figura 5.2 – Diferenţial (stânga) şi integral (dreapta)
Distribuție Fisher–Snedecor F

Rețineți că distribuția t Student este un caz special al distribuției F cu numărul de grade de libertate ν 1 = 1 și ν 2 = ν, adică egal cu numărul de grade de libertate pentru distribuția t. În acest caz, se observă următoarea relație între F și t:

5.3 χ 2 – distribuție

Multe distribuții reale corespund modelelor de distribuție teoretice (normale, binomiale, Poisson). Cu toate acestea, în practică există distribuții foarte diferite de cele normale. Pentru a evalua gradul de discrepanță sau gradul de acord între numerele distribuțiilor reale și teoretice, sunt introduse criterii statistice de acord, de exemplu, criteriul χ 2. Acest criteriu este utilizat pentru rezolvarea problemelor de analiză statistică, de exemplu, pentru a testa ipoteze: despre independența a două principii care stau la baza grupării rezultatelor observației de la aceeași populație; despre omogenitatea grupurilor în raport cu anumite caracteristici identificabile; asupra acordului dintre curbele de abundenţă teoretică şi experimentală. Criteriul χ 2 poate fi numit atât criteriul acordului, cât și criteriul independenței, criteriul omogenității. Legea distribuției χ 2 (chi-pătrat) a fost descoperită de K. Pearson. Curba de distribuție obținută din funcția chi pătrat:

unde f este valoarea reală și F sunt frecvențele teoretice ale numărului de obiecte eșantion. Aspectul său depinde puternic de numărul de grade de libertate. Pentru un număr mic de grade de libertate ν, curba este asimetrică (Figura 5.3), dar pe măsură ce ν crește, asimetria scade și la ν = ∞ curba devine Gaussiană normală.

Distribuția χ 2, precum și distribuția t, este un caz special
F – distribuții pentru ν 1 = ν și ν 2 = ∞.

Figura 5.3 – Diferenţial (stânga) şi integral (dreapta)
χ 2 – distribuție

Întrebări pentru autocontrol

1 În ce cazuri este de preferat să folosiți distribuția t Student decât distribuția normală?

2 Ce cantități trebuie estimate pentru a utiliza distribuția t Student?

3 Care este esența problemei Behrens-Fisher?

4 Cum este exprimată numeric distribuția F pentru două eșantioane independente dintr-un set total de variabile?

5 De ce valori caracteristice ale variabilelor aleatoare depinde distribuția F?

6 La ce întrebări poate răspunde valoarea criteriului χ 2 în timpul prelucrării statistice a datelor experimentale?

TEMA 6 Fundamentele statisticii matematice

6.1 Valori medii

6.2 Media aritmetică

6.3 Media geometrică

6.4 Medie armonică

Modelul de distribuție logaritmică al celebrului matematician englez Fisher a fost prima încercare de a descrie relația dintre numărul de specii și numărul de indivizi ai acestor specii. Acest model a avut un succes deosebit în cercetarea entomologică și a fost folosit pentru prima dată de Fisher ca model teoretic pentru a descrie distribuția speciilor în colecții. Acest model și statisticile privind diversitatea au făcut obiectul unui studiu detaliat al lui L. R. Taylor și colab.

Distribuția de frecvență a speciilor pentru o distribuție logaritmică este descrisă de următoarea secvență:

unde  X– numărul de specii reprezentat de un individ, x 2 /2 – numărul de specii reprezentat de doi indivizi etc.

Modelul logaritmic are doi parametri  și x. Aceasta înseamnă că pentru o dimensiune a eșantionului Nși numărul de specii S există o singură distribuție posibilă de frecvență a speciilor pe baza abundenței lor relative, deoarece atât  cât și X sunt functii NŞi S. Cu cât eșantionul extras dintr-o anumită comunitate este mai mare, cu atât valoarea este mai mare X iar proporţia indivizilor aparţinând speciilor reprezentate de un individ din eşantion este mai mică. Doi parametri SŞi N(numărul total de indivizi) sunt interconectate prin dependență
, unde este indicele de diversitate, care poate fi obținut din ecuația:

,

unde este suma tuturor indivizilor N aparținând S tipuri:

Modelul de distribuție logaritmică, caracterizat printr-un număr mic de specii abundente și o proporție mare de specii „rare”, este cel mai probabil să descrie comunități a căror structură este determinată de unul sau câțiva factori de mediu.

După cum arată cercetările efectuate de Magharran în Irlanda, această serie corespunde distribuției abundenței speciilor de plante de pământ în culturile de conifere în condiții de lumină scăzută.

5.3.3. Distribuție lognormală

Majoritatea comunităților prezintă o distribuție log-normală a abundenței speciilor, dar acest model indică în general o comunitate mare, matură și diversă. Această distribuție este tipică pentru sisteme când valoarea unei anumite variabile este determinată de un număr mare de factori.

Acest model a fost aplicat pentru prima dată la distribuția abundenței speciilor de către Preston. Folosind o varietate de materiale empirice, el a arătat că frecvențele speciilor din eșantioane mari sunt distribuite în conformitate cu legea lognormală. Conform metodologiei pe care a dezvoltat-o, speciile cu numărul de indivizi cuprinse în intervale care sunt limitate de numere de progresie geometrică sunt grupate în clase de frecvență. Preston a trasat abundența speciilor pe o scară de bază logaritmică 2 (log 2) și a numit clasele rezultate octave. Dar pentru a descrie modelul, puteți folosi orice bază logaritmică. În grafic, distribuția frecvențelor speciilor în funcție de clasele de abundență astfel obținute corespunde binecunoscutei curbe de distribuție normală, trunchiată în stânga, în intervalul de frecvență al speciilor rare.

Distribuția este de obicei scrisă sub forma:

, Unde

S R – numărul teoretic de specii dintr-o octavă situată în R octave din octava modală; S lu– numărul de specii în octava modală; – abaterea standard a curbei log-normale teoretice, exprimată în număr de octave.

Orez. 5.3.2. Distribuție log-normală

Distribuția log-normală este descrisă printr-o „normală” simetrică, adică o curbă în formă de clopot (Fig. 5.3.2.). Cu toate acestea, dacă datele căreia îi corespunde provin dintr-un eșantion limitat, atunci partea stângă a curbei (adică specii rare, neraportate) va fi neclară. Preston a numit acest punct de trunchiere din stânga „linia cortinei”. „Linia cortinei” se poate deplasa spre stânga pe măsură ce dimensiunea eșantionului crește. Este indicat de o săgeată în figură. Pentru majoritatea eșantioanelor, este exprimată doar partea curbei din dreapta modului. Doar cu cantități mari de date colectate pe vaste zone biogeografice poate fi urmărită întreaga curbă. S Curba în formă de - indică natura complexă a diferențierii și a suprapunerii nișei. Majoritatea speciilor din ecosistemele naturale deschise există mai degrabă în competiție pentru resurse decât în ​​competiție directă; Multe adaptări fac posibilă împărțirea nișelor fără excluderea competitivă din habitat. Acest model este cel mai probabil pentru comunitățile netulburate.

Funcția de probabilitate
Funcția de distribuție
Desemnare \mathrm(Log)(p)
Opțiuni 0 < p < 1
Purtător k \în \(1,2,3,\puncte\)
Funcția de probabilitate \frac(-1)(\ln(1-p)) \; \frac(\;p^k)(k)
Funcția de distribuție 1 + \frac(\Beta_p(k+1,0))(\ln(1-p))
Aşteptare \frac(-1)(\ln(1-p)) \; \frac(p)(1-p)
Median
Modă 1
Dispersia -p \;\frac(p + \ln(1-p))((1-p)^2\,\ln^2(1-p))
Coeficient de asimetrie
Coeficientul de kurtoză
Entropia diferenţială
Funcția generatoare a momentelor \frac(\ln(1 - p\,\exp(t)))(\ln(1-p))
Funcția caracteristică \frac(\ln(1 - p\,\exp(i\,t)))(\ln(1-p))

Distribuție logaritmicăîn teoria probabilității – o clasă de distribuții discrete. Distribuția logaritmică este utilizată într-o varietate de aplicații, inclusiv în genetică și fizică matematică.

Definiţie

Fie distribuția unei variabile aleatoare Y este dat de funcția de probabilitate:

p_Y(k) \equiv \mathbb(P)(Y=k) = -\frac(1)(\ln(1-p)) \frac(p^k)(k),\; k=1,2,3,\ldots,

Unde 0

Atunci ei spun asta Y are o distribuție logaritmică cu parametrul p. Ei scriu: Y\sim\mathrm(Log)(p).

Funcția de distribuție a variabilelor aleatoare Y constantă pe bucăți cu salturi în puncte naturale:

F_Y(y) = \left\(

\begin(matrix) 0 și y< 1 & \\ 1 + \frac{\mathrm{B}_p(k+1,0)}{\ln (1-p)},\; & y \in ,\; 0

\sum\limits_(k=1)^(\infty)p_Y(k) = 1.

Momente

Funcția generatoare a momentelor unei variabile aleatoare Y\sim\mathrm(Log)(p) este dat de formula

M_Y(t) = \frac(\ln\left)(\ln),

\mathbb(E)[Y] = - \frac(1)(\ln(1-p)) \frac(p)(1-p), \mathrm(D)[Y] = -p \;\frac(p + \ln(1-p))((1-p)^2\,\ln^2(1-p)).

Relația cu alte distribuții

Suma Poisson a variabilelor aleatoare logaritmice independente are o distribuție binomială negativă. Lasă \(X_i\)_(i=1)^n o succesiune de variabile aleatoare independente distribuite identic astfel încât X_i \sim \mathrm(Log)(p), \; i=1,2,\ldots. Lasă N \sim \mathrm(P)(\lambda)- Variabila aleatoare Poisson. Apoi

Y = \sum\limits_(i=1)^N X_i \sim \mathrm(NB).

Aplicații

n Distribuții de probabilitate
Unidimensional Multidimensional
discret: Bernoulli | Binom | Geometric | Hipergeometrică | Logaritmic| Binom negativ | Poisson | Uniformă discretă Multinom
Absolut continuu: Beta | Weibull | Gamma | Hiperexponenţial | distribuție Gompertz | Kolmogorov | Cauchy | Laplace | Lognormal | Normal (Gauss) | Logistica | Nakagami | Pareto | Pearson | Semicircular | Uniformă continuă | Orez | | Copula

Scrieți o recenzie despre articolul „Distribuție logaritmică”

Un fragment care descrie distribuția logaritmică

- Retrageți-vă! Toată lumea se retrage! – strigă el de departe. Soldații au râs. Un minut mai târziu, adjutantul sosi cu același ordin.
Era prințul Andrei. Primul lucru pe care l-a văzut, călare în spațiul ocupat de armele lui Tushin, a fost un cal neînhamat, cu un picior rupt, nechezând lângă caii înhamați. Din piciorul ei curgea sânge ca dintr-o cheie. Între limbă zăceau câțiva morți. Un ghiule după altul zbura peste el când se apropia și simți un fior nervos curgându-i pe coloana vertebrală. Dar numai gândul că îi era frică l-a crescut din nou. „Nu pot să-mi fie frică”, se gândi el și descălecă încet de pe cal între pistoale. A dat ordinul și nu a lăsat bateria. A decis că va scoate armele din poziție cu el și le va retrage. Împreună cu Tushin, trecând peste cadavre și sub focul teribil al francezilor, a început să curețe armele.
„Și atunci au venit autoritățile chiar acum, așa că lacrimau”, i-a spus artificierul prințului Andrei, „nu ca onoarea ta”.
Prințul Andrei nu i-a spus nimic lui Tușin. Amândoi erau atât de ocupați încât părea că nici măcar nu s-au văzut. Când, după ce le-au pus cele două dintre cele patru tunuri care au supraviețuit, s-au mutat pe munte (un tun rupt și unicornul au rămas), prințul Andrei a condus până la Tușin.
„Ei bine, la revedere”, a spus prințul Andrei, întinzându-și mâna lui Tușin.
„La revedere, draga mea”, a spus Tushin, „suflete drag!” „La revedere, draga mea”, a spus Tushin cu lacrimi care, dintr-un motiv necunoscut, i-au apărut brusc în ochi.

Vântul se potoli, nori negri atârnau jos peste câmpul de luptă, contopindu-se la orizont cu fumul de praf de pușcă. Se întuneca, iar strălucirea focurilor era cu atât mai clar vizibilă în două locuri. Canonada a devenit mai slabă, dar trosnetul pistoalelor în spate și în dreapta se auzea și mai des și mai aproape. De îndată ce Tușin cu armele sale, conducând și alergând peste răniți, a ieșit din sub foc și a coborât în ​​râpă, a fost întâmpinat de superiorii și adjutanții săi, inclusiv de un ofițer de stat major și de Jherkov, care a fost trimis de două ori și niciodată. a ajuns la bateria lui Tushin. Toți, întrerupându-se unul pe altul, dădeau și transmiteau ordine despre cum și unde să meargă și îi făceau reproșuri și comentarii. Tushin nu dădea ordine și, în tăcere, îi era frică să vorbească, pentru că la fiecare cuvânt era gata, fără să știe de ce, să plângă, călărea în spate pe șanțul său de artilerie. Deși răniții au primit ordin să fie abandonați, mulți dintre ei au mers în spatele trupelor și au cerut să fie trimiși la arme. Același ofițer de infanterie atrăgător care a sărit din coliba lui Tușin înainte de luptă a fost, cu un glonț în stomac, așezat pe trăsura lui Matvevna. Sub munte, un husar cadet palid, sprijinind cealaltă mână cu o mână, s-a apropiat de Tushin și a cerut să se așeze.

Dacă ați efectua măsurători pe o perioadă lungă de timp, probabil că ați întâlni un model de distribuție distorsionat. De exemplu, s-ar putea să vedeți că ratele de rentabilitate depășesc 100% și că nu există niciun caz în care rentabilitatea să fie mai mică de 100%. Distribuția valorilor de randament pe o perioadă de, să zicem, un an s-ar potrivi cel mai bine unei distribuții lognormale. Distribuția lognormală, ca și distribuția normală, este determinată în întregime de media și deviația sa standard.  


În histograma din stânga presupunem că există doar două rezultate posibile pentru afacerea doamnei Charter - cerere mare sau cerere scăzută. Diagrama cu bare arată valoarea actuală în primul an, presupunând că afacerea continuă. Distribuția lognormală din figura din dreapta este mai realistă deoarece implică o gamă infinită de posibile valori prezente și ia în considerare rezultatele intermediare Modelul Black-Scholz se bazează pe distribuția logaritmică.  

Ipoteza despre distribuția lognormală a coeficienților elementari de tranziție asigură comoditatea și simplitatea pro-  

După cum sa menționat mai sus, ipoteza că coeficienții elementari de tranziție a, sunt variabile aleatoare având aceeași distribuție lognormală cu parametrii i, o2 (a,-e n(t,a2)), predetermina validitatea predicțiilor obținute pe baza unui stocastic multiplicativ. model pe o perioadă limitată de timp, caracterizată de condiții neschimbate. Aceasta implică sarcina de a dezvolta metode pentru a determina rapid și eficient momentul schimbării factorilor care afectează dinamica resursei (momentul schimbării valorilor lui q, a2). Se poate rezolva prin monitorizarea (urmărirea constantă) a valorilor așteptării matematice m, - Ma(i) și dispersia s,2 = Da(z) a coeficienților aleatori ai tranziției elementare a(z), z = l,..., n, ....  

Distribuție log-normală. Distribuția unei variabile aleatoare Y se numește log-normal dacă logaritmul acestei variabile este distribuit conform legii normale  

Distribuție lognormală  

Trebuie remarcat faptul că forma distribuției utilizate pentru P(T, U) nu trebuie să fie aceeași cu modelul de preț utilizat pentru a determina valorile lui Z(T, U - Y). De exemplu, utilizați modelul de opțiuni pe acțiuni Black-Scholes pentru a determina valorile lui Z(T, U - Y). Acest model presupune o distribuție lognormală a modificărilor prețului, dar puteți utiliza o formă diferită de distribuție pentru a determina P(T, U) corespunzătoare.  

Distribuție lognormală, lognormală 176  

Destul de des, parametrii fizici se supun așa-numitei distribuții lognormale. Pe baza analizei tabelului. 95 și 96, se poate argumenta că coeficienții de corelație pereche calculați din parametrii pe o scară logaritmică nu vor diferi semnificativ de coeficienții de corelație liniară pereche. În tabel 95 și 96 prezintă coeficienți de corelație perechi pe scale liniare (linia de sus) și logaritmică (linia de jos). O diferență este considerată nesemnificativă dacă intervalele de încredere pentru coeficienții de corelație perechi se intersectează. Sunt încercuite acele celule în care diferența de coeficienți de corelație perechi s-a dovedit a fi semnificativă. După cum se poate observa, pentru toate dispozitivele relația dintre parametrii 1 și 6, 2 și 6, 2 și 5 este semnificativ neliniară. Pentru dispozitivele adecvate, același lucru este valabil și pentru relația dintre parametrii 1 și 6, 2 și 6.  

Instrumentele matematice pentru evaluarea riscurilor includ calcule statistice, distribuție normală, distribuție lognormală, programare liniară, metode econometrice etc.  

Standardul stabilește reguli pentru determinarea estimărilor și limitelor de încredere pentru parametrii unei distribuții lognormale pentru un set de date statistice dacă aceste date sunt supuse unei distribuții lognormale.  

Distribuție lognormală. Fie X N(m,a2). Variabila aleatoare Y = ex se numește normală din punct de vedere logaritmic. Se poate arăta că densitatea de distribuție a acestei mărimi este determinată de formula  

O distribuție lognormală apare într-o situație în care variabila aleatoare studiată se formează sub influența unui număr mare de factori aleatori multiplicativi. Se poate arăta că  

Cu această modificare, distribuția normală este transformată într-o distribuție lognormală. Prețul oricărui instrument tranzacționat public are o valoare zero ca limită inferioară de 1. Deci, atunci când prețul acelui instrument scade și se apropie de zero, atunci, teoretic, prețul instrumentului ar trebui să devină din ce în ce mai dificil de micșorat. Luați în considerare un stoc care costă 10 USD. Dacă o acțiune ar scădea de la 5 la 5 USD pe acțiune (în scădere cu 50%), atunci sub distribuția normală ar putea scădea la fel de ușor de la 5 USD la 0 USD. Cu toate acestea, într-o distribuție lognormală, o astfel de scădere de 50% de la 5 USD pe acțiune la  

Distribuția lognormală, Figura 3-15, funcționează exact la fel ca distribuția normală, cu excepția faptului că, în cazul distribuției lognormale, avem de-a face cu modificări procentuale mai degrabă decât cu modificări absolute. Acum să ne uităm la mișcarea ascendentă. Conform distribuției lognormale, o trecere de la 10 USD pe acțiune la 20 USD pe acțiune este aceeași cu o trecere de la 5 USD la 10 USD pe acțiune, deoarece ambele aceste mișcări reprezintă o creștere de 100%. Acest lucru nu înseamnă că nu vom folosi distribuția normală. Vom introduce pur și simplu distribuția lognormală, vom arăta cum diferă ea de distribuția normală (distribuția lognormală folosește mai degrabă modificări procentuale decât absolute ale prețului) și vom vedea că este folosită de obicei atunci când discutăm despre mișcările prețurilor sau când distribuția normală este delimitată mai jos de zero. Pentru a utiliza distribuția lognormală, trebuie să convertiți datele cu care lucrați în logaritmi naturali1.  

Am învățat puțin despre matematica distribuțiilor normale și lognormale, iar acum ne vom uita la cum să găsim f-ul optim din rezultatele distribuite normal. Formula lui Kelly este un exemplu de f optim parametric, unde f este o funcție a doi parametri. În formula Kelly, parametrii de intrare sunt procentul de pariuri câștigătoare și raportul dintre câștiguri și pierderi. Cu toate acestea, formula lui Kelly vă va oferi f optim numai atunci când rezultatele posibile au o distribuție Bernoulli. Cu alte cuvinte, formula lui Kelly vă va oferi f optim corect atunci când există doar două rezultate posibile, în caz contrar, ca și în cazul rezultatelor distribuite normal, formula lui Kelly nu vă va oferi f2 optim corect.  

Distribuția lognormală depinde de doi parametri ai așteptării matematice a și deviația standard o a variabilei aleatoare Y (logaritmii venitului) a = E(Y) = E(InX), a2 = var(F) = var(hiA) . Calculul celui de-al doilea parametru se realizează pe baza datelor dintr-un sondaj bugetar eșantion folosind următoarea formulă  

Pentru studiul caracteristicilor de diferențiere a populației după nivelul de venit se folosesc caracteristici structurale ale intervalelor de distribuție, precum mod, mediană, quartile, decile etc. Aceste caracteristici statistice pot fi exprimate și calculate prin parametrii distribuției lognormale ( a și o). În același timp, o evaluare aproximativă a caracteristicilor structurale poate fi obținută pe baza unor serii statistice deja construite publicate de organele de statistică de stat.  

DISTRIBUȚIE LOGNORMALĂ, LOGARITMICO-NORMALĂ - distribuția unei variabile aleatoare al cărei logaritm se caracterizează printr-o distribuție normală. Cu ajutorul acestuia, este convenabil să descriem unele fenomene economice, de exemplu, diferențierea salariilor, distribuția veniturilor.  

Există două concepții greșite comune atunci când se utilizează modele probabilistice de risc. În primul rând, dacă valoarea daunelor depinde de mai multe cauze, atunci ar trebui să aibă o distribuție normală. Aceasta este o concepție greșită, deoarece totul depinde de modul în care interacționează. Dacă cauzele acționează aditiv (în total), atunci conform Teoremei Limitei Centrale a teoriei probabilității, cantitatea de daune are de fapt o distribuție aproximativ normală (Gauss). Dacă cauzele acționează multiplicativ, atunci, în virtutea aceleiași teoreme, distribuția cantității de daune X ar trebui aproximată folosind distribuția lognormală. Dacă influenţa principală este



 


Citire:



Codurile promoționale Pandao pentru puncte

Codurile promoționale Pandao pentru puncte

Uneori, când încerci să intri în magazinul oficial al gigantului digital, Play Market scrie pentru a activa un cod promoțional. Pentru a obține o cuprinzătoare...

Instalarea RAM suplimentară

Instalarea RAM suplimentară

„Principiile memorării naturale se bazează pe conexiunile nervoase care sunt create în creier”, spune Olga Zimnyakova, neurolog...

Ce trebuie să faceți dacă căștile nu redau sunetul pe un laptop

Ce trebuie să faceți dacă căștile nu redau sunetul pe un laptop

Problemele legate de conectarea și operarea căștilor sunt destul de frecvente. În acest articol ne vom uita la câteva dintre cele mai probabile motive...

Director diode Diode redresoare de mare putere 220V

Director diode Diode redresoare de mare putere 220V

Scopul principal al diodelor redresoare este conversia tensiunii. Dar acesta nu este singurul domeniu de aplicare pentru acești semiconductori...

imagine-alimentare RSS