Secțiuni de site
Alegerea editorului:
- Cum să eliminați complet Programul Avast pentru a elimina Avast
- Aplicație mobilă Aliexpress
- Dispunerea tastaturii QWERTY și AZERTY Versiuni speciale ale tastaturii Dvorak
- Insula Sao Vicente Insula Sao Vicente
- Regulile pe care le încălcăm Este în regulă să-ți pui coatele pe masă?
- Care unități flash USB sunt cele mai fiabile și mai rapide?
- Conectarea unui laptop la un televizor prin cablu USB pentru conectarea unui laptop la un televizor VGA
- Schimbarea interfeței Steam - de la imagini simple la întreaga prezentare pe ecran Design nou steam
- Cum să anulați un abonament Megogo la televizor: instrucțiuni detaliate Cum să vă dezabonați de la abonamentele Megogo
- Cum să partiționați un disc cu Windows instalat fără a pierde date Partiționați discul 7
Publicitate
Distribuție logaritmică. Vedeți paginile în care este menționat termenul de distribuție log-normală |
Variabila aleatoare Y are o logaritmică distributie normala cu parametrii μ și σ, dacă variabila aleatoare X = lnY are o distribuție normală cu aceiași parametri μ și σ. Cunoscând natura relației dintre variabilele X și Y, putem construi cu ușurință un grafic de densitate de probabilitate a unei variabile aleatoare cu o distribuție lognormală (Figura 4.2). Figura 4.2 – Curbele de densitate ale distribuției lognormale pentru diferite valori ale parametrilor μ și σ Dacă o variabilă aleatoare X are o funcție de densitate de probabilitate definită prin formula (4.6) și dacă X = lnY, atunci: Unde avem pentru y > 0: Din definiție rezultă că o variabilă aleatorie supusă unei distribuții lognormale poate lua numai valori pozitive. După cum se arată în figura 4.2, curbele funcției f(y) au o asimetrie din stânga, care este mai puternică, cu cât valorile parametrilor μ și σ sunt mai mari. Fiecare curbă are un maxim și este definită pentru toate valorile pozitive ale lui y. Calcularea așteptărilor matematice și a varianței unei variabile aleatoare cu o distribuție lognormală nu este deosebit de dificilă: Prin substituții și introducerea de noi variabile în integralele 4.15 și 4.16, obținem: În general, pentru a calcula probabilitatea ca o variabilă aleatoare Y cu o distribuție lognormală și densitate f(y, μ, σ) să ia o valoare în intervalul (a, b), ar trebui să ia integrala: Cu toate acestea, în practică este mai convenabil să se folosească faptul că logaritmul variabilei aleatoare Y are o distribuție normală. Probabilitatea ca a ≤ Y ≤ b este echivalentă cu probabilitatea ca Să calculăm probabilitatea ca o variabilă aleatoare cu distribuție logaritmică μ = 1, σ = 0,5 să ia o valoare în intervalul (2, 5). Avem: Din tabelele de logaritmi găsim ln2 = 0,6932 și ln5 = 1,6094. Notând lnY = X, putem scrie: Mai mult, variabila aleatoare X este supusă unei distribuții normale cu o valoare medie μ = 1 și o abatere standard σ = 0,5. Acum probabilitatea dorită poate fi calculată cu ușurință folosind tabelele funcției integrale a distribuției normale: Întrebări pentru autocontrol 1 Definiția distribuției dreptunghiulare. 2 Graficul densității probabilității unei variabile aleatoare cu distribuție dreptunghiulară 3 Sensul fundamental al distribuției dreptunghiulare. 4 Aşteptareși varianța unei variabile aleatoare într-o distribuție dreptunghiulară. 5 Rolul distribuției normale în statistica matematică. 6 Care este distribuția normală și cum este legată de binom? 7 Graficul densității de probabilitate a unei variabile aleatoare cu distribuție normală. 8 Ce parametri statistici pot fi utilizați pentru a defini o distribuție normală? 9 De ce este distribuția normală continuă? 10 Ecuația unei curbe normale. 11 Ce este abaterea normalizată? 12 Ecuația curbei de distribuție normală în formă normalizată. 13 Ce valori ale lui μ și σ caracterizează o populație normală în formă normalizată? 14 Ce proporție din datele eșantionului se încadrează în limitele ±1σ, ±2σ, ±3σ? 15 Ce arată tabelul cu integrala probabilității normale? 16 Ecuația unei curbe lognormale. 17 Graficul densității probabilității unei variabile aleatoare cu o distribuție lognormală. 18 Ce transformări trebuie efectuate pentru a obține o distribuție normală dintr-o distribuție lognormală? 19 Ce parametri statistici definesc o distribuție lognormală? TEMA 5 Distribuția parametrilor de eșantionare 5,1 t – Repartizarea elevilor 5.2 Distribuția Fisher–Snedecor F 5.3 χ 2 – distribuție 5,1 t – Repartizarea elevilor Legea distribuției normale apare atunci când numărul de caracteristici este n > 20–30. Cu toate acestea, experimentatorul efectuează adesea un număr limitat de măsurători și își bazează concluziile pe eșantioane mici. Cu un număr mic de observații, rezultatele sunt de obicei apropiate și rareori apar abateri mari. Acest lucru poate fi explicat cu ușurință prin legea distribuției normale, conform căreia probabilitatea abaterilor mici este mai mare decât a abaterilor mari. Astfel, probabilitatea ca abaterile să depășească ±2σ în valoare absolută este de 0,05, sau un caz la 20 de măsurători, iar abaterile ± 3σ – 0,01, sau un caz la 100. Dacă experimentul de teren se desfășoară, de exemplu, în 4-6 repetări, atunci este firesc să ne așteptăm că nu vor exista abateri foarte mari între citirile de randament pe parcele paralele. Prin urmare, abaterea standard s calculată dintr-un eșantion mic va fi în cele mai multe cazuri mai mică decât cea din întreaga populație. Prin urmare, în aceste cazuri, nu vă puteți baza pe criteriile normale de distribuție în concluziile dvs. De la începutul secolului al XX-lea, o nouă direcție a început să se dezvolte în statistica matematică, care poate fi numită statistică a eșantioanelor mici. Distribuția t, descoperită în 1908 de statisticianul și chimistul englez W. Gosset, care a fost numită distribuția Student (student-student englez, pseudonimul lui W. Gosset), a avut cea mai mare importanță practică pentru munca experimentală. Distribuția t a lui Student pentru mediile eșantionului este determinată de egalitatea: Numărătorul formulei înseamnă abaterea mediei eșantionului de la media întregii populații, iar numitorul: – este un indicator care estimează eroarea standard a populației medii din eșantion. Astfel, valoarea lui t este măsurată prin abaterea mediei eșantionului de la media populației, exprimată în cote ale erorii de eșantionare luate ca unitate. Maximele de frecvență ale distribuției normale și t coincid, dar forma curbei distribuției t depinde în întregime de numărul de grade de libertate. La valori foarte mici ale gradelor de libertate, acesta ia forma unei curbe cu vârf plat, iar aria delimitată de curbă este mai mare decât la o distribuție normală și cu o creștere a numărului de observații (n > 30), distribuția t se apropie de normal și se transformă în ea la n = ∞. Figura 1.1 prezintă distribuția diferențială și integrală a t-Student la 10 grade de libertate. Figura 5.1 – Distribuția t-Student diferențială (stânga) și integrală (dreapta). Distribuția t-Student este importantă atunci când lucrați cu eșantioane mici: vă permite să determinați un interval de încredere care acoperă media populației , și testați una sau alta ipoteză privind populația generală. În acest caz, nu este nevoie să cunoașteți parametrii populației Şi , este suficient să aveți estimările lor μ și σ pentru o anumită dimensiune a eșantionului n. 5.1.1 Problema Behrens–Fisher Testarea ipotezei despre mediile generale a două grupuri cu o distribuție normală și varianțe inegale în statistica matematică se numește problema Behrens-Fisher și are în prezent doar soluții aproximative. De ce este atât de importantă cerința de egalitate a variațiilor în grupurile comparate? Fără a intra în detalii despre această problemă, observăm că, cu cât variațiile și dimensiunile eșantionului diferă între ele, cu atât distribuția „testului t calculat” diferă de distribuția „testului t al studentului”. În acest caz, atât criteriul t în sine, cât și un astfel de parametru al acestor distribuții precum numărul de grade de libertate au valori diferite. La rândul său, numărul de grade de libertate afectează valoarea nivelului de semnificație (critic) atins (p.< ...) определяемого для вычисленного значения t-критерия. Neglijarea de către cercetători a condițiilor de mai sus pentru admisibilitatea utilizării testului t Student duce la o denaturare semnificativă a rezultatelor testării ipotezelor despre egalitatea mijloacelor. Prin urmare, în lucrările în care testarea ipotezelor despre egalitatea a două medii a fost efectuată utilizând testul t Student și nu există nicio mențiune despre criteriile de testare a normalității distribuției și a egalității varianțelor, există motive pentru a presupune că autorii au folosit incorect acest criteriu și, prin urmare, dubiul concluziilor lor declarate. Alte greseala comuna– aplicarea testului t al lui Student pentru a testa ipoteze despre egalitatea a trei sau mai multe medii de grup. În acest caz, este necesar să se aplice așa-numitul model liniar general, implementat în procedura de analiză unidirecțională a varianței cu efecte fixe. Să aruncăm o privire mai atentă la caracteristicile utilizării testului t Student. Testul t este folosit cel mai adesea în două cazuri. În primul caz, este folosit pentru a testa ipoteza despre egalitatea mediilor generale a două eșantioane independente, neînrudite (așa-numitul test t cu două eșantioane). În acest caz, există un grup de control și un grup experimental, format din diferite obiecte, al căror număr în grupuri poate fi diferit. În al doilea caz, se folosește așa-numitul test t pereche, când același grup de obiecte generează material numeric pentru a testa ipotezele despre medii. Prin urmare, aceste mostre se numesc dependente, legate. De exemplu, numărul de celule albe din sânge este măsurat la animale sănătoase și apoi la aceleași animale după expunerea la o anumită doză de radiații. În ambele cazuri, trebuie îndeplinită cerința de distribuție normală a caracteristicii studiate în fiecare dintre loturile comparate. Dominanța testului t Student în marea majoritate a lucrărilor reflectă două aspecte importante. În al doilea rând, acest lucru sugerează, de asemenea, că acești autori nu cunosc alternative la acest criteriu sau nu sunt capabili să le folosească ei înșiși. Se poate spune fără exagerare că în prezent, utilizarea necugetă a testului t al lui Student în majoritatea lucrărilor biologice face mai mult rău decât bine. 5.2 Distribuția Fisher–Snedecor F Dacă luăm două eșantioane independente de volum n 1 și n 2 dintr-o populație distribuită normal și calculăm varianțele Şi cu grade de libertate ν 1 = n –1 și ν 2 = n 2 –1, atunci se poate determina raportul de varianță: Raportul varianțelor este luat astfel încât să existe o variație mare în numărător și, prin urmare, F ≥ 1. Distribuția lui F depinde doar de numărul de grade de libertate ν 1 și ν 2 (legea distribuției F a fost descoperită de R. A. Fisher). Când două eșantioane comparate sunt aleatorii independente de populația generală cu o medie generală, atunci valoarea reală a lui F nu va depăși anumite limite și nu va depăși valoarea teoretică a criteriului F, critic pentru datele ν 1 și ν 2 (F fapt< F теор). Если генеральные параметры сравниваемых групп различны, то F факт >F teor. Valorile teoretice F pentru nivelurile de semnificație de 5% și 1% sunt date în tabel, unde sunt tabulate numai punctele critice corecte pentru F ≥ 1, deoarece este întotdeauna obișnuit să se găsească raportul dintre variația mai mare și cea mai mică. . Curbele obținute din funcția de distribuție pentru toate valorile posibile ale lui F, în special cu un număr mic de observații, au o formă asimetrică - o „coadă” lungă de valori mari și o concentrație mare de valori F mici ( Figura 5.2). Figura 5.2 – Diferenţial (stânga) şi integral (dreapta) Rețineți că distribuția t Student este un caz special al distribuției F cu numărul de grade de libertate ν 1 = 1 și ν 2 = ν, adică egal cu numărul de grade de libertate pentru distribuția t. În acest caz, se observă următoarea relație între F și t: 5.3 χ 2 – distribuție Multe distribuții reale corespund modelelor de distribuție teoretice (normale, binomiale, Poisson). Cu toate acestea, în practică există distribuții foarte diferite de cele normale. Pentru a evalua gradul de discrepanță sau gradul de acord între numerele distribuțiilor reale și teoretice, sunt introduse criterii statistice de acord, de exemplu, criteriul χ 2. Acest criteriu este utilizat pentru rezolvarea problemelor analiza statistica, de exemplu, pentru a testa ipoteze: despre independența a două principii care stau la baza grupării rezultatelor observației de la o singură populație; despre omogenitatea grupurilor în raport cu anumite caracteristici identificabile; asupra acordului dintre curbele de abundenţă teoretică şi experimentală. Criteriul χ 2 poate fi numit atât criteriul acordului, cât și criteriul independenței, criteriul omogenității. Legea distribuției χ 2 (chi-pătrat) a fost descoperită de K. Pearson. Curba de distribuție obținută din funcția chi pătrat: unde f este valoarea reală și F sunt frecvențele teoretice ale numărului de obiecte eșantion. Aspectul său depinde puternic de numărul de grade de libertate. Pentru un număr mic de grade de libertate ν, curba este asimetrică (Figura 5.3), dar pe măsură ce ν crește, asimetria scade și la ν = ∞ curba devine Gaussiană normală. Distribuția χ 2, precum și distribuția t, este un caz special Figura 5.3 – Diferenţial (stânga) şi integral (dreapta) Întrebări pentru autocontrol 1 În ce cazuri este de preferat să folosiți distribuția t Student decât distribuția normală? 2 Ce cantități trebuie estimate pentru a utiliza distribuția t Student? 3 Care este esența problemei Behrens-Fisher? 4 Cum se exprimă numeric distribuția F pentru doi mostre independente din setul total de variabile? 5 De ce valori caracteristice ale variabilelor aleatoare depinde distribuția F? 6 La ce întrebări poate răspunde valoarea criteriului χ 2 în timpul prelucrării statistice a datelor experimentale? TEMA 6 Fundamentele statisticii matematice 6.1 Valori medii 6.2 Media aritmetică 6.3 Media geometrică 6.4 Medie armonică Variabila aleatoare Y are o distribuție lognormală cu parametrii μ și σ dacă variabila aleatoare X = lnY are o distribuție normală cu aceiași parametri μ și σ. Cunoscând natura relației dintre variabilele X și Y, putem construi cu ușurință un grafic de densitate de probabilitate a unei variabile aleatoare cu o distribuție lognormală (Figura 4.2). Figura 4.2 – Curbele de densitate ale distribuției lognormale pentru diferite valori ale parametrilor μ și σ Dacă o variabilă aleatoare X are o funcție de densitate de probabilitate definită prin formula (4.6) și dacă X = lnY, atunci: Unde avem pentru y > 0: Din definiție rezultă că o variabilă aleatorie supusă unei distribuții lognormale poate lua numai valori pozitive. După cum se arată în figura 4.2, curbele funcției f(y) au o asimetrie din stânga, care este mai puternică, cu cât valorile parametrilor μ și σ sunt mai mari. Fiecare curbă are un maxim și este definită pentru toate valorile pozitive ale lui y. Calcularea așteptărilor matematice și a varianței unei variabile aleatoare cu o distribuție lognormală nu este deosebit de dificilă: Prin substituții și introducerea de noi variabile în integralele 4.15 și 4.16, obținem: În general, pentru a calcula probabilitatea ca o variabilă aleatoare Y cu o distribuție lognormală și densitate f(y, μ, σ) să ia o valoare în intervalul (a, b), ar trebui să ia integrala: Cu toate acestea, în practică este mai convenabil să se folosească faptul că logaritmul variabilei aleatoare Y are o distribuție normală. Probabilitatea ca a ≤ Y ≤ b este echivalentă cu probabilitatea ca Să calculăm probabilitatea ca o variabilă aleatoare cu distribuție logaritmică μ = 1, σ = 0,5 să ia o valoare în intervalul (2, 5). Avem: Din tabelele de logaritmi găsim ln2 = 0,6932 și ln5 = 1,6094. Notând lnY = X, putem scrie: Mai mult, variabila aleatoare X este supusă unei distribuții normale cu o valoare medie μ = 1 și o abatere standard σ = 0,5. Acum probabilitatea dorită poate fi calculată cu ușurință folosind tabelele funcției integrale a distribuției normale: Întrebări pentru autocontrol 1 Definiția distribuției dreptunghiulare. 2 Graficul densității probabilității unei variabile aleatoare cu distribuție dreptunghiulară 3 Sensul fundamental al distribuției dreptunghiulare. 4 Așteptarea și varianța unei variabile aleatoare într-o distribuție dreptunghiulară. 5 Rolul distribuției normale în statistica matematică. 6 Care este distribuția normală și cum este legată de binom? 7 Graficul densității de probabilitate a unei variabile aleatoare cu distribuție normală. 8 Ce parametri statistici pot fi utilizați pentru a defini o distribuție normală? 9 De ce este distribuția normală continuă? 10 Ecuația unei curbe normale. 11 Ce este abaterea normalizată? 12 Ecuația curbei de distribuție normală în formă normalizată. 13 Ce valori ale lui μ și σ caracterizează o populație normală în formă normalizată? 14 Ce proporție din datele eșantionului se încadrează în limitele ±1σ, ±2σ, ±3σ? 15 Ce arată tabelul cu integrala probabilității normale? 16 Ecuația unei curbe lognormale. 17 Graficul densității probabilității unei variabile aleatoare cu o distribuție lognormală. 18 Ce transformări trebuie efectuate pentru a obține o distribuție normală dintr-o distribuție lognormală? 19 Ce parametri statistici definesc o distribuție lognormală? TEMA 5 Distribuția parametrilor de eșantionare 5,1 t – Repartizarea elevilor 5.2 Distribuția Fisher–Snedecor F 5.3 χ 2 – distribuție 5,1 t – Repartizarea elevilor Legea distribuției normale apare atunci când numărul de caracteristici este n > 20–30. Cu toate acestea, experimentatorul efectuează adesea un număr limitat de măsurători și își bazează concluziile pe eșantioane mici. Cu un număr mic de observații, rezultatele sunt de obicei apropiate și rareori apar abateri mari. Acest lucru poate fi explicat cu ușurință prin legea distribuției normale, conform căreia probabilitatea abaterilor mici este mai mare decât a abaterilor mari. Astfel, probabilitatea ca abaterile să depășească ±2σ în valoare absolută este de 0,05, sau un caz la 20 de măsurători, iar abaterile ± 3σ – 0,01, sau un caz la 100. Dacă experimentul de teren se desfășoară, de exemplu, în 4-6 repetări, atunci este firesc să ne așteptăm că nu vor exista abateri foarte mari între citirile de randament pe parcele paralele. Prin urmare, abaterea standard s calculată dintr-un eșantion mic va fi în cele mai multe cazuri mai mică decât cea din întreaga populație. Prin urmare, în aceste cazuri, nu vă puteți baza pe criteriile normale de distribuție în concluziile dvs. De la începutul secolului al XX-lea, o nouă direcție a început să se dezvolte în statistica matematică, care poate fi numită statistică a eșantioanelor mici. Distribuția t, descoperită în 1908 de statisticianul și chimistul englez W. Gosset, care a fost numită distribuția Student (student-student englez, pseudonimul lui W. Gosset), a avut cea mai mare importanță practică pentru munca experimentală. Distribuția t a lui Student pentru mediile eșantionului este determinată de egalitatea: Numărătorul formulei înseamnă abaterea mediei eșantionului de la media întregii populații, iar numitorul: – este un indicator care estimează eroarea standard a populației medii din eșantion. Astfel, valoarea lui t este măsurată prin abaterea mediei eșantionului de la media populației, exprimată în cote ale erorii de eșantionare luate ca unitate. Maximele de frecvență ale distribuției normale și t coincid, dar forma curbei distribuției t depinde în întregime de numărul de grade de libertate. La valori foarte mici ale gradelor de libertate, acesta ia forma unei curbe cu vârf plat, iar aria delimitată de curbă este mai mare decât la o distribuție normală și cu o creștere a numărului de observații (n > 30), distribuția t se apropie de normal și se transformă în ea la n = ∞. Figura 1.1 prezintă distribuția diferențială și integrală a t-Student la 10 grade de libertate. Figura 5.1 – Distribuția t-Student diferențială (stânga) și integrală (dreapta). Distribuția t-Student este importantă atunci când lucrați cu eșantioane mici: vă permite să determinați un interval de încredere care acoperă media populației , și testați una sau alta ipoteză privind populația generală. În acest caz, nu este nevoie să cunoașteți parametrii populației Şi , este suficient să aveți estimările lor μ și σ pentru o anumită dimensiune a eșantionului n. 5.1.1 Problema Behrens–Fisher Testarea ipotezei despre mediile generale a două grupuri cu o distribuție normală și varianțe inegale în statistica matematică se numește problema Behrens-Fisher și are în prezent doar soluții aproximative. De ce este atât de importantă cerința de egalitate a variațiilor în grupurile comparate? Fără a intra în detalii despre această problemă, observăm că, cu cât variațiile și dimensiunile eșantionului diferă între ele, cu atât distribuția „testului t calculat” diferă de distribuția „testului t al studentului”. În acest caz, atât criteriul t în sine, cât și un astfel de parametru al acestor distribuții precum numărul de grade de libertate au valori diferite. La rândul său, numărul de grade de libertate afectează valoarea nivelului de semnificație (critic) atins (p.< ...) определяемого для вычисленного значения t-критерия. Neglijarea de către cercetători a condițiilor de mai sus pentru admisibilitatea utilizării testului t Student duce la o denaturare semnificativă a rezultatelor testării ipotezelor despre egalitatea mijloacelor. Prin urmare, în lucrările în care testarea ipotezelor despre egalitatea a două medii a fost efectuată utilizând testul t Student și nu există nicio mențiune despre criteriile de testare a normalității distribuției și a egalității varianțelor, există motive pentru a presupune că autorii au folosit incorect acest criteriu și, prin urmare, dubiul concluziilor lor declarate. O altă greșeală comună este utilizarea testului t al lui Student pentru a testa ipotezele despre egalitatea a trei sau mai multe medii de grup. În acest caz, este necesar să se aplice așa-numitul model liniar general, implementat în procedura de analiză unidirecțională a varianței cu efecte fixe. Să aruncăm o privire mai atentă la caracteristicile utilizării testului t Student. Testul t este folosit cel mai adesea în două cazuri. În primul caz, este folosit pentru a testa ipoteza despre egalitatea mediilor generale a două eșantioane independente, neînrudite (așa-numitul test t cu două eșantioane). În acest caz, există un grup de control și un grup experimental, format din diferite obiecte, al căror număr în grupuri poate fi diferit. În al doilea caz, se folosește așa-numitul test t pereche, când același grup de obiecte generează material numeric pentru a testa ipotezele despre medii. Prin urmare, aceste mostre se numesc dependente, legate. De exemplu, numărul de celule albe din sânge este măsurat la animale sănătoase și apoi la aceleași animale după expunerea la o anumită doză de radiații. În ambele cazuri, trebuie îndeplinită cerința de distribuție normală a caracteristicii studiate în fiecare dintre loturile comparate. Dominanța testului t Student în marea majoritate a lucrărilor reflectă două aspecte importante. În al doilea rând, acest lucru sugerează, de asemenea, că acești autori nu cunosc alternative la acest criteriu sau nu sunt capabili să le folosească ei înșiși. Se poate spune fără exagerare că în prezent, utilizarea necugetă a testului t al lui Student în majoritatea lucrărilor biologice face mai mult rău decât bine. 5.2 Distribuția Fisher–Snedecor F Dacă luăm două eșantioane independente de volum n 1 și n 2 dintr-o populație distribuită normal și calculăm varianțele Şi cu grade de libertate ν 1 = n –1 și ν 2 = n 2 –1, atunci se poate determina raportul de varianță: Raportul varianțelor este luat astfel încât să existe o variație mare în numărător și, prin urmare, F ≥ 1. Distribuția lui F depinde doar de numărul de grade de libertate ν 1 și ν 2 (legea distribuției F a fost descoperită de R. A. Fisher). Când două eșantioane comparate sunt aleatorii independente de populația generală cu o medie generală, atunci valoarea reală a lui F nu va depăși anumite limite și nu va depăși valoarea teoretică a criteriului F, critic pentru datele ν 1 și ν 2 (F fapt< F теор). Если генеральные параметры сравниваемых групп различны, то F факт >F teor. Valorile teoretice F pentru nivelurile de semnificație de 5% și 1% sunt date în tabel, unde sunt tabulate numai punctele critice corecte pentru F ≥ 1, deoarece este întotdeauna obișnuit să se găsească raportul dintre variația mai mare și cea mai mică. . Curbele obținute din funcția de distribuție pentru toate valorile posibile ale lui F, în special cu un număr mic de observații, au o formă asimetrică - o „coadă” lungă de valori mari și o concentrație mare de valori F mici ( Figura 5.2). Figura 5.2 – Diferenţial (stânga) şi integral (dreapta) Rețineți că distribuția t Student este un caz special al distribuției F cu numărul de grade de libertate ν 1 = 1 și ν 2 = ν, adică egal cu numărul de grade de libertate pentru distribuția t. În acest caz, se observă următoarea relație între F și t: 5.3 χ 2 – distribuție Multe distribuții reale corespund modelelor de distribuție teoretice (normale, binomiale, Poisson). Cu toate acestea, în practică există distribuții foarte diferite de cele normale. Pentru a evalua gradul de discrepanță sau gradul de acord între numerele distribuțiilor reale și teoretice, sunt introduse criterii statistice de acord, de exemplu, criteriul χ 2. Acest criteriu este utilizat pentru rezolvarea problemelor de analiză statistică, de exemplu, pentru a testa ipoteze: despre independența a două principii care stau la baza grupării rezultatelor observației de la aceeași populație; despre omogenitatea grupurilor în raport cu anumite caracteristici identificabile; asupra acordului dintre curbele de abundenţă teoretică şi experimentală. Criteriul χ 2 poate fi numit atât criteriul acordului, cât și criteriul independenței, criteriul omogenității. Legea distribuției χ 2 (chi-pătrat) a fost descoperită de K. Pearson. Curba de distribuție obținută din funcția chi pătrat: unde f este valoarea reală și F sunt frecvențele teoretice ale numărului de obiecte eșantion. Aspectul său depinde puternic de numărul de grade de libertate. Pentru un număr mic de grade de libertate ν, curba este asimetrică (Figura 5.3), dar pe măsură ce ν crește, asimetria scade și la ν = ∞ curba devine Gaussiană normală. Distribuția χ 2, precum și distribuția t, este un caz special Figura 5.3 – Diferenţial (stânga) şi integral (dreapta) Întrebări pentru autocontrol 1 În ce cazuri este de preferat să folosiți distribuția t Student decât distribuția normală? 2 Ce cantități trebuie estimate pentru a utiliza distribuția t Student? 3 Care este esența problemei Behrens-Fisher? 4 Cum este exprimată numeric distribuția F pentru două eșantioane independente dintr-un set total de variabile? 5 De ce valori caracteristice ale variabilelor aleatoare depinde distribuția F? 6 La ce întrebări poate răspunde valoarea criteriului χ 2 în timpul prelucrării statistice a datelor experimentale? TEMA 6 Fundamentele statisticii matematice 6.1 Valori medii 6.2 Media aritmetică 6.3 Media geometrică 6.4 Medie armonică Modelul de distribuție logaritmică al celebrului matematician englez Fisher a fost prima încercare de a descrie relația dintre numărul de specii și numărul de indivizi ai acestor specii. Acest model a avut un succes deosebit în cercetarea entomologică și a fost folosit pentru prima dată de Fisher ca model teoretic pentru a descrie distribuția speciilor în colecții. Acest model și statisticile privind diversitatea au făcut obiectul unui studiu detaliat al lui L. R. Taylor și colab. Distribuția de frecvență a speciilor pentru o distribuție logaritmică este descrisă de următoarea secvență: unde X– numărul de specii reprezentat de un individ, x 2 /2 – numărul de specii reprezentat de doi indivizi etc. Modelul logaritmic are doi parametri și x. Aceasta înseamnă că pentru o dimensiune a eșantionului Nși numărul de specii S există o singură distribuție posibilă de frecvență a speciilor pe baza abundenței lor relative, deoarece atât cât și X sunt functii NŞi S. Cu cât eșantionul extras dintr-o anumită comunitate este mai mare, cu atât valoarea este mai mare X iar proporţia indivizilor aparţinând speciilor reprezentate de un individ din eşantion este mai mică. Doi parametri SŞi N(numărul total de indivizi) sunt interconectate prin dependență , unde este suma tuturor indivizilor N aparținând S tipuri: Modelul de distribuție logaritmică, caracterizat printr-un număr mic de specii abundente și o proporție mare de specii „rare”, este cel mai probabil să descrie comunități a căror structură este determinată de unul sau câțiva factori de mediu. După cum arată cercetările efectuate de Magharran în Irlanda, această serie corespunde distribuției abundenței speciilor de plante de pământ în culturile de conifere în condiții de lumină scăzută. 5.3.3. Distribuție lognormalăMajoritatea comunităților prezintă o distribuție log-normală a abundenței speciilor, dar acest model indică în general o comunitate mare, matură și diversă. Această distribuție este tipică pentru sisteme când valoarea unei anumite variabile este determinată de un număr mare de factori. Acest model a fost aplicat pentru prima dată la distribuția abundenței speciilor de către Preston. Folosind o varietate de materiale empirice, el a arătat că frecvențele speciilor din eșantioane mari sunt distribuite în conformitate cu legea lognormală. Conform metodologiei pe care a dezvoltat-o, speciile cu numărul de indivizi cuprinse în intervale care sunt limitate de numere de progresie geometrică sunt grupate în clase de frecvență. Preston a trasat abundența speciilor pe o scară de bază logaritmică 2 (log 2) și a numit clasele rezultate octave. Dar pentru a descrie modelul, puteți folosi orice bază logaritmică. În grafic, distribuția frecvențelor speciilor în funcție de clasele de abundență astfel obținute corespunde binecunoscutei curbe de distribuție normală, trunchiată în stânga, în intervalul de frecvență al speciilor rare. Distribuția este de obicei scrisă sub forma: , Unde S R – numărul teoretic de specii dintr-o octavă situată în R octave din octava modală; S lu– numărul de specii în octava modală; – abaterea standard a curbei log-normale teoretice, exprimată în număr de octave. Orez. 5.3.2. Distribuție log-normală Distribuția log-normală este descrisă printr-o „normală” simetrică, adică o curbă în formă de clopot (Fig. 5.3.2.). Cu toate acestea, dacă datele căreia îi corespunde provin dintr-un eșantion limitat, atunci partea stângă a curbei (adică specii rare, neraportate) va fi neclară. Preston a numit acest punct de trunchiere din stânga „linia cortinei”. „Linia cortinei” se poate deplasa spre stânga pe măsură ce dimensiunea eșantionului crește. Este indicat de o săgeată în figură. Pentru majoritatea eșantioanelor, este exprimată doar partea curbei din dreapta modului. Doar cu cantități mari de date colectate pe vaste zone biogeografice poate fi urmărită întreaga curbă. S Curba în formă de - indică natura complexă a diferențierii și a suprapunerii nișei. Majoritatea speciilor din ecosistemele naturale deschise există mai degrabă în competiție pentru resurse decât în competiție directă; Multe adaptări fac posibilă împărțirea nișelor fără excluderea competitivă din habitat. Acest model este cel mai probabil pentru comunitățile netulburate.
Distribuție logaritmicăîn teoria probabilității – o clasă de distribuții discrete. Distribuția logaritmică este utilizată într-o varietate de aplicații, inclusiv în genetică și fizică matematică. DefiniţieFie distribuția unei variabile aleatoare este dat de funcția de probabilitate: , Unde |
Citire: |
---|
Nou
- Aplicație mobilă Aliexpress
- Dispunerea tastaturii QWERTY și AZERTY Versiuni speciale ale tastaturii Dvorak
- Insula Sao Vicente Insula Sao Vicente
- Regulile pe care le încălcăm Este în regulă să-ți pui coatele pe masă?
- Care unități flash USB sunt cele mai fiabile și mai rapide?
- Conectarea unui laptop la un televizor prin cablu USB pentru conectarea unui laptop la un televizor VGA
- Schimbarea interfeței Steam - de la imagini simple la întreaga prezentare pe ecran Design nou steam
- Cum să anulați un abonament Megogo la televizor: instrucțiuni detaliate Cum să vă dezabonați de la abonamentele Megogo
- Cum să partiționați un disc cu Windows instalat fără a pierde date Partiționați discul 7
- De ce editorii nu pot edita toate paginile