Acasă - Antivirusuri
2 criterii. Testarea ipotezei despre independența randamentelor logaritmice

Testul Pearson χ 2 este o metodă neparametrică care ne permite să evaluăm semnificația diferențelor dintre numărul real (dezvăluit) de rezultate sau caracteristicile calitative ale eșantionului care se încadrează în fiecare categorie și numărul teoretic care poate fi așteptat în studiul studiat. grupuri dacă ipoteza nulă este adevărată. Pentru a spune simplu, metoda vă permite să evaluați semnificația statistică a diferențelor dintre doi sau mai mulți indicatori relativi (frecvențe, proporții).

1. Istoricul dezvoltării criteriului χ 2

Testul chi-pătrat pentru analiza tabelelor de contingență a fost dezvoltat și propus în 1900 de un matematician, statistician, biolog și filozof englez, fondatorul statisticii matematice și unul dintre fondatorii biometriei. Karl Pearson(1857-1936).

2. De ce este folosit testul Pearson χ 2?

Testul chi-pătrat poate fi utilizat în analiză tabele de contingență conţinând informaţii despre frecvenţa rezultatelor în funcţie de prezenţa unui factor de risc. De exemplu, tabel de urgență cu patru câmpuri arata asa:

Test statistic

Se numește regula prin care ipoteza I 0 este respinsă sau acceptată criteriu statistic. Numele criteriului, de regulă, conține o literă care denotă o caracteristică special compilată din clauza 2 a algoritmului de testare a ipotezelor statistice (a se vedea clauza 4.1), calculată în criteriu. In conditii a acestui algoritm criteriul s-ar numi „V-criteriu".

La testarea ipotezelor statistice, sunt posibile două tipuri de erori:

  • - Eroare de tip I(puteți respinge ipoteza I 0 când este de fapt adevărată);
  • - Eroare de tip II(puteți accepta ipoteza I 0 când de fapt nu este adevărată).

Probabilitate O se numește efectuarea unei erori de tip I nivelul de semnificație al criteriului.

Dacă pentru r indicați probabilitatea de a face o eroare de al doilea tip, apoi (l -p)- probabilitatea de a nu face o eroare de al doilea tip, care se numește puterea criteriului.

Testul de bunăstare a potrivirii lui Pearson x 2

Există mai multe tipuri de ipoteze statistice:

  • - despre legea distributiei;
  • - omogenitatea probelor;
  • - valorile numerice ale parametrilor de distribuție etc.

Vom lua în considerare ipoteza despre legea distribuției folosind exemplul testului Pearson x 2 de bunătate a potrivirii.

Criteriul acordului se numește criteriu statistic pentru testarea ipotezei nule despre legea presupusă a unei distribuții necunoscute.

Testul Pearson de bunătate a potrivirii se bazează pe o comparație a frecvențelor empirice (observate) și teoretice ale observațiilor calculate în ipoteza unei anumite legi de distribuție. Ipoteza #0 aici este formulată astfel: în funcție de caracteristica studiată, populația este distribuită normal.

Algoritmul de testare a ipotezelor statistice #0 pentru criteriu x 1 Pearson:

  • 1) propunem ipoteza I 0 - în funcţie de caracteristica studiată, populaţia generală este distribuită normal;
  • 2) calculați media eșantionului și abaterea standard a eșantionului O V;

3) în funcție de dimensiunea eșantionului disponibil n calculăm o caracteristică special compilată,

unde: i, sunt frecvențe empirice, - frecvente teoretice,

p - dimensiunea eșantionului,

h- dimensiunea intervalului (diferența dintre două opțiuni adiacente),

Valori normalizate ale caracteristicii observate,

- funcția de masă. De asemenea, frecvențele teoretice

poate fi calculat folosind funcția standard MS Excel NORMIDIST folosind formula;

4) folosind distribuția eșantionului, determinăm valoarea critică a unei caracteristici special compilate xl P

5) când ipoteza # 0 este respinsă, când ipoteza # 0 este acceptată.

Exemplu. Să luăm în considerare semnul X- valoarea indicatorilor de testare pentru condamnații dintr-una din coloniile de corecție pentru o anumită caracteristică psihologică, prezentați sub forma unei serii de variații:

La un nivel de semnificație de 0,05, testați ipoteza despre distribuția normală a populației.

1. Pe baza distribuției empirice se poate formula o ipoteză H 0: conform criteriului studiat „valoarea indicatorului de testare pentru o anumită caracteristică psihologică”, populația generală

aşteptat este distribuit normal. Ipoteza alternativă 1: conform criteriului studiat „valoarea indicatorului de test pentru o anumită caracteristică psihologică”, populația generală de condamnați nu este distribuită în mod normal.

2. Să calculăm caracteristicile numerice ale eșantionului:

Intervale

x g y

X) sch

3. Să calculăm caracteristica special compilată j 2 . Pentru a face acest lucru, în penultima coloană a tabelului precedent găsim frecvențele teoretice folosind formula, iar în ultima coloană

Să calculăm caracteristicile % 2. Primim x 2 = 0,185.

Pentru claritate, vom construi un poligon al distribuției empirice și o curbă normală bazată pe frecvențe teoretice (Fig. 6).

Orez. 6.

4. Determinați numărul de grade de libertate s: k = 5, t = 2, s = 5-2-1 = 2.

Conform tabelului sau folosind funcția standard MS Excel „HI20BR” pentru numărul de grade de libertate 5 = 2 și nivelul de semnificație a = 0,05 vom găsi valoarea critică a criteriului xl P .=5,99. Pentru nivelul de semnificație O= 0,01 valoarea criteriului critic X%. = 9,2.

5. Valoarea criteriului observat X=0,185 mai puțin decât toate valorile găsite Hk R.-> prin urmare, ipoteza I 0 este acceptată la ambele niveluri de semnificație. Discrepanța dintre frecvențele empirice și cele teoretice este nesemnificativă. Prin urmare, datele observaționale sunt în concordanță cu ipoteza unei distribuții normale a populației. Astfel, conform criteriului studiat „valoarea indicatorului de testare pentru o anumită caracteristică psihologică”, populația generală de condamnați este distribuită normal.

  • 1. Koryachko A.V., Kulichenko A.G. Matematică superioară și metode matematice în psihologie: un ghid pentru orele practice pentru studenții Facultății de Psihologie. Ryazan, 1994.
  • 2. Nasledov A.D. Metode matematice de cercetare psihologică. Analiza și interpretarea datelor: manual, manual. Sankt Petersburg, 2008.
  • 3. Sidorenko E.V. Metode prelucrare matematicăîn psihologie. Sankt Petersburg, 2010.
  • 4. Soshnikova L.A. etc Multidimensional analiza statisticaîn economie: manual, manual pentru universități. M., 1999.
  • 5. Suhodolsky E.V. Metode matematice în psihologie. Harkov, 2004.
  • 6. Shmoilova R.A., Minashkin V.E., Sadovnikova N.A. Workshop de teoria statisticii: manual, manual. M., 2009.
  • Gmurman V.E. Teoria probabilității și statistică matematică. p. 465.
Există un rezultat (1) Niciun rezultat (0) Total
Există un factor de risc (1) O B A+B
Fără factor de risc (0) C D C+D
Total A+C B+D A+B+C+D

Cum să completezi un astfel de tabel de urgență? Să ne uităm la un mic exemplu.

Se efectuează un studiu privind efectul fumatului asupra riscului de a dezvolta hipertensiune arterială. În acest scop, au fost selectate două grupe de subiecți - primul a inclus 70 de persoane care fumează cel puțin 1 pachet de țigări zilnic, al doilea a inclus 80 de nefumători de aceeași vârstă. În primul grup, 40 de persoane aveau hipertensiune arterială. În al doilea, hipertensiunea arterială a fost observată la 32 de persoane. În consecință, tensiunea arterială normală la grupul de fumători a fost la 30 de persoane (70 - 40 = 30) și la grupul de nefumători - la 48 (80 - 32 = 48).

Completăm tabelul de contingență cu patru câmpuri cu datele inițiale:

În tabelul de contingență rezultat, fiecare linie corespunde unui grup specific de subiecți. Coloanele arată numărul de persoane cu hipertensiune arterială sau tensiune arterială normală.

Sarcina care i se pune cercetătorului este: există diferențe semnificative statistic între frecvența persoanelor cu tensiune arterială printre fumători și nefumători? La această întrebare se poate răspunde calculând testul chi-pătrat Pearson și comparând valoarea rezultată cu cea critică.

3. Condiții și limitări pentru aplicarea testului chi-pătrat Pearson

  1. Indicatorii comparabili trebuie măsurați în scara nominala(de exemplu, sexul pacientului este bărbat sau femeie) sau în ordinal(de exemplu, gradul de hipertensiune arterială, luând valori de la 0 la 3).
  2. Această metodă vă permite să analizați nu numai tabele cu patru câmpuri, atunci când atât factorul, cât și rezultatul sunt variabile binare, adică au doar două valori posibile (de exemplu, masculin sau feminin, prezența sau absența unei anumite boli în anamneza...). Testul chi-pătrat Pearson poate fi utilizat și în cazul analizării tabelelor cu mai multe câmpuri, când un factor și (sau) rezultat ia trei sau mai multe valori.
  3. Grupurile care sunt comparate trebuie să fie independente, adică testul chi-pătrat nu trebuie utilizat atunci când se compară observațiile înainte-după. Testul McNemar(când se compară două populații înrudite) sau calculate Testul Q al lui Cochran(în cazul comparării a trei sau mai multe grupuri).
  4. La analizarea tabelelor cu patru câmpuri valorile asteptateîn fiecare celulă trebuie să existe cel puțin 10. Dacă în cel puțin o celulă fenomenul așteptat ia o valoare de la 5 la 9, trebuie calculat testul chi-pătrat cu amendamentul lui Yates. Dacă în cel puțin o celulă fenomenul așteptat este mai mic de 5, atunci analiza ar trebui să fie utilizată Testul exact al lui Fisher.
  5. Când se analizează tabelele cu mai multe câmpuri, numărul așteptat de observații nu trebuie să fie mai mic de 5 în mai mult de 20% din celule.

4. Cum se calculează testul chi-pătrat Pearson?

Pentru a calcula testul chi-pătrat aveți nevoie de:

Acest algoritm este aplicabil atât pentru tabelele cu patru câmpuri, cât și pentru tabelele cu mai multe câmpuri.

5. Cum se interpretează valoarea testului chi-pătrat Pearson?

Dacă valoarea obținută a criteriului χ 2 este mai mare decât valoarea critică, concluzionăm că există o relație statistică între factorul de risc studiat și rezultatul la nivelul corespunzător de semnificație.

6. Exemplu de calcul al testului chi-pătrat Pearson

Să determinăm semnificația statistică a influenței factorului de fumat asupra incidenței hipertensiunii arteriale folosind tabelul discutat mai sus:

  1. Calculăm valorile așteptate pentru fiecare celulă:
  2. Aflați valoarea testului chi-pătrat Pearson:

    χ 2 = (40-33,6) 2 /33,6 + (30-36,4) 2 /36,4 + (32-38,4) 2 /38,4 + (48-41,6) 2 /41,6 = 4,396.

  3. Numărul de grade de libertate f = (2-1)*(2-1) = 1. Cu ajutorul tabelului, găsim valoarea critică a testului chi-pătrat Pearson, care la nivelul de semnificație p=0,05 și numărul de grade de libertate 1 este 3,841.
  4. Comparăm valoarea obţinută a testului chi-pătrat cu cea critică: 4,396 > 3,841, prin urmare, dependenţa incidenţei hipertensiunii arteriale de prezenţa fumatului este semnificativă statistic. Nivelul de semnificație al acestei relații corespunde p<0.05.

OPR. Frecvențele empirice sunt de fapt frecvențe observate.

TESTAREA IPOTEZEI DESPRE DISTRIBUȚIA POPULAȚIEI. CRITERIU PEARSON

După cum sa menționat mai devreme, ipotezele despre tipul de distribuție pot fi făcute pe baza premiselor teoretice. Cu toate acestea, indiferent cât de bine este aleasă legea distribuției teoretice, discrepanțe sunt inevitabile între distribuțiile empirice și teoretice. Se pune firesc întrebarea: aceste discrepanțe se explică doar prin circumstanțe aleatorii asociate cu un număr limitat de observații sau sunt semnificative și sunt asociate cu faptul că legea distribuției teoretice a fost aleasă prost. Pentru a răspunde la această întrebare se folosește criteriul acordului, adică.

OPR. Criteriul acordului se numește criteriu de testare a unei ipoteze despre legea presupusă a unei distribuții necunoscute.

Pentru fiecare criteriu, i.e. distribuția corespunzătoare, se întocmesc de obicei tabele din care se găsesc k kr (vezi anexe). După ce este găsit punctul critic, valoarea observată a criteriului este calculată din datele eșantionului LA obs. Dacă LA obs > k kr, atunci ipoteza nulă este respinsă, dacă dimpotrivă, atunci este acceptată.

Să descriem aplicarea criteriului Pearson la testarea ipotezei despre distribuția normală a populației. Criteriul Pearson răspunde la întrebarea dacă discrepanța dintre frecvențele empirice și teoretice se datorează întâmplării?

Criteriul Pearson, ca orice criteriu, nu dovedește validitatea ipotezei, ci doar stabilește, la nivelul de semnificație acceptat, acordul sau dezacordul acesteia cu datele observaționale.

Deci, să se obțină o distribuție empirică dintr-un eșantion de mărimea n. La nivelul de semnificație a, este necesar să se testeze ipoteza nulă: populația este distribuită normal.

Variabila aleatoare c 2 = este luată ca criteriu de testare a ipotezei nule, unde sunt frecvențele empirice; - frecvenţe teoretice.

Acest SV are o distribuție c 2 cu k - grade de libertate. Numărul de grade de libertate se află prin egalitatea k=m –r -1, m – numărul de intervale parțiale de eșantionare; r – numărul de parametri de distribuție. Pentru distributie normala r=2 (a și s), apoi k=m –3.

Pentru a testa ipoteza nulă la un nivel de semnificație dat: populația este distribuită în mod normal, trebuie să:

1.Calculați media eșantionului și abaterea standard a eșantionului.

2. Calculați frecvențele teoretice,

unde n este dimensiunea eșantionului; h – pas (diferența dintre două opțiuni adiacente); ; Valorile funcției sunt determinate de aplicație.

3. Comparați frecvențele empirice și teoretice folosind testul Pearson. Pentru a face acest lucru:



a) găsiți valoarea observată a criteriului;

b) folosind tabelul punctelor critice ale distribuției c 2, folosind un nivel de semnificație dat a și numărul de grade de libertate k, se găsește punctul critic.

Dacă< - нет оснований отвергнуть нулевую гипотезу. Если >- se respinge ipoteza nulă.

Comentariu. Puține frecvențe (<5) следует объединить; в этом случае и соответствующие им теоретические частоты также надо сложить. Если производилось объединение частот, то при определении числа степеней свободы следует в качестве m принять число групп выборки, оставшихся после объединения частот.

Scopul criteriului

Testul χ 2 este utilizat în două scopuri;

1) să compare distribuţia empirică a caracteristicii cu teoretic - uniformă, normală sau altfel;

2) pentru comparație două, trei sau mai multe empirice distribuții cu aceeași caracteristică 12.

Descrierea criteriului

testul χ2 răspunde la întrebarea dacă valori diferite ale unei caracteristici apar cu o frecvență egală în distribuțiile empirice și teoretice sau în două sau mai multe distribuții empirice.

Avantajul metodei este că vă permite să comparați distribuțiile caracteristicilor prezentate pe orice scară, pornind de la scara numelor (vezi paragraful 1.2). În cel mai simplu caz al unei distribuții alternative „da - nu”, „a permis un defect - nu a permis un defect”, „a rezolvat o problemă - nu a rezolvat o problemă”, etc., putem aplica deja criteriul χ 2.

Să presupunem că un observator înregistrează numărul de pietoni care au ales dreapta sau stânga a două căi simetrice pe drumul de la punctul A la punctul B (vezi Fig. 4.3).

Să presupunem, în urma a 70 de observații, se stabilește că E\ oamenii au ales calea cea bună și doar 19 - cea stângă. Folosind testul χ 2 putem determina dacă o distribuție dată de selecții diferă de o distribuție uniformă în care ambele piste ar fi selectate la aceeași frecvență. Aceasta este o opțiune de comparație pentru cele primite umpiric distributii de la teoretic. O astfel de sarcină poate apărea, de exemplu, în cercetările psihologice aplicate legate de proiectare în arhitectură, sisteme de comunicații etc.

Dar să ne imaginăm că observatorul rezolvă o cu totul altă problemă: este ocupat cu problemele reglementării bilaterale. Coincidența distribuției rezultate cu una uniformă îl interesează într-o măsură mult mai mică decât coincidența sau discrepanța datelor sale cu datele altor cercetători. El știe că oamenii cu dominație la piciorul drept tind să se rotească în sens invers acelor de ceasornic, iar cei cu dominanță la picior stâng tind să se rotească în sensul acelor de ceasornic și că, într-un studiu realizat de colegi, 13 dominanță la picior stâng a fost găsită la 26 de persoane din 100 examinate.

Folosind metoda χ 2, el poate compara două distribuții empirice: un raport de 51:19 în propriul său eșantion și un raport de 74:26 în eșantionul altor cercetători.

Aceasta este o opțiune compararea a două empirice distribuții după cel mai simplu criteriu alternativ (desigur, cel mai simplu din punct de vedere matematic, și deloc psihologic).

În mod similar, putem compara distribuțiile de opțiuni din trei sau mai multe alternative. De exemplu, dacă într-un eșantion de 50 de persoane 30 de persoane au ales răspunsul (a), 15 persoane au ales răspunsul (b) și 5 persoane au ales răspunsul (c), atunci putem folosi metoda χ 2 pentru a verifica dacă această distribuție diferă de un distribuție uniformă sau din distribuirea răspunsurilor într-un alt eșantion, unde răspunsul (a) a fost ales de 10 persoane, răspunsul (b) de 25 de persoane, răspunsul (c) de 15 persoane.

În cazurile în care o caracteristică este măsurată cantitativ, să zicem, V puncte, secunde sau milimetri, este posibil să fim nevoiți să combinăm întreaga abundență de valori ale atributelor în mai multe cifre. De exemplu, dacă timpul de rezolvare a unei probleme variază de la 10 la 300 de secunde, atunci putem introduce 10 sau 5 cifre, în funcție de dimensiunea eșantionului. De exemplu, acestea vor fi următoarele categorii: 0-50 de secunde; 51-100 secunde; 101-150 secunde etc. Apoi folosim metoda χ 2 va compara frecvențele de apariție a diferitelor categorii ale atributului, dar în rest diagrama fundamentală nu se modifică.

Comparând distribuția empirică cu cea teoretică, determinăm gradul de discrepanță între frecvențele empirice și teoretice.

Prin compararea a două distribuții empirice, determinăm gradul de discrepanță între frecvențele empirice și frecvențele teoretice care ar fi observate dacă cele două distribuții empirice ar coincide. Formulele pentru calcularea frecvențelor teoretice vor fi date în mod specific pentru fiecare opțiune de comparație.

Cu cât discrepanța este mai mareîntre două distribuții comparate, cu atât mai mult empiric valoarea y).

Ipoteze

Sunt posibile mai multe variante de ipoteze, în funcție de sarcini,

pe care ni le-am propus.

Prima varianta:

H 0: Distribuția empirică rezultată a caracteristicii nu diferă de distribuția teoretică (de exemplu, uniformă).

H 1: Distribuția empirică obținută a caracteristicii diferă de distribuția teoretică.

A doua varianta:

H 0: Distribuția empirică 1 nu este diferită de distribuția empirică 2.

H 1: Distribuția empirică 1 este diferită de distribuția empirică 2.

A treia varianta:

H 0: Distribuțiile empirice 1, 2, 3, ... nu diferă unele de altele.

H 1: Distribuțiile empirice 1, 2, 3, ... diferă unele de altele.

Criteriul χ 2 ne permite să testăm toate cele trei ipoteze.

Reprezentarea grafică a criteriului

Să ilustrăm un exemplu cu alegerea pistelor din dreapta sau din stânga pe drumul de la punctul A la punctul B. În fig. 4.4, frecvența de selecție a pistei din stânga este reprezentată de coloana din stânga, iar frecvența de selecție a pistei din dreapta este reprezentată de coloana din dreapta a histogramei 14. Frecvențele relative de alegere sunt măsurate pe axa y, adică frecvențele de alegere ale unei anumite piese, raportate la numărul total de observații. Pentru pista din stânga, frecvența relativă, numită și frecvență, este 19/70, adică 0,27, iar pentru pista dreaptă este 51/70, adică 0,73.

Dacă ambele căi ar fi alese cu probabilitate egală, atunci jumătate dintre subiecți ar alege calea corectă, iar jumătate ar alege calea din stânga. Probabilitatea de a alege fiecare dintre căi ar fi 0,50.

Vedem că abaterile frecvențelor empirice de la această valoare sunt destul de semnificative. Este posibil ca diferențele dintre distribuțiile empirice și teoretice să fie de încredere.

În fig. Figura 4.5 prezintă de fapt două histograme, dar barele sunt grupate astfel încât în ​​stânga să fie comparate frecvențele de preferință pentru pista din stânga în alegerea observatorului nostru (1) și în eșantionul lui T.A. Dobrohotova și N.N. Bragina (2), iar în dreapta - frecvențele de preferință pentru calea corectă în aceleași două mostre.

Vedem că diferențele dintre probe sunt foarte mici. criteriul χ2, va confirma cel mai probabil coincidența celor două distribuții.

Limitări ale criteriului

1. Mărimea eșantionului trebuie să fie suficient de mare: n30. La n<30 критерий χ2 dă valori foarte aproximative. Precizia criteriului crește cu mare n.

2. Frecvența teoretică pentru fiecare celulă din tabel nu trebuie să fie mai mică de 5: f> 5. Aceasta înseamnă că dacă numărul de cifre este predeterminat și nu poate fi modificat, atunci nu putem aplica metoda χ2 fără a acumula un anumit număr minim de observații. Dacă, de exemplu, dorim să ne testăm ipotezele că frecvența apelurilor către serviciul de telefonie Trust este distribuită inegal pe 7 zile ale săptămânii, atunci vom avea nevoie de 5 * 7 = 35 de apeluri. Astfel, dacă numărul de cifre ( k) predeterminat, ca în acest caz, numărul minim de observații ( n min) se determină prin formula: n min = k*5.

3. Categoriile selectate trebuie să „scoate” întreaga distribuție, adică să acopere întreaga gamă de variabilitate a caracteristicilor. În acest caz, gruparea în categorii trebuie să fie aceeași în toate distribuțiile comparate.

4. Este necesar să se facă o „corecție de continuitate” atunci când se compară distribuțiile de caracteristici care iau doar 2 valori. La efectuarea unei corecții, valoarea lui χ 2 scade (vezi Exemplul cu corecția de continuitate).

5. Categoriile trebuie să nu se suprapună: dacă o observație este atribuită unei categorii, atunci nu mai poate fi atribuită nici unei alte categorii.

Suma observațiilor după rang trebuie să fie întotdeauna egală cu numărul total de observații.

O întrebare legitimă este ce ar trebui considerat numărul de observații - numărul de alegeri, reacții, acțiuni sau numărul de subiecți care fac o alegere, manifestă reacții sau efectuează acțiuni. Dacă un subiect prezintă mai multe reacții și toate sunt înregistrate, atunci numărul de subiecți nu se va potrivi cu numărul de reacții. Putem rezuma reacțiile fiecărui subiect, așa cum, de exemplu, acest lucru se face în metoda Heckhausen pentru studierea motivației de realizare sau în Testul de toleranță la frustrare S. Rosenzweig și compara distribuțiile sumelor individuale de reacții în mai multe eșantioane.

În acest caz, numărul de observații va fi numărul de subiecți. Dacă numărăm frecvența reacțiilor de un anumit tip în eșantion în ansamblu, obținem o distribuție a reacțiilor de diferite tipuri, iar în acest caz numărul de observații va fi numărul total de reacții înregistrate, și nu numărul de subiecte.

Din punct de vedere matematic, regula de independență a cifrelor este respectată în ambele cazuri: o observație aparține uneia și numai unei cifre a distribuției.

Ne putem imagina și o variantă a studiului în care studiem distribuția alegerilor unui subiect. În terapia cognitiv-comportamentală, de exemplu, clientului i se cere să înregistreze de fiecare dată momentul exact al apariției unei reacții nedorite, de exemplu, atacuri de frică, depresie, izbucniri de furie, gânduri de autodepreciare etc. Ulterior, psihoterapeutul analizează datele obținute, identificând orele în care simptomele nefavorabile apar mai des și ajută clientul să construiască un program individual de prevenire a reacțiilor adverse.

Este posibil folosind criteriul χ2 să demonstreze că unele ore sunt mai frecvente în această distribuție individuală, iar altele sunt mai puțin frecvente? Toate observațiile sunt dependente, deoarece se referă la același subiect; în același timp, toate evacuările nu se suprapun, deoarece unul și același atac se referă la una și o singură descărcare (în acest caz, ora unu după-amiaza). Aparent, utilizarea metodei χ2 va fi o oarecare simplificare în acest caz. Atacurile de frică, furie sau depresie pot apărea în mod repetat în timpul zilei și este posibil ca, de exemplu, dimineața devreme la ora 6 și seara târziu, atacurile de la ora 12 să apară de obicei împreună în aceeași zi: la aceeași oră, un atac de 3 ore în timpul zilei apare nu mai devreme de o zi după atacul anterior și nu mai puțin de două zile înainte de următorul etc. Se pare că vorbim aici despre un model matematic complex sau ceva de genul ăsta, care nu poate fi „crezut”. prin algebră.” Cu toate acestea, în scopuri practice, poate fi utilă folosirea unui criteriu pentru a identifica neuniformitatea sistematică în apariția oricăror evenimente semnificative, alegeri, preferințe etc. la aceeași persoană.

Deci, aceeași observație ar trebui să aparțină unei singure categorii. Dar dacă să considerăm fiecare subiect sau fiecare reacție a subiectului ca o observație este o întrebare a cărei soluție depinde de scopurile studiului (vezi, de exemplu, Ganzen V.A., Balin V.D., 1991, p. 10).

Principala „limitare” a criteriului χ 2 - că pare înfricoșător de complex pentru majoritatea cercetătorilor.

Să încercăm să depășim mitul dificultății de neînțeles a criteriului χ 2 . Pentru a însufleți prezentarea, luați în considerare un exemplu literar plin de umor.

Metoda discutată mai sus funcționează bine dacă semnul calitativ care ne interesează ia două valori (există tromboză - nu, marțianul este verde - roz). Mai mult, deoarece metoda este un analog direct al testului Student, numărul de eșantioane comparate ar trebui să fie, de asemenea, egal cu două.

Este clar că atât numărul de valori ale atributelor, cât și numărul de mostre se pot dovedi a fi mai mult de două. Pentru a analiza astfel de cazuri, este necesară o altă metodă similară cu analiza varianței. În aparență, această metodă, pe care o vom prezenta acum, este foarte diferită de criteriul z, dar de fapt există multe în comun între ele.

Pentru a nu merge prea departe pentru un exemplu, să începem cu problema tocmai discutată a trombozei de șunt. Acum vom lua în considerare nu proporția, ci numărul de pacienți cu tromboză. Să introducem rezultatele testului în tabel (Tabelul 5.1). Pentru fiecare grupa vom indica numarul de pacienti cu tromboza si fara tromboza. Avem două semne: medicamentul (aspirina-placebo) și tromboza (da-nu); tabelul arată toate combinațiile lor posibile, de aceea un astfel de tabel se numește tabel de contingență. În acest caz, dimensiunea mesei este de 2x2.

Să ne uităm la celulele situate pe o diagonală care merge din colțul din stânga sus spre colțul din dreapta jos. Numerele din ele sunt considerabil mai mari decât numerele din alte celule ale tabelului. Acest lucru sugerează o asociere între utilizarea aspirinei și riscul de tromboză.

Acum să ne uităm la masă. 5.2. Acesta este un tabel cu cifrele așteptate pe care le-am obține dacă aspirina nu ar avea niciun efect asupra riscului de tromboză. Vom discuta cum să calculăm numerele așteptate puțin mai jos, dar deocamdată să fim atenți la caracteristicile externe ale tabelului. Pe lângă numerele fracționale ușor înfricoșătoare din celule, puteți observa o altă diferență din tabel. 5.1 sunt datele rezumate pentru grupuri în coloana din dreapta și pentru tromboză în linia de jos. În colțul din dreapta jos este numărul total de pacienți din studiu. Despre-



Vă rugăm să rețineți că, deși numerele din celulele din Fig. 5.1 și 5.2 sunt diferite, sumele în rânduri și coloane sunt aceleași.

Cum calculezi numerele așteptate? 25 de persoane au primit placebo, aspirina - 19. Tromboza de șunt a apărut în 24 din 44 examinați, adică în 54,55% din cazuri nu a apărut - în 20 din 44, adică în 45,45% din cazuri. Să acceptăm ipoteza nulă că aspirina nu are niciun efect asupra riscului de tromboză. Apoi tromboza trebuie observată cu o frecvență egală de 54,55% în grupurile placebo și aspirina. Calculând cât este 54,55% din 25 și 19, obținem 13,64 și, respectiv, 10,36. Acestea sunt numărul așteptat de pacienți cu tromboză din grupul placebo și cu aspirina. În același mod, se poate obține numărul așteptat de pacienți fără tromboză în grupul placebo - 45,45% din 25, adică 11,36 în grupul cu aspirina - 45,45% din 19, adică 8,64; Vă rugăm să rețineți că numerele așteptate sunt calculate la a doua zecimală - această precizie va fi necesară în calcule ulterioare.

Să comparăm tabelul. 5.1 și 5.2. Numerele din celule variază destul de mult. Prin urmare, imaginea reală diferă de cea care ar fi fost observată dacă aspirina nu ar fi avut efect asupra riscului de tromboză. Acum, tot ce rămâne este să construiți un criteriu care să caracterizeze aceste diferențe cu un număr și apoi să găsiți valoarea sa critică - adică să faceți același lucru ca în cazul criteriilor F, t sau z.

Cu toate acestea, mai întâi să ne amintim un alt principiu deja familiar pentru noi -




Mer - Lucrarea lui Conahan care compară halotanul și morfina, și anume partea în care a fost comparată mortalitatea operativă. Datele corespunzătoare sunt date în tabel. 5.3. Forma tabelului este aceeași cu cea a tabelului. 5.1. La rândul său, masa 5.4 similar cu tabelul. 5.2 conține numere așteptate, adică numere calculate în ipoteza că letalitatea este independentă de agentul anestezic. Din toate cele 128 operate, 110 au rămas în viață, adică 85,94%. Dacă alegerea anesteziei nu ar avea efect asupra mortalității, atunci în ambele grupuri proporția supraviețuitorilor ar fi aceeași, iar numărul supraviețuitorilor ar fi în grupul cu halotan - 85,94% din 61, adică 52,42 în grupul cu morfină - 85,94 % din 67, adică 57,58. Numărul așteptat de decese poate fi obținut în același mod. Să comparăm tabelele 5.3 și 5.4. Spre deosebire de exemplul anterior, diferențele dintre valorile așteptate și cele observate sunt foarte mici. După cum am aflat mai devreme, nu există nicio diferență în ceea ce privește mortalitatea. Se pare că suntem pe drumul cel bun.

x2 criterii pentru un tabel 2x2

Testul x2 (a se citi „chi-pătrat”) nu necesită ipoteze despre parametrii populației din care sunt extrase eșantioanele - acesta este primul dintre testele neparametrice cu care suntem introduși. Să începem să-l construim. În primul rând, ca întotdeauna, criteriul trebuie să dea un număr,


care ar servi ca măsură a diferenței dintre datele observate și cele așteptate, adică, în acest caz, diferența dintre tabelul numerelor observate și așteptate. În al doilea rând, criteriul trebuie să țină cont de faptul că o diferență de, să zicem, un pacient este mai semnificativă atunci când numărul așteptat este mic decât atunci când numărul așteptat este mare.

Să definim criteriul x2 după cum urmează:

unde O este numărul observat într-o celulă a tabelului de contingență, E este numărul așteptat în aceeași celulă. Însumarea se efectuează pe toate celulele tabelului. După cum se poate vedea din formulă, cu cât diferența dintre numerele observate și cele așteptate este mai mare, cu atât contribuția celulei la valoarea %2 este mai mare. În acest caz, celulele cu un număr mic așteptat au o contribuție mai mare. Astfel, criteriul satisface ambele cerințe - în primul rând, măsoară diferențele și, în al doilea rând, ia în considerare amploarea acestora în raport cu numerele așteptate.

Să aplicăm criteriile x2 la datele despre tromboza de șunt. În tabel 5.1 arată numerele observate și tabelul. 5.2 - așteptat.


Valoarea z obținută din aceleași date a fost, de asemenea, similară. Se poate arăta că pentru tabelele de contingență de dimensiunea 2x2 este valabilă egalitatea X2 = z2.

Valoarea critică %2 poate fi găsită într-un mod care ne este bine cunoscut. În fig. Figura 5.7 prezintă distribuția valorilor posibile ale lui X2 pentru tabelele de contingență de dimensiunea 2x2 pentru cazul în care nu există nicio legătură între caracteristicile studiate. Valoarea lui X2 depășește 3,84 doar în 5% din cazuri. Astfel, 3,84 este valoarea critică pentru nivelul de semnificație de 5%. În exemplul trombozei în șunt, am obținut o valoare de 7,10, așa că respingem ipoteza că nu există asociere între utilizarea aspirinei și cheaguri de sânge. Dimpotrivă, datele din Tabel. 5.3 sunt în acord cu ipoteza că halotanul și morfina au același efect asupra mortalității postoperatorii.

Desigur, ca toate criteriile de semnificație, x2 oferă o evaluare probabilistică a adevărului unei anumite ipoteze. De fapt, aspirina poate să nu aibă niciun efect asupra riscului de tromboză. De fapt, halotanul și morfina pot avea efecte diferite asupra mortalității operatorii. Dar, după cum a arătat criteriul, ambele sunt puțin probabile.

Aplicarea criteriului x2 este legală dacă numărul așteptat în oricare dintre celule este mai mare sau egal cu 5. Această condiție este similară cu condiția de aplicabilitate a criteriului z.

Valoarea critică %2 depinde de dimensiunea tabelului de contingență, adică de numărul de tratamente comparate (rânduri de tabel) și de numărul de rezultate posibile (coloane de tabel). Mărimea tabelului este exprimată prin numărul de grade de libertate v:

V = (r - 1)(s - 1),

unde r este numărul de rânduri și c este numărul de coloane. Pentru tabele de dimensiunea 2x2 avem v = (2 - l)(2 - l) = l. Valorile critice ale %2 pentru diferite v sunt date în tabel. 5.7.

Formula dată anterior pentru x2 în cazul unui tabel 2x2 (adică cu 1 grad de libertate) oferă valori ușor umflate (o situație similară a fost cu criteriul z). Acest lucru se datorează faptului că distribuția teoretică a lui x2 este continuă, în timp ce setul de valori x2 calculate este discret. În practică, acest lucru va duce la respingerea prea des a ipotezei nule. Pentru a compensa acest efect, corecția Yeats este introdusă în formula: (1 O - E - -

Rețineți că corecția Yeats se aplică numai când v = 1, adică pentru tabele 2x2.

Să aplicăm corecția Yeats pentru a studia relația dintre administrarea de aspirină și tromboza de șunt (Tabelele 5.1 și 5.2):


După cum vă amintiți, fără corecția Yates, valoarea %2 a fost 7,10. Valoarea %2 corectată a fost mai mică de 6,635, valoarea critică pentru nivelul de semnificație de 1%, dar a depășit totuși 5,024, valoarea critică pentru nivelul de semnificație de 2,5%.

Criteriul X2 pentru un tabel de contingență arbitrar

Acum luați în considerare cazul în care tabelul de contingență are mai multe rânduri sau coloane decât două. Rețineți că testul z nu este aplicabil în astfel de cazuri.

În cap. 3 am arătat că alergatul reduce numărul de menstruații*. Aceste modificări vă determină să consultați un medic? În tabel Tabelul 5.5 prezintă rezultatele unui sondaj între participanții la studiu. Susțin aceste date ipoteza că alergatul nu afectează probabilitatea de a consulta un medic pentru nereguli menstruale?

Din cele 165 de femei examinate, 69 (adică 42%) au consultat un medic, restul de 96 (adică 58%) nu au consultat un medic. Dacă

* În același timp, pentru simplitatea calculelor, am presupus că dimensiunile tuturor celor trei grupe - control, sportive și sportive - să fie aceleași. Acum vom folosi date reale.


jogging-ul nu afectează probabilitatea de a consulta un medic, atunci în fiecare dintre grupuri 42% dintre femei ar fi trebuit să consulte un medic. În tabel 5.6 arată valorile așteptate corespunzătoare. Sunt datele reale foarte diferite de ele?

Pentru a răspunde la această întrebare, să calculăm %2:

(14 - 22,58)2 (40 - 31,42)2 (9 - 9,62)2

22,58 31,42 9,62

(14 - 13,38)2 (46 - 36,80)2 (42 - 51,20)2

13,38 36,80 51,20

Numărul de rânduri din tabelul de contingență este de trei, coloanele sunt două, deci numărul de grade de libertate este v = (3 - 1)(2 - 1) = 2. Dacă ipoteza despre absența diferențelor intergrupuri este corectă , apoi, după cum se vede din tabel. 5.7 valoarea %2 va depăși 9,21 în cel mult 1% din cazuri. Valoarea rezultată este mai mare. Astfel, la un nivel de semnificație de 0,01, putem respinge ipoteza că nu există nicio legătură între alergare și vizitele la medic despre menstruație. Cu toate acestea, după ce am aflat că există o conexiune, totuși nu vom putea indica care (care) grupuri diferă de restul.

Deci, ne-am familiarizat cu criteriul %2. Iată procedura de utilizare.

Construiți un tabel de urgență pe baza datelor disponibile.

Numărați numărul de obiecte din fiecare rând și din fiecare coloană și aflați ce proporție din numărul total de obiecte alcătuiesc aceste valori.

Cunoscând aceste cote, calculați numerele așteptate cu două zecimale - numărul de obiecte care
ar cădea în fiecare celulă a tabelului dacă nu ar exista o relație între rânduri și coloane

Găsiți valoarea care caracterizează diferențele dintre valorile observate și cele așteptate. Dacă tabelul de urgență este 2x2, aplicați corecția Yeats

Calculați numărul de grade de libertate, selectați nivelul de semnificație și conform tabelului. 5.7, determinați valoarea critică %2. Compară-l cu ceea ce ai pentru masa ta.

După cum vă amintiți, pentru tabelele de contingență de dimensiunea 2x2, criteriul x2 este aplicabil numai atunci când toate numerele așteptate sunt mai mari de 5. Cum rămâne cu tabelele de dimensiuni mai mari? În acest caz, criteriul %2 este aplicabil dacă toate numerele așteptate nu sunt mai mici de 1 și proporția de celule cu numere așteptate mai mici de 5 nu depășește 20%. Dacă aceste condiții nu sunt îndeplinite, criteriile x2 pot da rezultate false. În acest caz, este posibil să colectați date suplimentare, dar acest lucru nu este întotdeauna fezabil. Există o modalitate mai ușoară - de a combina mai multe rânduri sau coloane. Mai jos vă vom arăta cum să faceți acest lucru.

Conversia tabelelor de urgență

În secțiunea anterioară am stabilit existența unei legături între alergare și vizitele la medic despre menstruație sau, ceea ce este la fel, existența unor diferențe între grupuri în frecvența vizitelor la medic. Cu toate acestea, nu am putut determina care grupuri diferă unele de altele și care nu. Am întâlnit o situație similară în analiza varianței. La compararea mai multor grupuri, analiza varianței vă permite să detectați însuși faptul existenței diferențelor, dar nu indică ce grupuri ies în evidență. Aceasta din urmă poate fi realizată folosind mai multe proceduri de comparare, despre care am discutat în capitolul. 4. Ceva similar se poate face cu tabelele de contingență.

Privind la masă. 5.5, se poate presupune că sportivele și sportivele au consultat un medic mai des decât femeile din grupul de control. Diferența dintre sportive și sportive pare nesemnificativă.

Să testăm ipoteza conform căreia atletele și sportivii de sex feminin

V 0,50 0,25 0,10 0,05 0,025 0,01 0,005 0,001
41 40,335 46,692 52,949 56,942 60,561 64,950 68,053 74,745
42 41,335 47,766 54,090 58,124 61,777 66,206 69,336 76,084
43 42,335 48,840 55,230 59,304 62,990 67,459 70,616 77,419
44 43,335 49,913 56,369 60,481 64,201 68,710 71,893 78,750
45 44,335 50,985 57,505 61,656 65,410 69,957 73,166 80,077
46 45,335 52,056 58,641 62,830 66,617 71,201 74,437 81,400
47 46,335 53,127 59,774 64,001 67,821 72,443 75,704 82,720
48 47,335 54,196 60,907 65,171 69,023 73,683 76,969 84,037
49 48,335 55,265 62,038 66,339 70,222 74,919 78,231 85,351
50 49,335 56,334 63,167 67,505 71,420 76,154 79,490 86,661
Nivel de semnificație

J. H. Zar, Biostatistical Analysis, Ed. a doua, Prentice-Hall, Englewood Cliffs, N.J., 1984.

Ei vizitează medicul la fel de des. Pentru a face acest lucru, selectați un subtabel din tabelul original care conține date pentru aceste două grupuri. În tabel 5.8 arată numerele observate și așteptate; sunt destul de aproape.



 


Citire:



Opțiuni „Peste tot acasă” și „Peste tot acasă, Rusia” MTS - descriere, cost, cum să vă conectați

Opțiuni „Peste tot acasă” și „Peste tot acasă, Rusia” MTS - descriere, cost, cum să vă conectați

Rusia ocupă o zonă imensă a planetei noastre. Mulți ruși se confruntă cu călătorii frecvente în țara lor natală: călătorii de afaceri, călătorii...

Cum să recuperați sau să resetați o parolă de utilizator Windows

Cum să recuperați sau să resetați o parolă de utilizator Windows

Dacă ați uitat brusc parola pentru contul dvs. Windows, atunci nu aveți de ales decât să căutați o modalitate de a o reseta sau de a seta...

Cum să eliminați complet Programul Avast pentru a elimina Avast

Cum să eliminați complet Programul Avast pentru a elimina Avast

Un utilitar specializat pentru eliminarea completă și corectă a antivirusului Avast din sistem. Programul a fost creat de echipa oficială de dezvoltare...

Aplicație mobilă Aliexpress

Aplicație mobilă Aliexpress

Astăzi, progresul merge înainte și devine foarte popular dacă magazinul are o aplicație mobilă. Aliexpress nu face excepție. Navigare...

imagine-alimentare RSS