Начало - Антивируси
2 критерия. Тестване на хипотезата за независимостта на логаритмичните възвръщаемости

Тестът χ 2 на Pearson е непараметричен метод, който ни позволява да оценим значимостта на разликите между действителния (разкрит) брой резултати или качествени характеристики на извадката, които попадат във всяка категория, и теоретичния брой, който може да се очаква в изследваните групи, ако нулевата хипотеза е вярна. Казано по-просто, методът ви позволява да оцените статистическата значимост на разликите между два или повече относителни показателя (честоти, пропорции).

1. История на развитието на критерия χ 2

Тестът хи-квадрат за анализиране на таблици за непредвидени обстоятелства е разработен и предложен през 1900 г. от английски математик, статистик, биолог и философ, основател на математическата статистика и един от основателите на биометрията Карл Пиърсън(1857-1936).

2. Защо се използва χ 2 тестът на Pearson?

Тестът хи-квадрат може да се използва при анализа таблици за непредвидени обстоятелствасъдържаща информация за честотата на резултатите в зависимост от наличието на рисков фактор. например, таблица с четири полетаизглежда така:

Статистически тест

Нарича се правилото, по което хипотезата I 0 се отхвърля или приема статистически критерий.Името на критерия, като правило, съдържа буква, която обозначава специално съставена характеристика от клауза 2 на алгоритъма за проверка на статистическата хипотеза (виж клауза 4.1), изчислена в критерия. В условия на този алгоритъмще се нарече критерият „В- критерий".

При тестване на статистически хипотези са възможни два вида грешки:

  • - Грешка тип I(можете да отхвърлите хипотезата I 0, когато тя действително е вярна);
  • - Грешка тип II(можете да приемете хипотезата I 0, когато тя всъщност не е вярна).

Вероятност Аизвикване на грешка от тип I ниво на значимост на критерия.

Ако за rобозначават вероятността да направите грешка от втори тип, тогава (l - p) -вероятността да не направите грешка от тип II, която се нарича силата на критерия.

Тест за съответствие на Pearson x 2

Има няколко вида статистически хипотези:

  • - за закона за разпределение;
  • - хомогенност на пробите;
  • - числени стойности на параметрите на разпределението и др.

Ще разгледаме хипотезата за закона за разпределение, като използваме примера на теста за съответствие x 2 на Pearson.

Критерий за съгласиесе нарича статистически критерий за проверка на нулевата хипотеза за приетия закон на неизвестно разпределение.

Тестът за съответствие на Pearson се основава на сравнение на емпирични (наблюдавани) и теоретични честоти на наблюдения, изчислени при допускането на определен закон за разпределение. Хипотеза #0 тук е формулирана по следния начин: според изследваната характеристика популацията е нормално разпределена.

Алгоритъм за тестване на статистическа хипотеза #0 за критерий х 1Пиърсън:

  • 1) излагаме хипотезата I 0 - според изследваната характеристика генералната съвкупност е разпределена нормално;
  • 2) изчислете средната стойност на извадката и стандартното отклонение на извадката О V;

3) според наличната обемна проба пизчисляваме специално съставена характеристика,

където: i са емпирични честоти, - теоретични честоти,

п -размер на извадката,

ч- размера на интервала (разликата между две съседни опции),

Нормализирани стойности на наблюдаваната характеристика,

- функция на масата. Също и теоретични честоти

може да се изчисли с помощта на стандартната MS Excel функция NORMIDIST по формулата;

4) използвайки разпределението на извадката, ние определяме критичната стойност на специално съставена характеристика xl P

5) когато хипотеза # 0 е отхвърлена, когато хипотеза # 0 е приета.

Пример.Нека разгледаме знака X- стойността на показателите за тестване на осъдените в една от поправителните колонии за някаква психологическа характеристика, представена под формата на вариационна серия:

При ниво на значимост 0,05 проверете хипотезата за нормалното разпределение на популацията.

1. Въз основа на емпиричното разпределение може да се изложи хипотеза H 0: според изследвания критерий „стойността на тестовия показател за дадена психологическа характеристика“, генералната съвкупност

се очаква да се разпредели нормално. Алтернативна хипотеза 1: според изследвания критерий „стойност на тестовия показател за дадена психологическа характеристика” генералната съвкупност от осъдени не е нормално разпределена.

2. Нека изчислим числените характеристики на извадката:

Интервали

x g y

X) sch

3. Нека изчислим специално съставената характеристика j 2 . За да направите това, в предпоследната колона на предишната таблица намираме теоретичните честоти, използвайки формулата, а в последната колона

Нека изчислим характеристиките % 2. получаваме х 2 = 0,185.

За по-голяма яснота ще изградим многоъгълник на емпиричното разпределение и нормална крива на базата на теоретични честоти (фиг. 6).

ориз. 6.

4. Определете броя на степените на свобода s: k = 5, t = 2, s = 5-2-1 = 2.

Според таблицата или използвайки стандартната функция на MS Excel “HI20BR” за броя на степените на свобода 5 = 2 и нивото на значимост а = 0,05 ще намерим критичната стойност на критерия xl P .=5,99. За ниво на значимост А= 0,01 стойност на критичния критерий X%. = 9,2.

5. Наблюдавана стойност на критерия X=0,185 по-малко от всички намерени стойности Hk R.->следователно хипотезата I 0 се приема и при двете нива на значимост. Несъответствието между емпиричните и теоретичните честоти е незначително. Следователно данните от наблюденията са в съответствие с хипотезата за нормално разпределение на населението. Така според изследвания критерий „стойността на тестовия показател за дадена психологическа характеристика” генералната съвкупност от осъдени се разпределя нормално.

  • 1. Корячко А.В., Куличенко А.Г. Висша математика и математически методи в психологията: ръководство за практически занятияза студенти от факултета по психология. Рязан, 1994 г.
  • 2. Наследов А.Д. Математически методи на психологическо изследване. Анализ и интерпретация на данни: Учебник, пособие. Санкт Петербург, 2008 г.
  • 3. Сидоренко Е.В. Методи математическа обработкав психологията. Санкт Петербург, 2010 г.
  • 4. Сошникова Л.А. и т.н. Многоизмерен статистически анализпо икономика: Учебник, помагало за ВУЗ. М., 1999.
  • 5. Суходолски Е.В. Математически методи в психологията. Харков, 2004.
  • 6. Шмойлова Р.А., Минашкин В.Е., Садовникова Н.А. Практикум по теория на статистиката: Учебник, пособие. М., 2009.
  • Гмурман В.Е. Теория на вероятностите и математическа статистика. С. 465.
Има резултат (1) Без резултат (0) Общо
Има рисков фактор (1) А Б A+B
Няма рисков фактор (0) В г C+D
Общо A+C B+D A+B+C+D

Как да попълните такава таблица за непредвидени обстоятелства? Нека да разгледаме един малък пример.

Провежда се проучване за влиянието на тютюнопушенето върху риска от развитие на артериална хипертония. За целта са избрани две групи субекти - първата включва 70 души, които пушат поне 1 кутия цигари дневно, втората включва 80 непушачи на същата възраст. В първата група 40 души са били с високо кръвно налягане. При втория артериална хипертония е наблюдавана при 32 души. Съответно нормално кръвно налягане в групата на пушачите има 30 души (70 - 40 = 30), а в групата на непушачите - 48 (80 - 32 = 48).

Попълваме таблицата с четири полета с първоначалните данни:

В получената таблица за непредвидени обстоятелства всеки ред съответства на определена група субекти. Колоните показват броя на хората с артериална хипертония или нормално кръвно налягане.

Задачата, която се поставя пред изследователя е: има ли статистически значими разлики между честотата на хората с кръвно налягане сред пушачите и непушачите? На този въпрос може да се отговори чрез изчисляване на хи-квадрат теста на Pearson и сравняване на получената стойност с критичната.

3. Условия и ограничения за използване на хи-квадрат теста на Pearson

  1. Сравнимите показатели трябва да се измерват в номинална скала(например полът на пациента е мъж или жена) или в редни(например степента на артериална хипертония, приемайки стойности от 0 до 3).
  2. Този методви позволява да анализирате не само таблици с четири полета, когато и факторът, и резултатът са двоични променливи, тоест те имат само две възможни стойности (например мъж или жена, наличието или отсъствието на определено заболяване в анамнеза...). Хи-квадрат тестът на Pearson може да се използва и в случай на анализ на таблици с много полета, когато фактор и (или) резултат приемат три или повече стойности.
  3. Групите, които се сравняват, трябва да бъдат независими, т.е. тестът хи-квадрат не трябва да се използва, когато се сравняват наблюдения преди-след. Тест на Макнемар(при сравняване на две свързани съвкупности) или изчислени Q тест на Cochran(при сравнение на три или повече групи).
  4. При анализиране на таблици с четири полета очаквани стойностивъв всяка клетка трябва да има поне 10. Ако в поне една клетка очакваното явление приеме стойност от 5 до 9, трябва да се изчисли тестът хи-квадрат с поправката на Йейтс. Ако в поне една клетка очакваното явление е по-малко от 5, тогава анализът трябва да използва Точен тест на Фишер.
  5. При анализиране на многополеви таблици очакваният брой наблюдения не трябва да бъде по-малък от 5 в повече от 20% от клетките.

4. Как да изчислим хи-квадрат теста на Pearson?

За да изчислите теста хи-квадрат, трябва:

Този алгоритъм е приложим както за таблици с четири полета, така и за таблици с много полета.

5. Как да интерпретираме стойността на хи-квадрат теста на Pearson?

Ако получената стойност на критерия χ 2 е по-голяма от критичната стойност, заключаваме, че има статистическа връзка между изследвания рисков фактор и резултата на съответното ниво на значимост.

6. Пример за изчисляване на хи-квадрат теста на Pearson

Нека да определим статистическата значимост на влиянието на фактора тютюнопушене върху честотата на артериалната хипертония, използвайки таблицата, разгледана по-горе:

  1. Изчисляваме очакваните стойности за всяка клетка:
  2. Намерете стойността на хи-квадрат теста на Pearson:

    χ 2 = (40-33,6) 2 /33,6 + (30-36,4) 2 /36,4 + (32-38,4) 2 /38,4 + (48-41,6) 2 /41,6 = 4,396.

  3. Брой степени на свобода f = (2-1)*(2-1) = 1. Използвайки таблицата, намираме критичната стойност на хи-квадрат теста на Pearson, която при ниво на значимост p=0,05 и броя на степените на свобода 1 са 3,841.
  4. Сравняваме получената стойност на хи-квадрат теста с критичната: 4,396 > 3,841, следователно зависимостта на честотата на артериалната хипертония от наличието на тютюнопушене е статистически значима. Нивото на значимост на тази връзка съответства на т<0.05.

OPR. Емпиричните честоти всъщност са наблюдавани честоти.

ПРОВЕРКА НА ХИПОТЕЗАТА ЗА РАЗПРЕДЕЛЕНИЕТО НА НАСЕЛЕНИЕТО. КРИТЕРИЙ НА ПИЪРСЪН

Както беше отбелязано по-рано, предположения за вида на разпределението могат да бъдат направени въз основа на теоретични предпоставки. Въпреки това, без значение колко добре е избран теоретичният закон за разпределение, несъответствията между емпиричното и теоретичното разпределение са неизбежни. Естествено възниква въпросът дали тези несъответствия се дължат само на случайни обстоятелства, свързани с ограничен брой наблюдения, или са значителни и са свързани с факта, че теоретичният закон за разпределение е избран неправилно. За отговор на този въпрос се използва критерият за съгласие, т.е.

OPR. Критерий за съгласиесе нарича критерий за проверка на хипотеза за приетия закон на неизвестно разпределение.

За всеки критерий, т.е. съответно разпределение, обикновено се съставят таблици, от които намират к kr (вижте приложенията). След като бъде намерена критичната точка, наблюдаваната стойност на критерия се изчислява от примерните данни ДОнаб. Ако ДО obs > к kr, тогава нулевата хипотеза се отхвърля, ако обратното, тогава се приема.

Нека опишем приложението на критерия на Пиърсън за проверка на хипотезата за нормалното разпределение на съвкупността. Критерият на Пиърсън отговаря на въпроса дали несъответствието между емпиричните и теоретичните честоти се дължи на случайност?

Критерият на Pearson, както всеки критерий, не доказва валидността на хипотезата, а само установява, при приетото ниво на значимост, нейното съгласие или несъгласие с данните от наблюденията.

И така, нека се получи емпирично разпределение от извадка с размер n. При ниво на значимост a е необходимо да се провери нулевата хипотеза: популацията е нормално разпределена.

Случайната променлива c 2 = се приема като критерий за проверка на нулевата хипотеза, където са емпиричните честоти; - теоретични честоти.

Това SV има c 2 разпределение с k - степени на свобода. Броят на степените на свобода се намира от равенството k=m –r -1, m – броят на частичните интервали на дискретизация; r – брой параметри на разпределението. За нормално разпределение r=2 (a и s), тогава k=m –3.

За да тествате нулевата хипотеза при дадено ниво на значимост: популацията е нормално разпределена, трябва да:

1. Изчислете средната стойност на извадката и стандартното отклонение на извадката.

2. Изчислете теоретичните честоти,

където n е размерът на извадката; h – стъпка (разлика между две съседни опции); ; Стойностите на функцията се определят от приложението.

3. Сравнете емпиричните и теоретичните честоти, като използвате теста на Pearson. За да направите това:



а) намиране на наблюдаваната стойност на критерия;

б) използвайки таблицата на критичните точки на разпределението c 2, използвайки дадено ниво на значимост a и броя на степените на свобода k, намерете критичната точка.

Ако< - нет оснований отвергнуть нулевую гипотезу. Если >- нулевата хипотеза се отхвърля.

Коментирайте.Малко честоти (<5) следует объединить; в этом случае и соответствующие им теоретические частоты также надо сложить. Если производилось объединение частот, то при определении числа степеней свободы следует в качестве m принять число групп выборки, оставшихся после объединения частот.

Предназначение на критерия

Тестът χ 2 се използва за две цели;

1) да се сравни емпиричното разпределение на характеристиката с теоретичен -униформа, нормална или друга;

2) за сравнение две, три или повече емпиричниразпределения на една и съща характеристика 12.

Описание на критерия

χ2 тест отговаря на въпроса дали различни стойности на дадена характеристика се срещат с еднаква честота в емпирични и теоретични разпределения или в две или повече емпирични разпределения.

Предимството на метода е, че ви позволява да сравнявате разпределенията на характеристиките, представени във всяка скала, като се започне от скалата на имената (вижте параграф 1.2). В най-простия случай на алтернативно разпределение „да - не“, „допусна дефект - не позволи дефект“, „реши проблем - не реши проблем“ и т.н., вече можем да приложим критерия χ 2.

Да кажем, че някой наблюдател записва броя на пешеходците, избрали дясната или лявата от две симетрични пътеки по пътя от точка А до точка Б (виж Фиг. 4.3).

Да предположим, че в резултат на 70 наблюдения се установи, че E\души избраха правилния път, а само 19 - левия. Използване на теста χ 2 можем да определим дали дадено разпределение на селекциите се различава от равномерно разпределение, при което и двете песни биха били избрани на една и съща честота. Това е вариант за сравнение на полученото хмпириновразпределения от теоретичен.Такава задача може да възникне например в приложни психологически изследвания, свързани с дизайна в архитектурата, комуникационните системи и др.

Но нека си представим, че наблюдателят решава съвсем различен проблем: той е зает с проблемите на двустранното регулиране. Съвпадението на полученото разпределение с равномерното го интересува в много по-малка степен, отколкото съвпадението или несъответствието на неговите данни с данните на други изследователи. Той знае, че хората с доминантен десен крак са склонни да кръжат обратно на часовниковата стрелка, а хората с доминантен ляв крак са склонни да кръжат по посока на часовниковата стрелка и че в проучване на колеги 13 е установено доминиране на левия крак при 26 души от 100 изследвани.

Използвайки метода χ 2, той може да сравни две емпирични разпределения: съотношение 51:19 в собствената му извадка и съотношение 74:26 в извадката на други изследователи.

Това е вариант сравнение на две емпиричниразпределения по най-простия алтернативен критерий (разбира се, най-простия от математическа гледна точка, а не психологически).

По подобен начин можем да сравним разпределението на изборите от три или повече алтернативи. Например, ако в извадка от 50 души 30 души са избрали отговор (a), 15 души са избрали отговор (b) и 5 ​​души са избрали отговор (c), тогава можем да използваме метода χ 2, за да проверим дали това разпределение се различава от равномерно разпределение или от разпределението на отговорите в друга извадка, където отговор (а) е избран от 10 души, отговор (б) от 25 души, отговор (в) от 15 души.

В случаите, когато една характеристика се измерва количествено, да речем, Vточки, секунди или милиметри, може да се наложи да комбинираме цялото изобилие от стойности на атрибути в няколко цифри. Например, ако времето за решаване на задача варира от 10 до 300 секунди, тогава можем да въведем 10 или 5 цифри, в зависимост от размера на извадката. Например, това ще бъдат следните категории: 0-50 секунди; 51-100 секунди; 101-150 секунди и т.н. След това използваме метода χ 2 ще сравни честотите на поява на различни категории на атрибута, но в противен случай основната диаграма не се променя.

Сравнявайки емпиричното разпределение с теоретичното, ние определяме степента на несъответствие между емпиричните и теоретичните честоти.

Чрез сравняване на две емпирични разпределения ние определяме степента на несъответствие между емпиричните честоти и теоретичните честоти, които биха се наблюдавали, ако двете емпирични разпределения съвпадат. Формулите за изчисляване на теоретичните честоти ще бъдат специално дадени за всяка опция за сравнение.

Колкото по-голямо е несъответствиетомежду две сравнени разпределения, толкова повечеемпиричен стойност y).

Хипотези

Възможни са няколко варианта на хипотези в зависимост от задачите,

които сами си поставяме.

Първи вариант:

H 0: Полученото емпирично разпределение на характеристиката не се различава от теоретичното (например равномерно) разпределение.

H 1: Полученото емпирично разпределение на характеристиката се различава от теоретичното разпределение.

Втори вариант:

H 0: Емпирично разпределение 1 не се различава от емпирично разпределение 2.

H 1: Емпирично разпределение 1 е различно от емпирично разпределение 2.

Трети вариант:

H 0: Емпирични разпределения 1, 2, 3, ... не се различават едно от друго.

H 1: Емпирични разпределения 1, 2, 3, ... се различават едно от друго.

Критерият χ 2 ни позволява да тестваме и трите версии на хипотезите.

Графично представяне на критерия

Нека илюстрираме пример с избора на дясна или лява следа по пътя от точка А до точка Б. На фиг. 4.4, честотата на избор на лявата песен е представена от лявата колона, а честотата на избор на дясната песен е представена от дясната колона на хистограмата 14. Относителните честоти на избор се измерват по оста y, т.е. честотите на избор на определена песен, свързани с общия брой наблюдения. За лявата писта относителната честота, наричана още честота, е 19/70, т.е. 0,27, а за дясната писта е 51/70, т.е. 0,73.

Ако и двата пътя бяха избрани с еднаква вероятност, тогава половината от субектите биха избрали правилния път, а половината биха избрали левия път. Вероятността за избор на всеки от пътищата ще бъде 0,50.

Виждаме, че отклоненията на емпиричните честоти от тази стойност са доста значителни. Възможно е разликите между емпиричното и теоретичното разпределение да са надеждни.

На фиг. Фигура 4.5 всъщност представя две хистограми, но лентите са групирани така, че отляво се сравняват честотите на предпочитанията за лявата следа в избора на нашия наблюдател (1) и в извадката на T.A. Доброхотова и Н.Н. Брагина (2), а вдясно - честотите на предпочитанията за правилната песен в същите две проби.

Виждаме, че разликите между пробите са много малки. χ2 критерий, най-вероятно ще потвърди съвпадението на двете разпределения.

Ограничения на критерия

1. Размерът на извадката трябва да е достатъчно голям: п30. При п<30 критерий χ2 дава много приблизителни стойности. Точността на критерия нараства с големи п.

2. Теоретичната честота за всяка клетка от таблицата не трябва да бъде по-малка от 5: f> 5. Това означава, че ако броят на цифрите е предварително определен и не може да бъде променен, тогава не можем да приложим метода χ2 без да натрупаме определен минимален брой наблюдения. Ако, например, искаме да проверим нашите допускания, че честотата на обажданията до телефонната услуга Trust е неравномерно разпределена през 7 дни от седмицата, тогава ще ни трябват 5 * 7 = 35 обаждания. Така, ако броят на цифрите ( к) предварително зададен, както в този случай, минималният брой наблюдения ( п мин) се определя по формулата: n min = к*5.

3. Избраните категории трябва да „изгребват“ цялото разпределение, тоест да покриват целия диапазон на променливост на характеристиките. В този случай групирането в категории трябва да е еднакво във всички сравнявани разпределения.

4. Необходимо е да се направи „корекция на непрекъснатостта“, когато се сравняват разпределения на характеристики, които приемат само 2 стойности. При извършване на корекция стойността на χ 2 намалява (виж Пример с корекция за непрекъснатост).

5. Категориите не трябва да се припокриват: ако дадено наблюдение е присвоено на една категория, то вече не може да бъде причислено към друга категория.

Сумата от наблюденията по ранг винаги трябва да бъде равна на общия брой наблюдения.

Легитимен въпрос е какво трябва да се счита за броя на наблюденията - броя на изборите, реакциите, действията или броя на субектите, които правят избор, проявяват реакции или извършват действия. Ако субектът проявява няколко реакции и всички те са записани, тогава броят на субектите няма да съответства на броя на реакциите. Можем да обобщим реакциите на всеки субект, както например това се прави в метода на Heckhausen за изследване на мотивацията за постижения или в S. Rosenzweig Frustration Tolerance Test, и да сравним разпределението на отделните суми от реакции в няколко проби.

В този случай броят на наблюденията ще бъде броят на субектите. Ако преброим честотата на реакциите от определен тип в извадката като цяло, получаваме разпределение на реакциите от различни видове и в този случай броят на наблюденията ще бъде общият брой на записаните реакции, а не броят на предмети.

От математическа гледна точка и в двата случая се спазва правилото за независимост на цифрите: едно наблюдение принадлежи на една и само една цифра от разпределението.

Можем да си представим вариант на изследването, при който изучаваме разпределението на избора на един предмет. В когнитивно-поведенческата терапия, например, клиентът е помолен да записва всеки път точното време на възникване на нежелана реакция, например пристъпи на страх, депресия, изблици на гняв, самоиронични мисли и др. Впоследствие психотерапевтът анализира получените данни, като идентифицира часовете, през които неблагоприятните симптоми се появяват по-често, и помага на клиента да изгради индивидуална програма за предотвратяване на нежелани реакции.

Възможно ли е използването на критерия χ2 докажете, че някои часове са по-чести в това индивидуално разпределение, а други са по-рядко? Всички наблюдения са зависими, тъй като се отнасят до един и същи предмет; в същото време всички изхвърляния не се припокриват, тъй като една и съща атака се отнася за едно и само едно изхвърляне (в този случай един час следобед). Очевидно използването на метода χ2 ще бъде известно опростяване в този случай. Пристъпите на страх, гняв или депресия могат да се появят многократно през деня и може да се окаже, че рано сутринта в 6 часа и късно вечерта в 12 часа обикновено се появяват заедно в един и същи ден: по едно и също време, дневна 3-часова атака се появява не по-рано от един ден след предишната атака и не по-малко от два дни преди следващата и т.н. Очевидно тук говорим за сложен математически модел или нещо подобно, на което не може да се „вярва по алгебра." Въпреки това, за практически цели, може да е полезно да се използва критерий, за да се идентифицират систематичните неравномерности в настъпването на всякакви значими събития, избори, предпочитания и т.н. при едно и също лице.

Така че едно и също наблюдение трябва да принадлежи само към една категория. Но дали да се разглежда всеки субект или всяка реакция на субекта като наблюдение е въпрос, чието решение зависи от целите на изследването (виж например Ganzen V.A., Balin V.D., 1991, p. 10).

Основното „ограничение“ на критерия χ 2 - че изглежда плашещо сложно за повечето изследователи.

Нека се опитаме да преодолеем мита за неразбираемата трудност на критерия χ 2 . За да оживите презентацията, помислете за хумористичен литературен пример.

Обсъденият по-горе метод работи добре, ако качественият знак, който ни интересува, приема две стойности (има тромбоза - не, марсианецът е зелен - розов). Освен това, тъй като методът е пряк аналог на теста на Стюдънт, броят на сравняваните проби също трябва да бъде равен на две.

Ясно е, че както броят на стойностите на атрибутите, така и броят на пробите може да се окаже повече от две. За анализ на такива случаи е необходим друг метод, подобен на дисперсионния анализ. На външен вид този метод, който ще представим сега, е много различен от критерия z, но всъщност между тях има много общо.

За да не отиваме твърде далеч за пример, нека започнем с току-що обсъдения проблем с тромбозата на шънта. Сега ще разгледаме не дела, а броя на пациентите с тромбоза. Нека въведем резултатите от теста в таблицата (Таблица 5.1). За всяка група ще посочим броя на пациентите с тромбоза и без тромбоза. Имаме два признака: лекарството (аспирин-плацебо) и тромбозата (да-не); таблицата показва всички техни възможни комбинации, следователно такава таблица се нарича таблица за непредвидени обстоятелства. В този случай размерът на масата е 2x2.

Нека разгледаме клетките, разположени по диагонал, преминаващ от горния ляв към долния десен ъгъл. Числата в тях са видимо по-големи от числата в другите клетки на таблицата. Това предполага връзка между употребата на аспирин и риска от тромбоза.

Сега да погледнем таблицата. 5.2. Това е таблица с очакваните числа, които бихме получили, ако аспиринът нямаше ефект върху риска от тромбоза. Ще обсъдим как да изчислим очакваните числа малко по-ниско, но засега нека обърнем внимание на външните характеристики на таблицата. Освен леко плашещите дробни числа в клетките, можете да забележите и друга разлика от таблицата. 5.1 са обобщените данни за групите в дясната колона и за тромбозата в долния ред. В долния десен ъгъл е общият брой пациенти в изпитването. За-



Моля, имайте предвид, че въпреки че числата в клетките на фиг. 5.1 и 5.2 са различни, сумите в редове и колони са еднакви.

Как изчислявате очакваните числа? 25 души са получили плацебо, аспирин - 19. Тромбоза на шънта е възникнала при 24 от 44 изследвани, т.е. в 54,55% от случаите не е настъпила - при 20 от 44, т.е. в 45,45% от случаите. Нека приемем нулевата хипотеза, че аспиринът няма ефект върху риска от тромбоза. Тогава трябва да се наблюдава тромбоза с еднаква честота от 54,55% в групите на плацебо и аспирин. Изчислявайки колко е 54,55% от 25 и 19, получаваме съответно 13,64 и 10,36. Това е очакваният брой пациенти с тромбоза в групите на плацебо и аспирин. По същия начин може да се получи очакваният брой пациенти без тромбоза в групата на плацебо - 45,45% от 25, тоест 11,36 в групата на аспирин - 45,45% от 19, тоест 8,64. Моля, имайте предвид, че очакваните числа се изчисляват до втория знак след десетичната запетая - тази точност ще бъде необходима при по-нататъшни изчисления.

Нека сравним таблицата. 5.1 и 5.2. Числата в клетките варират доста. Следователно действителната картина се различава от тази, която би се наблюдавала, ако аспиринът нямаше ефект върху риска от тромбоза. Сега всичко, което остава, е да се изгради критерий, който да характеризира тези разлики с едно число, и след това да се намери критичната му стойност - тоест да се направи същото, както в случая с критериите F, t или z.

Първо обаче нека си припомним друг вече познат ни принцип -




Работата на Mer - Conahan, сравняваща халотан и морфин, а именно частта, в която е сравнена оперативната смъртност. Съответните данни са дадени в табл. 5.3. Формата на таблицата е същата като таблицата. 5.1. На свой ред маса 5.4 подобно на таблицата. 5.2 съдържа очаквани числа, т.е. числа, изчислени при предположението, че леталността не зависи от анестетика. От всички 128 оперирани 110 са живи, тоест 85,94%. Ако изборът на анестезия нямаше ефект върху смъртността, тогава и в двете групи делът на оцелелите щеше да бъде еднакъв и броят на оцелелите щеше да бъде в групата на халотан - 85,94% от 61, тоест 52,42 в групата на морфин - 85,94 % от 67, което е 57,58. Очакваният брой смъртни случаи може да се получи по същия начин. Нека сравним таблици 5.3 и 5.4. За разлика от предишния пример, разликите между очакваните и наблюдаваните стойности са много малки. Както разбрахме по-рано, няма разлика в смъртността. Изглежда, че сме на прав път.

x2 критерии за таблица 2x2

Тестът x2 (да се чете „хи-квадрат“) не изисква никакви предположения относно параметрите на съвкупността, от която са взети извадките - това е първият от непараметричните тестове, с които се запознаваме. Нека започнем да го изграждаме. Първо, както винаги, критерият трябва да даде едно число,


което би служило като мярка за разликата между наблюдаваните данни и очакваните, т.е. в този случай разликата между таблицата на наблюдаваните и очакваните числа. Второ, критерият трябва да вземе предвид, че разлика от, да речем, един пациент е по-значима, когато очакваният брой е малък, отколкото когато очакваният брой е голям.

Нека дефинираме критерия x2, както следва:

където O е наблюдаваното число в клетка от таблицата за непредвидени обстоятелства, E е очакваното число в същата клетка. Сумирането се извършва върху всички клетки на таблицата. Както може да се види от формулата, колкото по-голяма е разликата между наблюдаваните и очакваните числа, толкова по-голям е приносът на клетката към стойността %2. В този случай клетките с малък очакван брой имат по-голям принос. По този начин критерият удовлетворява и двете изисквания - първо, той измерва разликите и, второ, отчита тяхната величина спрямо очакваните числа.

Нека приложим критериите x2 към данните за тромбозата на шънта. В табл 5.1 показва наблюдаваните числа, а табл. 5.2 - очаквано.


Стойността z, получена от същите данни, също беше подобна. Може да се покаже, че за таблици на контингентност с размер 2x2 равенството X2 = z2 е в сила.

Критичната стойност %2 може да бъде намерена по добре познат ни начин. На фиг. Фигура 5.7 показва разпределението на възможните стойности на X2 за таблици за непредвидени обстоятелства с размер 2x2 за случая, когато няма връзка между изследваните характеристики. Стойността на X2 надвишава 3,84 само в 5% от случаите. Следователно 3,84 е критичната стойност за 5% ниво на значимост. В примера с тромбозата на шънта получихме стойност 7,10, така че отхвърляме хипотезата, че няма връзка между употребата на аспирин и кръвните съсиреци. Напротив, данните от табл. 5.3 са в добро съответствие с хипотезата, че халотанът и морфинът имат същия ефект върху следоперативната смъртност.

Разбира се, като всички критерии за значимост, x2 дава вероятностна оценка на истинността на определена хипотеза. Всъщност аспиринът може да няма ефект върху риска от тромбоза. Всъщност халотанът и морфинът могат да имат различен ефект върху оперативната смъртност. Но както показа критерият, и двете са малко вероятни.

Прилагането на критерия x2 е законно, ако очакваното число в някоя от клетките е по-голямо или равно на 5. Това условие е подобно на условието за приложимост на критерия z.

Критичната стойност %2 зависи от размера на таблицата за непредвидени обстоятелства, тоест от броя на сравняваните лечения (редове на таблицата) и броя на възможните резултати (колони на таблицата). Размерът на таблицата се изразява чрез броя на степените на свобода v:

V = (r - 1) (s - 1),

където r е броят на редовете, а c е броят на колоните. За таблици с размер 2x2 имаме v = (2 - l)(2 - l) = l. Критичните стойности на %2 за различни v са дадени в табл. 5.7.

Дадената по-рано формула за x2 в случай на таблица 2x2 (т.е. с 1 степен на свобода) дава леко завишени стойности (подобна ситуация беше с критерия z). Това е така, защото теоретичното разпределение на x2 е непрекъснато, докато наборът от изчислени стойности на x2 е дискретен. На практика това ще доведе до твърде често отхвърляне на нулевата хипотеза. За да се компенсира този ефект, корекцията на Йейтс се въвежда във формулата: (1 O - E - -

Обърнете внимание, че корекцията на Йейтс се прилага само когато v = 1, тоест за таблици 2x2.

Нека приложим корекцията на Йейтс, за да проучим връзката между приема на аспирин и шънтовата тромбоза (Таблици 5.1 и 5.2):


Както си спомняте, без корекцията на Йейтс стойността на %2 беше 7,10. Коригираната стойност на %2 беше по-малка от 6,635, критичната стойност за ниво на значимост от 1%, но все още надвишаваше 5,024, критичната стойност за ниво на значимост от 2,5%.

X2 критерий за произволна таблица за непредвидени обстоятелства

Сега разгледайте случая, когато таблицата за непредвидени обстоятелства има повече редове или колони от две. Имайте предвид, че z тестът не е приложим в такива случаи.

В гл. 3 показахме, че бягането намалява броя на менструациите*. Тези промени карат ли ви да отидете на лекар? В табл Таблица 5.5 показва резултатите от проучване сред участниците в изследването. Тези данни подкрепят ли хипотезата, че бягането не влияе върху вероятността да посетите лекар за нередовен менструален цикъл?

От прегледаните 165 жени 69 (т.е. 42%) са се консултирали с лекар, останалите 96 (т.е. 58%) не са се консултирали с лекар. Ако

* В същото време, за простота на изчисленията, приехме, че размерите и на трите групи - контрола, състезателки и състезателки - са еднакви. Сега ще използваме реални данни.


джогингът не влияе на вероятността да посетят лекар, то във всяка от групите 42% от жените трябва да са посетили лекар. В табл 5.6 показва съответните очаквани стойности. Много ли се различават реалните данни от тях?

За да отговорим на този въпрос, нека изчислим %2:

(14 - 22,58)2 (40 - 31,42)2 (9 - 9,62)2

22,58 31,42 9,62

(14 - 13,38)2 (46 - 36,80)2 (42 - 51,20)2

13,38 36,80 51,20

Броят на редовете в таблицата за контингентност е три, колоните са две, така че броят на степените на свобода е v = (3 - 1)(2 - 1) = 2. Ако хипотезата за липсата на междугрупови различия е вярна , то както се вижда от табл. 5.7 стойността на %2 ще надхвърли 9.21 в не повече от 1% от случаите. Получената стойност е по-голяма. Така при ниво на значимост 0,01 можем да отхвърлим хипотезата, че няма връзка между тичането и посещенията при лекар за менструация. Въпреки това, след като установихме, че съществува връзка, ние все пак няма да можем да посочим кои (кои) групи се различават от останалите.

И така, ние се запознахме с критерия %2. Ето процедурата за използването му.

Изградете таблица за непредвидени обстоятелства въз основа на наличните данни.

Пребройте броя на обектите във всеки ред и във всяка колона и намерете каква част от общия брой обекти съставляват тези стойности.

Познавайки тези дялове, изчислете очакваните числа с точност до два знака след десетичната запетая - броя на обектите, които
ще попадне във всяка клетка на таблицата, ако няма връзка между редове и колони

Намерете стойността, която характеризира разликите между наблюдаваните и очакваните стойности. Ако таблицата за непредвидени обстоятелства е 2x2, приложете корекцията на Йейтс

Изчислете броя на степените на свобода, изберете нивото на значимост и според таблицата. 5.7, определете критичната стойност %2. Сравнете го с това, което имате за вашата маса.

Както си спомняте, за таблици за непредвидени обстоятелства с размер 2x2, критерият x2 е приложим само в случай, че всички очаквани числа са по-големи от 5. Каква е ситуацията с таблици с по-големи размери? В този случай критерият %2 е приложим, ако всички очаквани числа не са по-малки от 1 и делът на клетките с очаквани числа по-малки от 5 не надвишава 20%. Ако тези условия не са изпълнени, критериите x2 може да дадат грешни резултати. В този случай е възможно да се съберат допълнителни данни, но това не винаги е възможно. Има по-лесен начин - да комбинирате няколко реда или колони. По-долу ще ви покажем как да направите това.

Преобразуване на таблици за непредвидени обстоятелства

В предишния раздел установихме наличието на връзка между бягането и посещенията при лекар за менструация или, което е същото, наличието на разлики между групите в честотата на посещенията при лекар. Не можахме обаче да определим кои групи се различават една от друга и кои не. Срещнахме подобна ситуация при анализа на дисперсията. Когато сравнявате няколко групи, анализът на дисперсията ви позволява да откриете самия факт на съществуването на разлики, но не посочва кои групи се открояват. Последното може да се направи с помощта на множество процедури за сравнение, които обсъдихме в глава. 4. Нещо подобно може да се направи с таблици за непредвидени обстоятелства.

Гледайки масата. 5.5, може да се приеме, че спортистките и спортистките са се консултирали с лекар по-често от жените от контролната група. Разликата между спортистки и спортистки изглежда незначителна.

Нека проверим хипотезата, че спортистките и спортистките

V 0,50 0,25 0,10 0,05 0,025 0,01 0,005 0,001
41 40,335 46,692 52,949 56,942 60,561 64,950 68,053 74,745
42 41,335 47,766 54,090 58,124 61,777 66,206 69,336 76,084
43 42,335 48,840 55,230 59,304 62,990 67,459 70,616 77,419
44 43,335 49,913 56,369 60,481 64,201 68,710 71,893 78,750
45 44,335 50,985 57,505 61,656 65,410 69,957 73,166 80,077
46 45,335 52,056 58,641 62,830 66,617 71,201 74,437 81,400
47 46,335 53,127 59,774 64,001 67,821 72,443 75,704 82,720
48 47,335 54,196 60,907 65,171 69,023 73,683 76,969 84,037
49 48,335 55,265 62,038 66,339 70,222 74,919 78,231 85,351
50 49,335 56,334 63,167 67,505 71,420 76,154 79,490 86,661
Ниво на значимост

J. H. Zar, Biostatistical Analysis, 2d ed, Prentice-Hall, Englewood Cliffs, N.J., 1984.

Еднакво често посещават лекар. За да направите това, изберете подтаблица от оригиналната таблица, съдържаща данни за тези две групи. В табл 5.8 показва наблюдаваните и очакваните числа; те са доста близки.



 


Прочетете:



Процес на рестартиране на браузъра Firefox

Процес на рестартиране на браузъра Firefox

Повечето проблеми с Firefox могат да бъдат коригирани, като следвате методите за отстраняване на неизправности, описани по-долу. Опитайте тези стъпки в ред. Ако някой не работи,...

Безплатно нулиране на нивата на мастилото в принтери Epson L100, L110, L210, L300, L350, L355, L550, L555, L800

Безплатно нулиране на нивата на мастилото в принтери Epson L100, L110, L210, L300, L350, L355, L550, L555, L800

Безплатно нулиране на нивото на мастилото за принтери Epson L110, L210, L300, L350, L355, L550, L555.

VK руската версия на моята страница

VK руската версия на моята страница

Инструкции за презареждане на контейнери с мастило и...

Форматиране на SD и microSD карти с памет: защо е необходимо и как да го направите

Форматиране на SD и microSD карти с памет: защо е необходимо и как да го направите

Социалната мрежа VKontakte моята страница днес е един от най-популярните интернет ресурси в света, да не говорим за Русия и Украйна. тя...

feed-image RSS