namai - Nešiojamieji kompiuteriai
Faktorių matrica. IN

Faktorinė analizė yra matematinės statistikos šaka. Jos, kaip ir kitų matematinės statistikos šakų, tikslai yra sukurti modelius, sąvokas ir metodus, kurie leistų analizuoti ir interpretuoti eksperimentinių ar stebimų duomenų masyvus, neatsižvelgiant į jų fizinę formą.

Viena iš tipiškiausių eksperimentinių duomenų vaizdavimo formų yra matrica, kurios stulpeliai atitinka įvairius parametrus, savybes, testus ir pan., o eilutės – atskirus objektus, reiškinius, režimus, aprašytus konkrečių parametrų reikšmių rinkiniu. Praktiškai matricos matmenys pasirodo gana dideli: pavyzdžiui, šios matricos eilučių skaičius gali svyruoti nuo kelių dešimčių iki kelių šimtų tūkstančių (pavyzdžiui, sociologinėse apklausose), o stulpelių skaičius – nuo ​​kelių dešimčių iki kelių šimtų tūkstančių. nuo vieno iki dviejų iki kelių šimtų. Tiesioginė, „vizuali“ tokio dydžio matricų analizė neįmanoma, todėl matematinėje statistikoje atsirado daug požiūrių ir metodų, skirtų „suspausti“ pradinę matricoje esančią informaciją iki valdomo dydžio, išgauti „esmiškiausią“ nuo pradinės informacijos, atmetant „antrinę“, „atsitiktinę“.

Analizuojant duomenis, pateiktus matricos forma, iškyla dviejų tipų problemos. Pirmojo tipo užduotys yra skirtos gauti „trumpą objektų pasiskirstymo aprašymą“, o antrojo tipo užduotys yra skirtos nustatyti parametrų ryšius.

Reikėtų nepamiršti, kad pagrindinė paskata šių užduočių atsiradimui slypi ne tik ir ne tiek siekime trumpai užkoduoti didelį skaičių masyvą, kiek daug svarbesnėje metodinio pobūdžio aplinkybėje: kadaise tai buvo galima trumpai apibūdinti didelį skaičių masyvą, tada galima manyti, kad atsiskleidė tam tikras objektyvus modelis, nulėmęs trumpo apibūdinimo galimybę; tačiau objektyvių šablonų paieška yra pagrindinis tikslas, kuriam, kaip taisyklė, renkami duomenys.

Minėti duomenų matricų apdorojimo būdai ir metodai skiriasi tuo, kokio tipo duomenų apdorojimo problema jais siekiama išspręsti, ir kokio dydžio matricomis jos yra taikomos.

Kalbant apie trumpo parametrų sąsajų su vidutiniu šių parametrų skaičiumi aprašymo problemą, šiuo atveju atitinkamoje koreliacijos matricoje yra kelios dešimtys ar šimtai skaičių ir ji pati savaime dar negali būti „trumpas aprašymas“. esamus ryšius tarp parametrų, bet turėtų būti su tuo tolesniam apdorojimui.

Faktorinė analizė yra būtent modelių ir metodų rinkinys, skirtas koreliacijos matricoje esančiai informacijai „suspausti“. Įvairių faktorinės analizės modelių pagrindas yra tokia hipotezė: stebimi ar išmatuoti parametrai yra tik netiesioginės tiriamo objekto ar reiškinio charakteristikos, tačiau iš tikrųjų egzistuoja vidiniai (paslėpti, tiesiogiai nestebimi) parametrai ar savybės, kurių skaičius. yra mažas ir kurie lemia stebimų parametrų reikšmes. Šie vidiniai parametrai paprastai vadinami veiksniais. Faktorinės analizės užduotis yra pateikti stebimus parametrus linijinių veiksnių derinių ir, galbūt, kai kurių papildomų, „neesminių“ dydžių – „trukdžių“ pavidalu. Įspūdingas faktas yra tai, kad, nors patys veiksniai nėra žinomi, tokį skaidymą galima gauti ir, be to, tokius veiksnius galima nustatyti, t.y. kiekvienam objektui galima nurodyti kiekvieno faktoriaus reikšmes.

Faktorių analizė, nepriklausomai nuo naudojamų metodų, pradedama apdorojant testų rinkiniu gautą tarpusavio koreliacijų lentelę, vadinamą koreliacijos matrica, ir baigiama faktorių matricos gavimu, t.y. lentelė, rodanti kiekvieno faktoriaus svorį arba apkrovą kiekvienam bandymui. 1 lentelė yra hipotetinė faktorių matrica, kurią sudaro tik du veiksniai.

Veiksniai pateikiami viršutinėje lentelės eilutėje nuo reikšmingiausių iki mažiausiai reikšmingų, o jų svoriai kiekviename iš 10 testų pateikiami atitinkamuose stulpeliuose.

1 lentelė

Hipotetinė faktorių matrica

Koordinačių ašys.Įprasta veiksnius geometriškai pavaizduoti koordinačių ašių pavidalu, kurių atžvilgiu kiekvienas testas gali būti pavaizduotas kaip taškas. Ryžiai. 1 paaiškina šią procedūrą. Šioje diagramoje kiekvienas iš 10 testų, pateiktų 1 lentelėje, rodomas kaip taškas, palyginti su dviem veiksniais, atitinkančiais I ir II ašis. Taigi 1 bandymas yra pavaizduotas tašku, kurio koordinatės I ašyje yra 0,74, o II ašyje - 0,54. Taškai, atstovaujantys likusius 9 testus, brėžiami panašiai, naudojant svorio reikšmes iš lentelės. 1.

Reikia pažymėti, kad koordinačių ašių padėtis nėra fiksuota duomenimis. Pradinė koreliacijos lentelė nustato tik testų padėtį (t. y. taškus 1 pav.) vienas kito atžvilgiu. Tie patys taškai gali būti nubraižyti plokštumoje su bet kokia koordinačių ašių padėtimi. Dėl šios priežasties atliekant faktorių analizę įprasta sukti ašis tol, kol gaunamas tinkamiausias ir lengviau interpretuojamas vaizdas.

Ryžiai. 1. Hipotetinio faktoriaus ekranas, rodantis dviejų grupių faktorių svorius kiekvienam iš 10 testų.

Fig. 1, ašys I" ir II", gautos po pasukimo, pažymėtos punktyrinėmis linijomis. Šis sukimas atliekamas pagal Thurstone siūlomus kriterijus teigiama įvairovė ir paprasta struktūra. Pirmasis apima ašių pasukimą į padėtį, kurioje pašalinami visi reikšmingi neigiami svoriai. Dauguma psichologų mano, kad neigiamų veiksnių įkrovos yra logiškai netinkamos tinkamumo testams, nes tokios apkrovos reiškia, kad kuo didesnis asmens balas pagal tam tikrą veiksnį, tuo mažesnis jo balas atitinkamame teste. Paprastas projektavimo kriterijus iš esmės reiškia, kad kiekvienas bandymas turi būti apkrautas kuo mažiau veiksnių.

Abu kriterijai atitinkantys veiksnius gali būti lengviausiai ir nedviprasmiškai interpretuojami. Jei testas turi didelę apkrovą vienam veiksniui, o kitiems veiksniams nėra reikšmingos apkrovos, galime sužinoti ką nors apie šio veiksnio pobūdį išnagrinėję turinį. šis testas. Priešingai, jei testas turi vidutinę arba mažą šešių veiksnių apkrovą, jis mažai ką pasakys apie bet kurio iš jų pobūdį.

Fig. 1 aiškiai parodo, kad pasukus koordinačių ašis, visi žodiniai testai (1-5) yra išilgai I ašies arba labai arti jos, o skaitmeniniai testai (6-10) yra glaudžiai sugrupuoti aplink II ašį. Naujos faktorių apkrovos, išmatuotos pasuktų ašių atžvilgiu, pateiktos lentelėje. 2. Faktorių apkrovos lentelėje. 2 neturi neigiamų verčių, išskyrus nereikšmingas vertes, kurios aiškiai priskiriamos atrankos klaidoms. Visi žodiniai testai turi dideles I faktoriaus apkrovas ir praktiškai nulinę II faktoriaus apkrovą. Priešingai, skaitiniai testai turi didelę II faktoriaus apkrovą ir nereikšmingą I faktoriaus apkrovą. Taigi koordinačių ašių sukimas labai supaprastino abiejų veiksnių identifikavimą ir įvardijimą, taip pat kiekvieno testo faktorių sudėties aprašymą. Praktikoje dažnai paaiškėja, kad veiksnių yra daugiau nei du, o tai, žinoma, juos apsunkina geometrinis vaizdas Ir Statistinė analizė, bet nekeičia nagrinėjamos procedūros esmės.

2 lentelė

Faktorių matrica po pasukimo

Kai kurie tyrinėtojai vadovaujasi teoriniu modeliu kaip ašies sukimosi principu. Be to, atsižvelgiama į nekintamumą arba tų pačių veiksnių patvirtinimą nepriklausomai atliktuose, bet palyginamuose tyrimuose.

Veiksnių aiškinimas. Po rotacijos procedūros gavę faktorių sprendimą (arba, paprasčiau tariant, faktorių matricą), galime pereiti prie faktorių aiškinimo ir įvardijimo. Šiam darbo etapui reikalinga psichologinė intuicija, o ne statistinis mokymas. Norėdami suprasti konkretaus veiksnio prigimtį, neturime kito pasirinkimo, kaip tik ištirti testus, kurie turi didelį krūvį šiam veiksniui, ir bandyti atrasti jiems bendrus psichologinius procesus. Kuo daugiau bandymų su dideliu apkrovimu tam tikram veiksniui, tuo lengviau atskleisti jo pobūdį. Nuo stalo 2, pavyzdžiui, iš karto aišku, kad faktorius I" yra žodinis, o faktorius II" yra skaitinis. Pateikta lentelėje. 2 faktorių apkrovos taip pat atspindi kiekvieno testo koreliaciją su faktoriumi.

Jei faktorių analizė atliekama tinkamai, o ne patenkinti numatytaisiais nustatymais ("mažomis akimirkomis", kaip metodologai pašaipiai vadina standartinę džentelmenų aibę), tinkamiausias faktorių išskyrimo metodas yra arba maksimali tikimybė, arba apibendrintas mažiausias kvadratas. Čia mūsų gali laukti bėdos: procedūra pateikia klaidos pranešimą: koreliacijos matrica nėra teigiama. Ką tai reiškia, kodėl taip nutinka ir kaip spręsti problemą?
Faktas yra tas, kad faktorizavimo procese procedūra ieško vadinamųjų atvirkštinė matrica koreliacijos atžvilgiu. Čia yra analogija su įprastais realiaisiais skaičiais: skaičių padauginę iš atvirkštinio, turėtume gauti vieną (pavyzdžiui, 4 ir 0,25). Tačiau kai kuriems skaičiams nėra atvirkščių – nulio negalima padauginti iš to, kas duos vienetą. Ta pati istorija su matricomis. Matrica, padauginta iš atvirkštinės vertės, suteikia tapatybės matricą (vienos yra įstrižainėje, o visos kitos reikšmės yra lygios nuliui). Tačiau kai kurioms matricoms atvirkštinės reikšmės nėra, o tai reiškia, kad tokiais atvejais faktorinės analizės atlikti tampa neįmanoma. Išsiaiškinti Šis faktas galima atlikti naudojant specialų skaičių, vadinamą determinantu. Jei jis linkęs į nulį arba yra neigiamas matricai, tada mes susiduriame su problema.
Kokios yra šios situacijos priežastys? Dažniausiai tai kyla dėl egzistavimo tiesinė priklausomybė tarp kintamųjų. Tai skamba keistai, nes būtent tokių priklausomybių mes ieškome naudodami daugiamačius metodus. Tačiau tuo atveju, kai tokios priklausomybės nustoja būti tikimybinės ir tampa griežtai deterministinėmis, daugiamatės analizės algoritmai sugenda. Apsvarstykite toliau pateiktą pavyzdį. Turėkime tokį duomenų rinkinį:
duomenų sąrašas nemokamas / V1–V3. pradžios duomenys. 1 2 3 2 1 2 3 5 4 4 4 5 5 3 1 galutiniai duomenys. apskaičiuokite V4 = V1 + V2 + V3.
Paskutinis kintamasis yra tiksli pirmųjų trijų suma. Kada tokia situacija susidaro realiame tyrime? Kai į kintamųjų rinkinį įtraukiame neapdorotus subtestų ir viso testo balus; kai kintamųjų skaičius yra daug didesnis nei tiriamųjų (ypač jei kintamieji labai koreliuoja arba turi ribotą reikšmių rinkinį). Tokiu atveju tikslūs tiesiniai ryšiai gali atsirasti atsitiktinai. Priklausomybės dažnai yra matavimo procedūros artefaktas – pavyzdžiui, jei skaičiuojami procentai stebėjimuose (tarkime, tam tikro tipo teiginių procentas), naudojamas reitingavimo metodas arba pastovios sumos skirstinys, įvedami tam tikri apribojimai. alternatyvų pasirinkimas ir kt. Kaip matote, tai gana dažnos situacijos.
Jei atlikdami anksčiau pateikto masyvo faktorių analizę SPSS, užsakote determinanto ir atvirkštinės koreliacijos matricos išvestį, paketas praneš apie problemą.
Kaip nustatyti kintamųjų grupę, kuri sukuria daugiakolineariškumą? Pasirodo, senas geras pagrindinių komponentų metodas, nepaisant tiesinės priklausomybės, toliau veikia ir kažką gamina. Jei matote, kad kai kurių kintamųjų bendrumas artėja prie 0,90–0,99, o kai kurių veiksnių savosios reikšmės tampa labai mažos (ar net neigiamos), tai nėra geras ženklas. Be to, užsisakykite varimax rotaciją ir sužinokite, kuri kintamųjų grupė atsidūrė draugu, įtariamu nusikalstamu ryšiu. Paprastai jo apkrova šiam veiksniui yra neįprastai didelė (pavyzdžiui, 0,99). Jei šis kintamųjų rinkinys yra mažas, nevienalyčio turinio, atmesta artefaktinės tiesinės priklausomybės galimybė, o imtis pakankamai didelė, tai tokio ryšio atradimas gali būti laikomas ne mažiau vertingu rezultatu. Tokią grupę galite pasukti regresinėje analizėje: kintamąjį, kuris parodė didžiausią apkrovą, padarykite priklausomą, o visus kitus išbandykite kaip prognozes. R, t.y. daugkartinės koreliacijos koeficientas šiuo atveju turėtų būti lygus 1. Jei tiesinis ryšys yra labai apleistas, regresija tyliai išmes kai kuriuos kitus prognozuotojus, atidžiai pažiūrėkite, ko trūksta. Papildomai užsisakę daugiakolineariškumo diagnostikos išvestį, galiausiai galite rasti nelemtą rinkinį, kuris sudaro tikslų tiesinį ryšį.
Ir galiausiai, yra keletas kitų mažesnių priežasčių, kodėl koreliacijos matrica nėra teigiama. Tai, pirma, yra daugybė neatsakymų. Kartais, siekdamas maksimaliai išnaudoti turimą informaciją, tyrėjas nurodo spragas apdoroti poromis. Dėl to rezultatas gali būti tokia „nelogiška“ ryšio matrica, kad faktorinės analizės modelis jos nepajėgs. Antra, jei pasirinksite koreliacijos matricą, pateiktą literatūroje, suskaidyti į faktorius, galite susidurti su neigiamu skaičių apvalinimo poveikiu.

FAKTORIŲ ANALIZĖS ATLIKIMO ŽINGSNIAI

Yra devyni faktorinės analizės etapai. Aiškumo dėlei pateikiame šiuos etapus diagramoje ir trumpai juos aprašome.

Faktorinės analizės atlikimo etapai parodyti pav.

Ryžiai.

PROBLEMOS FORMULIAVIMAS IR KORELIACIJOS MATRIKOS KONSTRUKCIJA

Problemos formulavimas. Būtina aiškiai apibrėžti faktorinės analizės tikslus. Kintamieji, kuriems taikoma faktorinė analizė, nustatomi remiantis ankstesniais tyrimais, teoriniais svarstymais arba tyrėjo nuožiūra. Būtina, kad kintamieji būtų matuojami pagal intervalas arba giminaitis skalė. Patirtis rodo, kad imties dydis turėtų būti keturis ar penkis kartus didesnis už kintamųjų skaičių.

Koreliacinės matricos konstravimas. Analizė pagrįsta koreliacijos matrica tarp kintamųjų. Faktorinės analizės atlikimo galimybes lemia koreliacijų tarp kintamųjų buvimas. Jei koreliacijos tarp visų kintamųjų yra mažos, faktorinė analizė yra nenaudinga. Kintamieji, kurie labai koreliuoja, paprastai yra labai koreliuojami su tuo pačiu veiksniu ar veiksniais.

Yra keletas statistinių duomenų, leidžiančių patikrinti veiksnio modelio panaudojimo galimybes. Naudojant Bartlett'o sferiškumo testą, patikrinama nulinė hipotezė, kad populiacijoje nėra koreliacijos tarp kintamųjų. Tai reiškia, kad teiginys, kad yra laikoma populiacijos koreliacijos matrica, yra tapatumo matrica, kurioje visi įstrižainės elementai yra lygūs vienetui, o visi kiti yra lygūs nuliui. Sferiškumo testas pagrįstas koreliacijos matricos determinanto konvertavimu į chi kvadrato statistiką. Jei statistikos reikšmė didelė, nulinė hipotezė atmetama. Jei nulinė hipotezė neatmetama, faktorinės analizės atlikti netinka. Kita naudinga statistika yra Kaiser-Meyer-Olkin (KMO) mėginių ėmimo adekvatumo testas. Šis koeficientas palygina pastebėtų koreliacijos koeficientų vertes su dalinės koreliacijos koeficientų reikšmėmis. Mažos KMO statistikos reikšmės rodo, kad koreliacijos tarp kintamųjų porų negali būti paaiškintos kitais kintamaisiais, o tai reiškia, kad faktorių analizė yra netinkama.

Šis pavyzdys yra pagrįstas fiktyviais duomenimis, susijusiais su pasitenkinimo gyvenimu tyrimu. Tarkime, anketa buvo išsiųsta 100 atsitiktinai atrinktų suaugusiųjų. Anketoje buvo 10 punktų, skirtų įvertinti pasitenkinimą darbu, pasitenkinimą pomėgiais, pasitenkinimą namų gyvenimu ir bendrą pasitenkinimą kitomis gyvenimo sritimis. Atsakymai į elementus buvo įvesti į kompiuterį ir suskirstyti taip, kad visų elementų vidurkis būtų maždaug 100.

Rezultatai patalpinti Factor.sta duomenų faile. Šį failą galite atidaryti naudodami parinktį Failas - Atidaryti; Greičiausiai šis duomenų failas yra /Examples/Datasets kataloge. Žemiau pateikiamas šio failo kintamųjų sąrašas (norėdami gauti sąrašą, duomenų meniu pasirinkite Visos kintamųjų specifikacijos).

Analizės tikslas . Analizės tikslas – ištirti pasitenkinimo įvairiose veiklos srityse ryšius. Visų pirma, pageidautina išnagrinėti už įvairių veiklos sričių „slepiasi“ veiksnių skaičiaus ir jų reikšmės klausimą.

Analizės pasirinkimas. Meniu Analysis – Multivariate Exploratory Analysis pasirinkite Factor Analysis, kad būtų rodoma Factor Analysis modulio paleidimo sritis. Paleidimo skydelyje spustelėkite mygtuką Kintamieji (žr. toliau) ir pasirinkite visus 10 šio failo kintamųjų.



Kiti variantai . Šiame dialogo lange yra viskas, ko reikia norint atlikti standartinę faktorių analizę. Už gavimą Trumpa apžvalga Kitoms komandoms, pasiekiamoms paleisties laukelyje, kaip įvesties failą galite pasirinkti koreliacijos matricą (naudodami lauką Duomenų failas). Lauke PD pašalinimas galite pasirinkti eilutę, pašalinimą poromis arba trūkstamų duomenų vidutinį priskyrimą.

Nustatykite faktoriaus išskyrimo metodą. Dabar paspauskite mygtuką Gerai, kad pereitumėte prie kito dialogo langas su pavadinimu Nurodykite faktoriaus išskyrimo metodą. Naudodami šį dialogo langą galite peržiūrėti aprašomąją statistiką, atlikti daugkartinę regresinę analizę, pasirinkti faktorių išskyrimo metodą, pasirinkti maksimalų faktorių skaičių, minimalias savąsias reikšmes ir kitus veiksmus, susijusius su faktorių išskyrimo metodų specifika. Dabar eikime į skirtuką Aprašas.



Peržiūrėkite aprašomąją statistiką. Dabar spustelėkite mygtuką View corr./average/std.deviation. šiame lange, kad atidarytumėte langą Rodyti aprašomąją statistiką.



Dabar galite peržiūrėti aprašomąją statistiką grafiškai arba naudodami rezultatų lenteles.

Koreliacinės matricos skaičiavimas. Spustelėkite mygtuką Koreliacijos skirtuke Išplėstinė, kad būtų rodoma rezultatų lentelė su koreliacijomis.



Visos koreliacijos šioje rezultatų lentelėje yra teigiamos, o kai kurios koreliacijos yra reikšmingos. Pavyzdžiui, kintamieji Hobby_1 ir Miscel_1 yra koreliuojami 0,90 lygiu. Kai kurios koreliacijos (pavyzdžiui, pasitenkinimo darbu ir pasitenkinimo namuose koreliacijos) atrodo santykinai mažos. Atrodo, kad matrica turi tam tikrą atskirą struktūrą.

Atrankos metodas. Dabar spustelėkite Atšaukti dialogo lange Peržiūrėti aprašomąją statistiką, kad grįžtumėte į dialogo langą Nurodykite faktoriaus išskyrimo metodą. Galite pasirinkti iš kelių ištraukimo metodų skirtuke Išsamiau (kiekvieno metodo aprašymo rasite dialogo lango Nurodykite faktoriaus išskyrimo metodą skirtuką Išsamiau, o pagrindinių komponentų metodo ir pagrindinių veiksnių metodo aprašymą rasite įvadinėje apžvalgoje ). Šiame pavyzdyje numatytasis metodas yra pagrindiniai komponentai, maksimalus laukas. veiksnių skaičius yra reikšmė 10 (maksimalus veiksnių skaičius šiame pavyzdyje) ir laukas Min. savo reikšmė yra 0 (minimali šios komandos reikšmė).



Norėdami tęsti analizę, spustelėkite Gerai.

Žiūrėti rezultatus. Faktinės analizės rezultatus galite peržiūrėti dialogo lange Faktorių analizės rezultatai. Pirmiausia pasirinkite skirtuką Variance Explained.



Rodomos savosios reikšmės . Įvadinėje apžvalgoje buvo aprašyta savųjų verčių paskirtis ir jų naudingumas vartotojui sprendžiant, kiek veiksnių išlaikyti (interpretuoti). Dabar spustelėkite mygtuką „Savosios reikšmės“, kad gautumėte lentelę su savosiomis reikšmėmis, bendros dispersijos procentais, sukauptomis savosiomis reikšmėmis ir sukauptais procentais.


Kaip matyti iš lentelės, pirmojo koeficiento savoji reikšmė yra 6,118369; tie. dispersijos dalis, paaiškinama pirmuoju veiksniu, yra maždaug 61,2%. Atkreipkite dėmesį, kad čia šios reikšmės yra lengvai palyginamos, nes analizuojama 10 kintamųjų, todėl visų savųjų reikšmių suma yra lygi 10. Antrasis veiksnys apima apie 18% dispersijos. Kiti veiksniai turi ne daugiau kaip 5 proc.bendra dispersija.Veiksnių skaičiaus pasirinkimas. Skyriuje Įvadinė apžvalga trumpai aprašoma, kaip gautos savosios reikšmės gali būti naudojamos sprendžiant, kiek veiksnių palikti modelyje. Pagal Kaiserio kriterijų (Kaiser, 1960), turėtumėte išlaikyti veiksnius, kurių savosios reikšmės yra didesnės nei 1. Iš aukščiau pateiktos lentelės matyti, kad pagal kriterijų pasirenkami du veiksniai.

Ekrano kriterijus . Dabar spustelėkite mygtuką Scree Plot, kad gautumėte savųjų reikšmių diagramą, kad būtų galima taikyti Cattell sluoksnio kriterijų (Cattell, 1966). Žemiau esantis grafikas buvo papildytas linijų segmentais, jungiančiais gretimas savąsias reikšmes, kad kriterijus būtų vizualesnis. Cattell, remdamasis Monte Karlo metodu, teigia, kad taškas, kuriame nuolatinis savųjų reikšmių mažėjimas sulėtėja ir po kurio likusių savųjų reikšmių lygis atspindi tik atsitiktinį „triukšmą“. Žemiau esančioje diagramoje šis taškas gali atitikti koeficientą 2 arba 3 (kaip rodo rodyklės). Todėl išbandykite abu sprendimus ir pažiūrėkite, kuris iš jų suteikia tinkamesnį vaizdą.



Dabar pažvelkime į faktorių apkrovas.

Faktorinės apkrovos . Kaip aprašyta skyriuje Įvadinė apžvalga, faktorių apkrovos gali būti aiškinamos kaip koreliacijos tarp veiksnių ir kintamųjų. Todėl jie atstovauja daugiausiai svarbi informacija, kuria grindžiamas veiksnių aiškinimas. Pirmiausia pažvelkime į visų dešimties veiksnių (nepasuktą) faktorių apkrovą. Dialogo lango Faktorių analizės rezultatų skirtuko Apkrovos lauke Factor rotation nustatykite reikšmę be pasukimo ir spustelėkite mygtuką Factor loadings, kad būtų rodoma apkrovos lentelė.



Prisiminkite, kad veiksnių atranka įvyko taip, kad vėlesni veiksniai apėmė vis mažesnę dispersiją (žr. skyrių Įvadinė apžvalga). Todėl nenuostabu, kad pirmasis veiksnys turi didžiausią apkrovą. Atkreipkite dėmesį, kad faktorių apkrovų ženklai yra reikšmingi tik tam, kad parodytų, kad kintamieji su priešingomis to paties faktoriaus apkrovomis sąveikauja su tuo veiksniu priešingai. Tačiau galite visas stulpelio apkrovas padauginti iš -1 ir pakeisti ženklus. Visais kitais atžvilgiais rezultatai išliks nepakitę.

Faktoriaus sprendimo sukimasis. Kaip aprašyta skyriuje Įvadinė apžvalga, faktinė veiksnių orientacija faktorių erdvėje yra savavališka, o bet koks faktoriaus pasukimas atkuria koreliacijas ir kitus sukimus. Todėl atrodo natūralu faktorius pasukti taip, kad būtų parinkta lengviausia interpretuojama faktorių struktūra. Tiesą sakant, paprastos struktūros terminą sukūrė ir apibrėžė Thurstone'as (1947), pirmiausia norėdamas apibūdinti sąlygas, kai veiksniai turi didelę apkrovą vieniems kintamiesiems, o mažos apkrovos kitiems, ir kai yra keletas didelių kryžminių apkrovų, t.y. yra keletas kintamųjų, kurie reikšmingai apkrauna daugiau nei vieną veiksnį. Standartinis skaičiavimo sukimosi metodas paprastai struktūrai gauti yra Kaiserio (1958) pasiūlytas varimax sukimo metodas. Kiti Harman (1967) pasiūlyti metodai yra quartimax, biquartimax ir equimax metodai (žr. Harman, 1967).

Sukimosi pasirinkimas . Pirmiausia apsvarstykite veiksnių, kuriuos norite palikti rotacijai ir interpretacijai, skaičių. Anksčiau buvo nuspręsta, kad labiausiai tikėtinas ir priimtiniausias faktorių skaičius yra du, tačiau, remiantis lygintuvo kriterijumi, nuspręsta apsvarstyti ir sprendimą su trimis veiksniais. Spustelėkite mygtuką Atšaukti, kad grįžtumėte į dialogo langą Nustatyti faktorių išskyrimo metodą ir greitojo skirtuko lauką Maksimalus faktorių skaičius pakeiskite iš 10 į 3, tada spustelėkite mygtuką Gerai, kad tęstumėte analizę.

Dabar atlikime sukimąsi varimax metodu. Dialogo lango Faktorių analizės rezultatų skirtuko Įkrovos lauke Faktoriaus pasukimas nustatykite pradinės reikšmės Varimax.



Spustelėkite mygtuką Factor loadings, kad lentelėje būtų rodomi gaunamų faktorių įkrovų rezultatai.


Sprendimo rodymas sukant tris veiksnius. Lentelėje parodytos reikšmingos pirmojo faktoriaus apkrovos visiems kintamiesiems, išskyrus susijusius su namais. 2 veiksnys turi gana didelę apkrovą visiems kintamiesiems, išskyrus tuos, kurie susiję su pasitenkinimu darbu. 3 veiksnys turi tik vieną reikšmingą Home_1 kintamojo apkrovą. Tai, kad tik vienas kintamasis labai apkrauna trečiąjį veiksnį, verčia susimąstyti, ar rezultatas gali būti toks pat geras be trečiojo veiksnio?

Sprendimo peržiūra keičiant du veiksnius . Dialogo lange Faktorių analizės rezultatai dar kartą spustelėkite mygtuką Atšaukti, kad grįžtumėte į dialogo langą Nurodykite faktoriaus išskyrimo metodą. Pakeiskite lauką Didžiausias faktorių skaičius skirtuke Greitas iš 3 į 2 ir spustelėkite Gerai, kad eitumėte į dialogo langą Faktorių analizės rezultatai. Skirtuko Loadings lauke Factor rotation nustatykite pradinių reikšmę Varimax ir spustelėkite mygtuką Factor loadings.


1 faktorius, kaip matyti iš lentelės, turi didžiausią kintamųjų, susijusių su pasitenkinimu darbu, apkrovas. Ji turi mažiausią apkrovą kintamiesiems, susijusiems su pasitenkinimu namais. Kitos apkrovos turi tarpines vertes. 2 veiksnys turi didžiausią kintamųjų, susijusių su pasitenkinimu namuose, apkrovas, mažiausias pasitenkinimo darbu apkrovas ir vidutines likusių kintamųjų apkrovas.

Dviejų faktorių sukimosi sprendimo interpretacija . Ar galima interpretuoti šis modelis? Atrodo, kad du veiksniai geriausiai identifikuojami kaip pasitenkinimo darbu faktorius (1 veiksnys) ir pasitenkinimo namų gyvenimu faktorius (2 faktorius). Panašu, kad pasitenkinimas savo pomėgiais ir įvairiais kitais gyvenimo aspektais yra susijęs su abiem veiksniais. Šis modelis tam tikrais atžvilgiais rodo, kad pasitenkinimas darbu ir namų gyvenimu šioje imtyje gali būti nepriklausomi vienas nuo kito, tačiau abu prisideda prie pasitenkinimo pomėgiais ir kitais gyvenimo aspektais.

Dviejų faktorių rotacija pagrįsto sprendimo schema . Norėdami gauti dviejų veiksnių sklaidos diagramą, dialogo lango Faktorių analizės rezultatų skirtuke Įkrovos spustelėkite mygtuką 2M pakrovimo diagrama. Žemiau pateiktoje diagramoje tiesiog parodytos dvi kiekvieno kintamojo įkrovos. Atkreipkite dėmesį, kad sklaidos diagrama gerai iliustruoja du nepriklausomus veiksnius ir 4 kintamuosius (Hobby_1, Hobby_2, Miscel_1, Miscel_2) su kryžminėmis apkrovomis.



Dabar pažiūrėkime, kaip gerai stebimą kovariacijos matricą galima atkurti dviejų faktorių sprendimu.

Pakartotinė ir liekamosios koreliacijos matrica. Spustelėkite mygtuką Atkurtos ir likusios koreliacijos skirtuke Paaiškintas dispersija, kad gautumėte dvi lenteles su atkurta koreliacijos matrica ir likutinių koreliacijų matrica (stebėta atėmus koreliacijas).



Likutinių koreliacijų lentelės įrašai gali būti interpretuojami kaip koreliacijų „suma“, kurios negali būti įvertintos dviem gautais veiksniais. Žinoma, įstrižainės matricos elementuose yra standartinis nuokrypis, kurio negalima atsižvelgti į šiuos veiksnius, kuris yra lygus kvadratinei šaknims iš vieno atėmus atitinkamas dviejų veiksnių bendrijas (prisiminkime, kad kintamojo bendrumas yra dispersija kurį galima paaiškinti pasirinktu veiksnių skaičiumi). Jei atidžiai pažvelgsite į šią matricą, pamatysite, kad likutinių koreliacijų, didesnių nei 0,1 arba mažesnės nei -0,1, praktiškai nėra (iš tikrųjų tik nedidelė jų dalis yra artima šiai reikšmei). Pridėkite tai, kad pirmieji du veiksniai sudaro apie 79% visos dispersijos (žr. rezultatų lentelėje sukauptus savųjų reikšmių procentus).

Sėkmingo pavyzdžio „paslaptis“. . Ką tik išnagrinėtas pavyzdys iš tikrųjų pateikia dviejų veiksnių problemos sprendimą, kuris yra artimas idealui. Ji sudaro didžiąją dalį dispersijos, turi pagrįstą interpretaciją ir atkuria koreliacijos matricą su nedideliais nuokrypiais (liekamieji koreliacijos). Iš tikrųjų realūs duomenys retai duoda tokį paprastą sprendimą, o iš tikrųjų šis fiktyvus duomenų rinkinys buvo sugeneruotas naudojant atsitiktinių skaičių generatorių su normalus skirstinys prieinama sistemoje. Ypatingu būdu į duomenis buvo „įvesti“ du stačiakampiai (nepriklausomi) faktoriai, pagal kuriuos buvo generuojamos koreliacijos tarp kintamųjų. Šis faktorinės analizės pavyzdys atkuria du veiksnius tokius, kokie jie buvo (ty pasitenkinimo darbu faktorius ir pasitenkinimo gyvenimu namuose faktorius). Taigi, jei reiškinys (o ne dirbtiniai duomenys, kaip pavyzdyje) apimtų šiuos du veiksnius, tada juos išskirdami galėtumėte ką nors sužinoti apie paslėptą arba latentinę reiškinio struktūrą.

Kiti rezultatai . Prieš darydami galutinę išvadą, trumpai pakomentuojame kitus rezultatus.

Bendrumai . Norėdami gauti sprendimo bendruosius dalykus, dialogo lango Faktorių analizės rezultatai skirtuke Paaiškinta dispersija spustelėkite mygtuką Bendrieji dalykai. Prisiminkite, kad kintamojo bendrumas yra dispersijos dalis, kurią galima atkurti atsižvelgiant į tam tikrą veiksnių skaičių. Veiksnio erdvės sukimas neturi įtakos bendrumo dydžiui. Labai mažas vieno ar dviejų kintamųjų bendrumas (iš daugelio analizėje) gali reikšti, kad tie kintamieji nėra labai gerai paaiškinti modeliu.

Vertės koeficientai. Faktorių koeficientai gali būti naudojami apskaičiuojant kiekvieno stebėjimo faktorių reikšmes. Patys koeficientai paprastai mažai įdomūs, tačiau faktorių reikšmės yra naudingos tolesnei analizei. Norėdami parodyti koeficientus, dialogo lango Faktorių analizės rezultatai skirtuke Reikšmės spustelėkite mygtuką Faktorių reikšmių koeficientai.

Veiksnių vertės. Veiksnių vertės gali būti laikomos dabartinėmis kiekvieno tiriamo respondento vertėmis (ty kiekvieno stebėjimo pirminėje duomenų lentelėje). Factor Values ​​mygtukas, esantis dialogo lango Faktorių analizės rezultatų skirtuke Vertės, leidžia apskaičiuoti faktorių reikšmes. Šias reikšmes galima išsaugoti vėlesniam naudojimui paspaudus mygtuką Išsaugoti reikšmes.

Galutinis komentaras. Faktorių analizė nėra paprasta procedūra. Kiekvienas, kuris nuolat naudojasi faktorinė analizė su daugybe (pvz., 50 ar daugiau) kintamųjų, galima pamatyti daugybę „patologinio elgesio“ pavyzdžių, tokių kaip: neigiamos savosios reikšmės ir neinterpretuojami sprendimai, specialios matricos ir kt. Jei norite naudoti faktorių analizę daugelio kintamųjų reikšmingiems veiksniams nustatyti arba nustatyti, turėtumėte atidžiai išstudijuoti kai kuriuos išsamus vadovas(pvz., Harmano knyga (Harman, 1968)). Taigi, kadangi daugelis kritinių sprendimų faktorių analizėje yra subjektyvaus pobūdžio (faktorių skaičius, sukimosi metodas, apkrovų interpretacija), būkite pasiruošę, kad tam, kol jausitės įsitikinę, reikia tam tikros patirties. Faktorių analizės modulis buvo sukurtas specialiai tam, kad vartotojas galėtų lengvai interaktyviai perjungti įvairius veiksnius, sukimus ir pan., kad būtų galima išbandyti ir palyginti skirtingus sprendimus.

Šis pavyzdys paimtas iš PPP pagalbos sistemos STATISTIKA iš StatSoft

Pagrindinės lygtys

Anksčiau beveik visuose faktorinės analizės vadovėliuose ir monografijose buvo paaiškinta, kaip atlikti pagrindinius skaičiavimus „rankiniu būdu“ arba naudojant paprastą skaičiavimo įrenginį (sudavimo mašiną ar skaičiuotuvą). Šiandien dėl sudėtingumo ir didelės apimties skaičiavimų, reikalingų ryšių matricai sudaryti, faktoriams išskirti ir juos pasukti, tikriausiai neliko nė vieno žmogaus, kuris nesinaudotų galingi kompiuteriai ir susijusias programas.

Todėl sutelksime dėmesį į tai, kokias reikšmingiausias matricas (duomenų rinkinius) galima gauti iš faktorinės analizės, kaip jos yra susijusios viena su kita ir kaip jas galima panaudoti interpretuojant duomenis. Visi reikalingi skaičiavimai gali būti atliekami naudojant bet kurį kompiuterio programa(pvz., SPSS arba STADIA).

IN stalo 1 Pateikiamas svarbiausių pagrindinių komponentų metodų ir faktorinės analizės matricų sąrašas. Šiame sąraše daugiausia yra ryšių matricos (tarp kintamųjų, tarp veiksnių, tarp kintamųjų ir faktorių), standartizuotos reikšmės (kintamiesiems ir veiksniams), regresijos svoriai (faktorių reikšmėms apskaičiuoti naudojant kintamųjų reikšmes), kaip taip pat faktorių ir kintamųjų ryšių po įstrižinio sukimosi matricos. IN stalo 1 taip pat pateiktos savųjų reikšmių matricos ir jas atitinkantys savieji vektoriai. Savotosios reikšmės (savosios reikšmės) ir savieji vektoriai aprašomi dėl jų svarbos nustatant veiksnius, dėl daugybės specialių terminų vartojimo šiuo atžvilgiu ir dėl glaudaus ryšio tarp savųjų verčių ir dispersijos statistiniuose tyrimuose.

1 lentelė

Faktorinėje analizėje dažniausiai naudojamos matricos

Paskyrimas vardas Dydis apibūdinimas
R Santykių matrica p x p Ryšiai tarp kintamųjų
D Nestandartizuota duomenų matrica N x p Pirminiai duomenys – nestandartizuotos pirminių kintamųjų stebėjimo reikšmės
Z Standartizuota duomenų matrica N x p Standartizuotos pirminių kintamųjų stebėjimo vertės
F Veiksnių reikšmių matrica Nx f Standartizuotos stebėjimo vertės pagal veiksnius
A Veiksnių įkėlimo matrica Faktorių atvaizdavimo matrica p x f Bendrųjų veiksnių regresijos koeficientai, darant prielaidą, kad stebimi kintamieji yra tiesinis veiksnių derinys. Stačiakampio sukimo atveju – kintamųjų ir veiksnių ryšiai
IN Veiksnių vertės koeficientų matrica p x f Regresijos koeficientai faktorių reikšmėms apskaičiuoti naudojant kintamąsias reikšmes
S Struktūrinė matrica p x f Kintamųjų ir veiksnių ryšiai
F Veiksnių koreliacijos matrica f x f Koreliacijos tarp veiksnių
L Savosios reikšmės matrica (įstrižainė) f x f Turtinės reikšmės (būdingos, latentinės šaknys); kiekvienas veiksnys atitinka vieną savąją reikšmę
V Savavektoriaus matrica f x f Eigeniniai (charakteristikos) vektoriai; kiekviena savoji reikšmė atitinka vieną savąjį vektorių

Pastaba. Nurodant dydį nurodomas eilučių skaičius x stulpelių skaičius: R- kintamųjų skaičius, N- stebėjimų skaičius, f- veiksnių arba komponentų skaičius. Jei santykių matrica R nėra išsigimęs ir turi vienodą rangą R, tada jis iš tikrųjų išsiskiria R savąsias reikšmes ir savuosius vektorius, o ne f. Tačiau jie yra tik įdomūs f jų. Todėl likę p-f nėra rodomi.

Į matricas S Ir F Taikomas tik įstrižasis sukimas, likusiems - stačiakampis ir įstrižas.

Faktorinei analizei parengtas duomenų rinkinys susideda iš daugybės tiriamųjų (respondentų) tam tikromis skalėmis (kintamaisiais) atliktų matavimų (apklausos). IN stalo 2 pateikiamas duomenų masyvas, kurį sąlyginai galima laikyti atitinkančiu faktorinės analizės reikalavimus.

Penki respondentai, kreipęsi į kelionių agentūrą norėdami įsigyti bilietą į pajūrio kurortą, buvo paklausti apie keturių sąlygų (kintamųjų) svarbą renkantis vasaros atostogų vietą. Šios kintamos sąlygos buvo: kelionės kaina, komplekso komfortas, oro temperatūra, vandens temperatūra. Kuo reikšmingesnė, respondento požiūriu, jam buvo ta ar kita sąlyga, tuo svarbesnę jis jai skyrė. Tyrimo užduotis buvo ištirti kintamųjų santykių modelį ir nustatyti pagrindines priežastis, lemiančias kurorto pasirinkimą. (Pavyzdys, žinoma, yra labai supaprastintas iliustravimo ir edukaciniais tikslais ir neturėtų būti rimtai vertinamas turinio atžvilgiu.)

Santykių matrica ( stalo 2) buvo apskaičiuotas kaip koreliacija. Atkreipkite dėmesį į santykių struktūrą jame, paryškintą vertikaliais ir horizontalios linijos. Aukštos koreliacijos viršutiniame kairiajame ir apatiniame dešiniajame kvadrantuose rodo, kad kelionės kainos ir komplekso komforto įvertinimai yra tarpusavyje susiję, taip pat oro temperatūros ir vandens temperatūros įvertinimai. Kiti du kvadrantai rodo, kad oro temperatūra ir komplekso komfortas yra susiję, taip pat komplekso komfortas ir vandens temperatūra.

Dabar pabandykime, naudodamiesi faktorine analize, aptikti šią koreliacijų struktūrą, kuri yra lengvai matoma plika akimi mažoje koreliacinėje matricoje (didelėje matricoje tai padaryti labai sunku).

2 lentelė

Duomenys faktorių analizei (mokymo pavyzdys)

Turistai Kintamieji
Kelionės kaina Komforto lygis Oro temperatūra Vandens temperatūra
T1
T2
T3
T4
T5

Koreliacinė matrica

Kelionės kaina Komforto lygis Oro temperatūra Vandens temperatūra
Kelionės kaina 1,000 -0,953 -0,055 -0,130
Komforto lygis -0,953 1,000 -,091 -0,036
Oro temperatūra -0,055 -0,091 1,000 0,990
Vandens temperatūra -0,130 -0,036 0,990 1,000

Faktorizavimas

Svarbi teorema iš matricinės algebros teigia, kad tam tikras sąlygas tenkinančios matricos gali būti įstrižinės, t.y. paverčiama matrica su skaičiais pagrindinėje įstrižainėje ir nuliais visose kitose pozicijose. Santykių matricos yra konkrečiai įstrižainės matricos. Transformacija atliekama pagal formulę:

tie. Matricos R įstrižainė atliekama iš pradžių padauginus ją (kairėje) iš transponuotos matricos V, žymimos V’, o po to (dešinėje) iš pačios matricos V.

Matricos V stulpeliai vadinami savaisiais vektoriais, o pagrindinės matricos L įstrižainės reikšmės vadinamos savosiomis reikšmėmis. Pirmasis savasis vektorius atitinka pirmąją savąją reikšmę ir pan. (daugiau informacijos žr. 1 priede).

Kadangi aukščiau pateiktame pavyzdyje nagrinėjami keturi kintamieji, gauname keturias savąsias reikšmes su atitinkamais savaisiais vektoriais. Tačiau kadangi faktorinės analizės tikslas yra apibendrinti santykių matricą naudojant kuo mažiau veiksnių ir kiekviena savoji reikšmė atitinka skirtingus potencialius veiksnius, dažniausiai atsižvelgiama tik į veiksnius, turinčius dideles savąsias reikšmes. Naudojant „gerą“ faktorių sprendimą, apskaičiuotų ryšių matrica, gauta naudojant šį ribotą veiksnių rinkinį, praktiškai dubliuoja ryšių matricą.

Mūsų pavyzdyje, kai nėra jokių apribojimų veiksnių skaičiui, kiekvieno iš keturių galimų veiksnių savosios reikšmės 2,02, 1,94, 0,04 ir 0,00 apskaičiuojamos. Tik pirmųjų dviejų veiksnių savosios reikšmės yra pakankamai didelės, kad būtų toliau svarstomos. Todėl iš naujo pasirenkami tik pirmieji du veiksniai. Jų savosios reikšmės yra atitinkamai 2,00 ir 1,91, kaip nurodyta lentelėje. 3. Naudodami (6) lygtį ir įterpdami reikšmes iš pateikto pavyzdžio, gauname:

(Visos kompiuteriu apskaičiuotos vertės yra vienodos; rankiniai skaičiavimai gali skirtis dėl apvalinimo netikslumų.)

Kairėje pusėje esančią savųjų vektorių matricą padauginus iš jos transponavimo, gaunama tapatumo matrica E (vienetai pagrindinėje įstrižainėje, o likusieji nuliai). Todėl galime teigti, kad santykių matricos transformavimas pagal formulę (6) jos nekeičia, o tik transformuoja į analizei patogesnę formą:

Pavyzdžiui:

3 lentelė

Nagrinėjamo mokymo pavyzdžio savieji vektoriai ir atitinkamos savosios reikšmės

1 savasis vektorius 2 savasis vektorius
-.283 .651
.177 -.685
.658 .252
.675 .207
1 savoji reikšmė 2 savoji reikšmė
2.00 1.91

Kadangi koreliacinė matrica yra įstrižainė, jai galima taikyti savųjų vektorių ir savųjų reikšmių matricos algebrą faktorinės analizės rezultatams gauti (žr. 1 priedą). Jei matrica yra įstrižainė, visa esminė informacija apie faktoriaus struktūrą pateikiama jos įstrižainėje. Atliekant faktorių analizę, savosios reikšmės atitinka dispersiją, kurią paaiškina veiksniai. Didesnę savąją reikšmę turintis veiksnys paaiškina didžiausią dispersiją ir taip toliau, kol pasieksite veiksnius su mažomis arba neigiamomis savosiomis reikšmėmis, kurios paprastai neįtraukiamos į analizę. Savųjų reikšmių ir savųjų vektorių skaičiavimai yra labai daug darbo reikalaujantys, o gebėjimas juos apskaičiuoti nėra absoliuti būtinybė psichologui, įvaldžiusiam faktorių analizę savo praktiniais tikslais. Tačiau susipažinimas su šia procedūra nepakenks, todėl 1 priede kaip pavyzdį pateikiame savųjų reikšmių ir savųjų vektorių apskaičiavimą mažoje matricoje.

Norėdami rasti savąsias reikšmes kvadratinė matrica p x p reikia rasti p laipsnio daugianario šaknis, o norint rasti savuosius vektorius, reikia išspręsti p lygtis su p nežinomaisiais su papildomais šoniniais apribojimais, kas p>3 atveju retai daroma rankiniu būdu. Kai randami savieji vektoriai ir savosios reikšmės, likusi faktorinės analizės (arba pagrindinių komponentų analizės) dalis tampa daugiau ar mažiau aiški (žr. 8-11 lygtis).

(6) lygtis gali būti pateikta taip: R=V’LV, (8)

tie. santykių matricą galima laikyti trijų matricų sandauga - savųjų reikšmių matricos, atitinkamų savųjų vektorių matricos ir į ją perkeltos matricos.

Po transformacijos savųjų reikšmių matrica L gali būti pavaizduota taip:

ir todėl: R=VÖLÖL V’ (10)

arba (kuris yra tas pats): R=(VÖL)(ÖL V’)

Pažymime: A=(VÖL), ir A’=(ÖL V’), tada R=AA’ (11)

tie. santykių matricą taip pat galima pavaizduoti kaip dviejų matricų sandaugą, kurių kiekviena yra savųjų vektorių ir savųjų reikšmių kvadratinių šaknų derinys.

(11) lygtis dažnai vadinama pagrindine faktorinės analizės lygtimi. Tai išreiškia teiginį, kad santykių matrica yra faktorių apkrovų (A) ir jos transponavimo matricos sandauga.

(10) ir (11) lygtys taip pat rodo, kad didelę faktorių analizės ir pagrindinių komponentų metodų skaičiavimų dalį sudaro savųjų verčių ir savųjų vektorių nustatymas. Kai jie žinomi, išankstinio sukimosi koeficiento matrica gaunama tiesioginio matricos dauginimo būdu:

Mūsų pavyzdyje:

Veiksnių įkėlimo matrica yra veiksnių ir kintamųjų ryšių (interpretuojamų kaip koreliacijos koeficientai) matrica. Pirmas stulpelis yra koreliacija tarp pirmojo veiksnio ir kiekvieno kintamojo paeiliui: kelionės kaina (-.400), komplekso komfortas (.251), oro temperatūra (.932), vandens temperatūra (. 956). Antrasis stulpelis yra koreliacija tarp antrojo veiksnio ir kiekvieno kintamojo: kelionės kaina (.900), komplekso komfortas (-.947), oro temperatūra (.348), vandens temperatūra (.286). Veiksnys aiškinamas remiantis kintamaisiais, kurie yra labai su juo susiję (t. y. turi didelę apkrovą). Taigi pirmasis veiksnys daugiausia yra „klimatinis“ (oro ir vandens temperatūra), o antrasis – „ekonominis“ (kelionės kaina ir komplekso komfortas).

Aiškinant šiuos veiksnius, reikėtų atkreipti dėmesį į tai, kad kintamieji, turintys didelę apkrovą pirmajam veiksniui (oro temperatūrai ir vandens temperatūrai), yra teigiamai tarpusavyje susiję, o kintamieji, turintys didelę apkrovą antrajam veiksniui (bilieto kaina ir komplekso komfortas) yra neigiamai tarpusavyje susiję (negalite tikėtis didelio komforto iš pigaus kurorto). Pirmasis veiksnys vadinamas vienpoliu (visi kintamieji sugrupuoti viename poliuje), o antrasis – bipolinis (kintamieji skirstomi į dvi priešingas reikšme grupes – du polius). Kintamieji su faktorių apkrovomis su „pliuso“ ženklu sudaro teigiamą polių, o tie, kurie turi „minuso“ ženklą – neigiamą polių. Tuo pačiu metu polių pavadinimai „teigiamas“ ir „neigiamas“, interpretuojant veiksnį, neturi vertinamosios „blogos“ ir „geros“ reikšmės. Skaičiavimų metu ženklas parenkamas atsitiktinai. Visus ženklus pakeitus priešingais (visus pliusus minusais, o visus minusus pliusais) sprendimas nekeičiamas. Ženklų analizė reikalinga tik grupėms identifikuoti (kas prieštarauja kam). Su tokia pačia sėkme vieną stulpą galima vadinti dešiniuoju, kitą – kairiuoju. Mūsų pavyzdyje kintamoji kelionės kaina buvo teigiama (dešiniajame) poliuje; jai priešinosi kintamasis komplekso komfortas neigiamame (kairiame) poliuje. Ir šis veiksnys gali būti interpretuojamas (vadinamas) kaip „ekonomija ir komfortas“. Respondentai, kuriems taupymo problema yra reikšminga, buvo dešinėje - jie gavo faktorių reikšmes su „pliuso“ ženklu. Renkantis kurortą jie labiau orientuojasi į jo pigumą ir mažiau į komfortą. Respondentai, kurie netaupo atostogoms (kelionės kaina jiems labai nerūpi) ir kurie pirmiausia nori atsipalaiduoti patogiomis sąlygomis, buvo kairėje - jie gavo faktorių reikšmes su „minuso“ ženklu.

Tačiau reikia nepamiršti, kad visi kintamieji yra reikšmingai koreliuojami su abiem veiksniais. Kaip dalis to paprastas pavyzdys interpretacija akivaizdi, bet realių duomenų atveju tai nėra taip paprasta. Paprastai veiksnį lengviau interpretuoti, jei tik maža kintamųjų dalis yra su juo labai koreliuojama, o kiti ne.

Stačiakampis sukimasis

Sukimas paprastai taikomas po faktoriaus ekstrahavimo, kad būtų maksimaliai padidintos didelės koreliacijos ir sumažintos žemos. Yra daug sukimosi metodų, tačiau dažniausiai naudojamas varimax sukimas, tai yra procedūra, skirta maksimaliai padidinti dispersiją. Šis sukimasis padidina faktorių apkrovų dispersiją, todėl didelės apkrovos yra didesnės, o mažos – mažesnės kiekvieną faktoriaus dieną. Šis tikslas pasiekiamas naudojant transformacijos matricos L:

A prieš posūkį L = A po posūkio,

tie. prieš sukimosi faktoriaus apkrovos matrica padauginama iš transformacijos matricos, kad būtų gauta posukimo faktoriaus apkrovos matrica. Mūsų pavyzdyje:

Palyginkite matricas prieš ir po sukimo. Atkreipkite dėmesį, kad matrica po sukimo turi mažų faktorių apkrovas, mažesnes, o aukštas – didesnes nei matricos prieš sukimąsi. Pabrėžtas apkrovų skirtumas palengvina faktoriaus interpretaciją ir leidžia vienareikšmiškai atsirinkti su juo stipriai tarpusavyje susijusius kintamuosius.

Transformacijos matricos elementai turi ypatingą geometrinę interpretaciją:

Transformacijos matrica yra kampo ψ sinusų ir kosinusų matrica, per kurią atliekamas sukimas. (Iš čia ir kilo transformacijos pavadinimas – sukimasis, nes geometriniu požiūriu ašys sukasi aplink faktoriaus erdvės pradžią.) Mūsų pavyzdyje šis kampas yra maždaug 19 laipsnių: cos19° = .946 ir sin19° = .325. Geometriškai tai atitinka faktoriaus ašių pasukimą 19 laipsnių aplink pradinę vietą. (Daugiau apie geometrinius sukimosi aspektus žr. toliau.)



 


Skaityti:



Mini testas techniniam mąstymui

Mini testas techniniam mąstymui

Paauglių bendrųjų gebėjimų kompleksinė diagnostika specializuoto ugdymo kontekste III DALIS 3. Kognityvinės sferos diagnostika 3.3. Bandymas...

Pateikite buto, namo ir kito nekilnojamojo turto pardavimo skelbimą nemokamai. Pateikite greito namo pardavimo skelbimą

Pateikite buto, namo ir kito nekilnojamojo turto pardavimo skelbimą nemokamai. Pateikite greito namo pardavimo skelbimą

Būsto pardavimas yra sudėtingas procesas, reikalaujantis atsižvelgti į daugybę niuansų. Norėdami pagreitinti procesą, ekspertai pataria kreiptis į profesionalus. Tačiau...

Uždirbti pinigų skaitant laiškus Skaitant laiškus, bet už tai atlyginama

Uždirbti pinigų skaitant laiškus Skaitant laiškus, bet už tai atlyginama

Paprasčiausias būdas užsidirbti pinigų internete, kur galima pradėti dirbti – užsidirbti pinigų skaitant reklaminius laiškus, kuriuos tau siunčia reklamos užsakovai...

Medžiaga tema: Koncertinė programa „Iš visos širdies“ TV laida iš visos širdies visi epizodai

Medžiaga tema: Koncertinė programa

Apskritai programa pasakojo apie nenuspėjamus ir sudėtingus sovietų žmonių likimus. Dauguma žiūrovų negalėjo sulaikyti ašarų, kai...

tiekimo vaizdas RSS