Testowanie założeń statystycznych
W analizie statystycznej wszystkie testy parametryczne przyjmują pewną charakterystykę danych, zwaną również założeniami. Łamanie tych założeń zmienia wnioski z badań i interpretacji wyników. Dlatego wszystkie badania, czy to w przypadku artykułu w czasopismach, pracy magisterskiej lub rozprawy, muszą być zgodne z tymi założeniami dla dokładnej interpretacji. W zależności od analizy parametrycznej, założenia różnią się.
Następujące są założenia danych powszechnie spotykane w badaniach statystycznych:
Założenia normalności: Większość testów parametrycznych wymaga spełnienia założenia o normalności. Normalność oznacza, że rozkład testu jest normalnie rozłożony (lub dzwonkowaty) ze średnią 0, z 1 odchyleniem standardowym i symetryczną krzywą dzwonową. Aby przetestować założenie normalności, można zastosować następujące środki i testy:
Test W Shapiro-Wilka: Większość badaczy używa tego testu do testowania założenia normalności. Test Wilka nie powinien być znaczący, aby spełnić założenie normalności.
Test Kołmogorowa-Smirnowa: W przypadku dużej próbki większość badaczy używa testu K-S, aby przetestować założenie normalności. Ten test nie powinien być znaczący, aby spełnić założenie normalności.
Testowanie założeń statystycznych Graficzna metoda
Normalność można testować poprzez następujący graf:
Wykres Q-Q: Większość badaczy wykorzystuje wykresy Q-Q do przetestowania założenia o normalności. W tej metodzie obserwowaną wartość i oczekiwaną wartość wykreślono na wykresie. Jeśli naniesiona wartość różni się bardziej od linii prostej, dane nie są normalnie dystrybuowane. W przeciwnym razie dane będą normalnie dystrybuowane.
Założenia homogeniczności wariancji:
Test Levene’a: Aby przetestować założenie homogeniczności wariancji, stosuje się test Levene’a. Test Levene’a służy do oceny, czy grupy mają równe wariancje. Test ten nie powinien być znaczący, aby spełnić założenie równości wariancji
Homogeniczność macierzy wariancyjno-kowariancyjnych:
Test Box M: Ten test służy do testowania wielowymiarowej homogeniczności założeń macierzy wariancji-kowariancji. Nieznaczna wartość testu Boxa M pokazuje, że grupy te nie różnią się od siebie i spełniłyby założenie
Losowość: Większość statystyk zakłada, że obserwacje próbek są losowe. Test solosowości służy do testowania założenia losowości.
Wielobiegunowość: Wielobiegunowość oznacza, że zmienne będące przedmiotem zainteresowania są wysoce skorelowane, a wysokie korelacje nie powinny występować wśród zmiennych będących przedmiotem zainteresowania. Aby przetestować założenie wieloklinowości, można wykorzystać wskaźniki VIF i warunku, szczególnie w analizach regresji. Wartość VIF> 10 wskazuje, że występuje wieloklinowość i założenie jest naruszone.
Testowanie założeń statystycznych jest bardzo ważne kiedy chcemy dobrze wnioskować ze zgromadzonych danych w kontekście testowania hipotez i teorii.