Problematyka podejmowana w niniejszej rozprawie doktorskiej dotyczy pomiaru hierarchii wartości w psychologii, a głównym celem rozprawy jest poszerzenie dotychczasowej wiedzy metodologicznej na ten temat. Cel ten zrealizowano poprzez:
1) weryfikację, czy pomiar wartości z wykorzystaniem trzech metod, jakimi były rangowanie, metoda najlepszy-najgorszy i ocenianie, ma wpływ na uzyskane wyniki w postaci hierarchii oraz 2) sprawdzenie, jakie ograniczenia posiadają wymienione sposoby pomiaru ze względu na liczebność losowanych prób, długość hierarchii oraz strukturę populacji, z której losowano próby.
Podstawą teoretyczną pracy są trzy znamienne dla psychologii teorie wartości opracowane przez Allporta i Vernona (1931; Allport i in., 1951), Rokeacha (1972, 1973) oraz – integrująca wymienione podejścia – teoria Schwartza (1992, 2006, 2012; Schwartz, Bilsky, 1987, 1990; Schwartz i in., 2012). Szczególnie istotna dla badań przeprowadzonych
w ramach niniejszej rozprawy była liczba wartości wyodrębnionych przez każdego z autorów oraz zastosowane rozwiązanie metodologiczno-statystyczne umożliwiające przeprowadzenie ich pomiaru.
Postawiony w niniejszej pracy cel badawczy został zrealizowany dwutorowo: klasycznie, w badaniach empirycznych oraz w – jak się okazało niezbędnych – badaniach symulacyjnych, stanowiących novum względem prowadzonych dotychczas badań
w tym obszarze psychologii.
Badaniami empirycznymi objęto grupę 101 dorosłych osób (studentów) w wieku od 18 do 49 lat, przy czym przeważającą większość badanych (79%) stanowiły kobiety. Pomiar dotyczący hierarchii w ramach katalogu 19 wartości Schwartza przeprowadzono na trzy różne sposoby: Portretowym kwestionariuszem wartości (PVQ-R3) oraz dwoma autorskimi kwestionariuszami wykorzystującymi metodę rangowania oraz najlepszy-najgorszy (por. Lee i in., 2008, 2017).
Do zweryfikowania, czy każdy z zastosowanych sposobów pomiaru pozwoli na odwzorowanie zakładanej przez Schwartza kołowej struktury wartości wykorzystano procedurę skalowania wielowymiarowego (MDS). Uzyskane wyniki okazały się satysfakcjonujące dla każdej z metod (Stress 1 < 0,2), co oznacza dobre dopasowanie danych do modelu dwuwymiarowego. Najlepsze dopasowanie uzyskano dla pomiaru przeprowadzonego za pomocą metody rangowania.
Na podstawie uzyskanych wyników można stwierdzić, że dla każdego sposobu pomiaru w badanej próbie otrzymano inną hierarchię wartości. Jednak pomiar
z wykorzystaniem metody rangowania (ω Aranowskiej) oraz najlepszy-najgorszy prowadzi do najbardziej zbliżonych rozwiązań, zarówno na poziomie ujawnionych hierarchii w próbie, jak i pojedynczej osoby badanej. Dodatkowo, na podstawie wyników uzyskanych dla zaproponowanej w ramach niniejszej rozprawy miary średniego przesunięcia w rangach jednej hierarchii względem drugiej (stanowiącej punkt odniesienia), można stwierdzić, że jeżeli nie przekracza ona wartości równej 4, to różnice w uszeregowaniu wartości występujące w porównywanych hierarchiach 19-elementowych nie prowadzą do istotnych różnic między hierarchiami.
Co więcej, na podstawie wyników kolejnej wprowadzonej miary podobieństwa dwóch hierarchii, jaką jest ważony współczynnik korelacji tau Kendalla, można stwierdzić, że pomiar realizowany metodą najlepszy-najgorszy ujawnia w próbie hierarchię najlepiej odzwierciedlającą zróżnicowanie hierarchii osób badanych. Porównywalne wyniki uzyskano również dla pomiaru metodą rangowania z wykorzystaniem rozwiązania zaproponowanego przez Aranowską (1996).
Przeprowadzenie badań symulacyjnych wymagało przyjęcia pewnych założeń (szczegółowo omówionych w Rozdziale V rozprawy), dotyczących między innymi rozkładu hierarchii w populacji, gdyż w literaturze przedmiotu brakuje informacji w tym zakresie.
W celu rozpatrzenie różnych przypadków, przyjęto dziewięć struktur populacji różniących się ze względu na procentowy udział hierarchii zgodnych, neutralnych i niezgodnych z założoną hierarchią wejściową. Dodatkowo w obrębie każdej populacji wygenerowano dane specyficzne dla pomiaru realizowanego za pomocą rangowania, metody najlepszy-najgorszy
i oceniania (skala Likerta) przy zachowaniu tego samego uporządkowania k obiektów (k1 = 6, k2 = 10, k3 = 18, k4 = 19). Następnie z tak przygotowanych 1 000 000 populacji losowano po 1 000 prób n elementowych (n1 = 30, n2 = 100, n3 = 300, n4 = 500).
Uzyskane wyniki pozwalają stwierdzić, że im bardziej jednolita jest struktura populacji ze względu na hierarchię tworzących ją jednostek, tym lepsze otrzymamy oszacowanie hierarchii charakteryzującej populację na podstawie wylosowanej z niej próby
o dowolnej wielkości, niezależnie od długości hierarchii i sposobu jej pomiaru. Okazało się, że pomiar hierarchii sześcioelementowych najlepiej prowadzić metodą najlepszy-najgorszy, dziesięcioelementowych – rangowania (ω Aranowskiej), zaś 18- i 19-elementowych – rangowania (ω Aranowskiej) i oceniania (skala Likerta). Zaobserwowano także, że pomiar
za pomocą metody oceniania (skala Likerta) najsłabiej sprawdza się w przypadku prób losowanych z niejednorodnej (zróżnicowanej) populacji. Dodatkowo potwierdzono, że im większe próby losujemy z populacji o dowolnej strukturze, to – niezależnie od długości estymowanej hierarchii – uzyskujemy lepsze oszacowania.
Podsumowując, porównywane sposoby pomiaru prowadzą do odmiennych hierarchii wartości, które statystycznie nieznacznie różnią się między sobą. Spośród pozostałych uwzględnionych w niniejszej rozprawie metodologicznych czynników, to jest długości hierarchii, wielkości losowanej próby oraz struktury populacji, mogących mieć wpływ na postać otrzymanej hierarchii, każdy z osobna okazał się znaczący. Zaobserwowano też wzajemny wpływ długości hierarchii i sposobu pomiaru, w efekcie którego możliwe było wyznaczenie najlepszych metod do pomiaru hierarchii o określonej ilości atrybutów.
Drugim zaobserwowanym zjawiskiem jest wspólne oddziaływanie wszystkich czterech czynników łącznie na uzyskane uporządkowanie obiektów, co najwyraźniej widać na przykładzie prób losowanych z niejednorodnej (zróżnicowanej) populacji. W przypadku układów 6-elementowych dla wszystkich sposobów pomiaru i dla każdej wielkości losowanej próby oszacowanie hierarchii w takiej populacji było najmniej dokładne. Dla układów
10-elementowych wyniki estymacji na podstawie pomiaru prowadzonego metodą najlpszy-najgorszy zgodnie z pierwszą propozycją Lee z zespołem (2008) uległy poprawie (to znaczy przesunęły się z ostatniego miejsca), gdy losowano małe próby (n1 = 30 i n2 = 100). Natomiast dla układów 18- i 19-elementowych oszacowanie hierarchii w populacji za pomocą wspomnianej metody pomiaru dla każdej wielkości losowanej próby przestało być najmniej dokładne.
W przeprowadzonych analizach nie oceniano jednak zgodności otrzymanych hierarchii w sensie treściowym. Od umiejętności interpretacji psychologa zależy interpretacja merytoryczna wyników otrzymanych za pomocą porównywanych metod.