ArticlePDF Available

Eğitim Araştırmalarında Likert Ölçeği ve Likert-Tipi Soruların Kullanımı ve Analizi

Authors:
Sakarya Üniversitesi Eğitim Fakültesi Dergisi; 2015; (30): 186-203
SAKARYA ÜNİVERSİTESİ EĞİTİM
FAKÜLTESİ DERGİSİ
ISN: 1303-0310
Gönderim Tarihi:17.09.2015 – Kabul Tarihi: 15.12.2015
Eğitim Araştırmalarında Likert Ölçeği ve Likert-Tipi Soruların Kullanımı ve
Analizi
İbrahim TURAN1 Ümit ŞİMŞEK2 Hasan ASLAN3
Öz: Rensis Likert tarafından 1932 yılında ortaya atıldığından bu yana geçen sürede Likert ölçeği ve
Likert-tipi sorular sosyal bilimler, siyaset bilimi, psikoloji, pazarlama ve eğitim gibi pek çok alanda en
çok kullanılan tutum ve eğilim ölçüm tekniği haline gelmiştir. Ancak “Likert Ölçeği” ve “Likert-tipi
soru” kavramlarının birbiriyle karıştırılması bu ölçeklerden elde edilen verilerin yanlış analizine ve
yorumlanmasına yol açmaktadır. Bir başka tartışma konusu da Likert ölçeği veya Likert-tipi sorular
ile elde edilen verilerin analizinde parametrik testlerin mi yoksa parametrik olmayan testlerin mi
kullanılacağı hususudur. Bu araştırmanın amacı literatürde “Likert Ölçeği” ve Likert-tipi Soru
kavramları ve bu tür ölçeklerde kullanılabilecek analiz türleri üzerinde yapılan tartışmaları incelemek,
eğitim araştırmalarında bu kavram ve yöntemlerden hangisinin tercih edildiğini tespit etmek ve son
olarak bu tip ölçeklerden elde edilen verilerin istatistiksel analizinde hangi testlerin uygulanması
gerektiğini örnek analizler ile ortaya koymaktır. Araştırma sonucunda konuyla ilgili kavramların
birbiriyle karıştırıldığı, Likert-tipi sorularda çoğunlukla parametrik olmayan, Likert ölçeklerinde
hangi testin daha tutarlı ve güvenilir olduğu konusunda bir görüş birliği olmamasına rağmen
genellikle parametrik testlerin kullanıldığı tespit edilmiştir.
Anahtar Kelimeler: Eğitim araştırması; likert ölçeği; likert-tipi soru; parametrik testler; parametrik
olmayan testler.
Bu çalışma 3-5 Ekim 2013 tarihleri arasında Trabzon’da düzenlenen VI. Sosyal Bilimler Eğitimi Kongresinde
sunulan bildirinin gözden geçirilmiş ve genişletilmiş halidir.
1 İstanbul Üniversitesi, Hasan Ali Yücel Eğitim Fakültesi, İlköğretim Bölümü, ibrahim.turan@istanbul.edu.tr
2 Atatürk Üniversitesi, Kazım Karabekir Eğitim Fakültesi, İlköğretim Bölümü, simsekum@atauni.edu.tr
3 Atatürk Üniversitesi, Kazım Karabekir Eğitim Fakültesi, Ortaöğretim Bölümü, hasanaslan_25@hotmail.com
186
Eğitim Araştırmalarında Likert Ölçeği ve Likert-Tipi Soruların Kullanımı ve Analizi
The Use and Analysis of Likert Scales and Likert-Type Items in Educational
Research
Abstract: Since its introduction in 1932 by Rensis Likert, Likert scales and Likert-type items have
become the most used attitude and tendency measurement technique in many areas like, social
sciences, political sciences, psychology, marketing and education. However, confusion in "Likert
Scale" and "Likert-type item" concepts leads to misinterpretation and false analysis of the data
obtained from these scales. Another topic of discussion is whether parametric or non-parametric tests
should be used in analyzing the Likert scale and Likert-type items. The purpose of this research, is to
clarify concepts of "Likert Scale" and "Likert-type item", to determine which concept and method is
more preferred in educational research, and to examine which test should be used in the statistical
analysis of data obtained from this type of scales. The result of the study show that relevant concepts
are mixed with each other, Likert-type items are mostly analyzed with non-parametric tests, and
generally parametric tests were used in analyzing Likert scales despite the lack of a consensus on
consistent and reliable method.
Keywords: Educational research; likert scale; likert-type item; parametric tests; non-parametric tests.
Giriş
Eğitim araştırmalarında sıklıkla ölçülmeye çalışılan değişkenlerden biri de tutumdur.
Tutum, “belirli nesne, durum, kurum, kavram ya da diğer insanlara karşı öğrenilmiş, olumlu
ya da olumsuz tepkide bulunma eğilimi” (Tezbaşaran, 2008, s.1) olarak tanımlanmıştır. Birey
ve grupların tutum, eğilim ve görüşlerini ölçmek için bugüne kadar Bogardus tarafından
geliştirilen “Toplumsal Uzaklık Ölçeği,” L. L. Thurstone’un “Eşit Görünümlü Aralıklar”
ölçeği, L. Guttman’ın “Yığışımlı Ölçekleme” tekniği ve Rensis Likert’in “Dereceleme
Toplamlarıyla Ölçekleme” modeli gibi farklı ölçekler kullanılmıştır (Tezbaşaran, 2008, s.5).
Ancak bunlar arasında en yaygın kullanıma sahip olanı (Judd, Eliot ve Kidder, 1991, Akt.
Tezbaşaran, 2008) Rensis Likert (1932) tarafından Thurstone ölçeğinin basitleştirilmiş bir
versiyonu olarak geliştirilen Likert ölçeğidir (Cramer ve Howitt, 2004: 89). Uygulaması,
kodlaması ve ölçmesi gayet kolay olduğu için (Spector, 1992) sosyal bilimler, siyaset bilimi,
psikoloji, pazarlama ve eğitim gibi pek çok alanda sıklıkla başvurulan teknik (Edmondson,
2005) haline gelmiştir.
187
Sakarya Üniversitesi Eğitim Fakültesi Dergisi; 2015; (30): 186-203
Likert-tipi sorular araştırılan konu hakkında tutum veya görüş içeren bir ifade ve bu
ifadeye katılım düzeyini belirten seçenekler içerir. Likert-tipi sorularda katılım düzeyini
belirlemek amacıyla iki aşırı uç arasında yer alan birden çok seçenek sunulur. Bu seçenekler
“en yüksekten en düşüğe” veya “en iyiden en kötüye” doğru dereceli bir şekilde sıralanır.
Analiz aşamasında bu seçenekler derecelerine göre birer sayısal değer atanarak kodlanır ve
böylece nitel veri nicel veriye dönüştürülerek analiz edilir.
Likert “Bir Tutum Ölçüm Tekniği” isimli çalışmasında “Sosyal tutum ölçülebilir mi?”
ve “İki kişinin tutumu birbirinden ayırt edilebilir mi?” sorularına cevap aramıştır (1932: 8). 3
seçenekli ifadeler ve çoktan seçmeli sorulara da yer verdiği bu çalışmasında kendi deyimiyle
“Kesinlikle Onaylıyorum İfadeleri” olarak adlandırdığı 5’li Likert-tipi soruların diğer soru
tipleri karşısında etkililiğini araştırmıştır.
Tablo 1. Likert’in Tezinde Kullandığı 5 Seçenekli Ölçüm Sistemi.
Kesinlikle
Onaylıyorum
Onaylıyorum
Kararsızım
Onaylamıyorum
Kesinlikle
Onaylamıyorum
Orjinali 5 seçenekten oluşan (Tablo 1) Likert-tipi sorular günümüzde 3’ten 7’ye kadar
farklı seçenek sayısı ve farklı etiketleme sistemleri ile kullanılmaktadır. Şekil-1’de Likert-tipi
soruların farklı kullanımlara dair örnekler sunulmuştur.
Şekil 1. Farklı Seçenek Sayısı ve Etiketleme Sistemi ile Hazırlanmış Likert-tipi Soru Örnekleri.
Örnek-1: 3’lü Likert-tipi soru
Katılıyorum
Katılmıyorum
Örnek-2: 4’lü Likert-tipi soru
Tamamen
Destekliyorum
Destekliyorum
Desteklemiyorum
Hiç
Desteklemiyorum
Örnek-3: 5’li Likert-tipi soru
Çok Seviyorum
Seviyorum
Ne Seviyorum
Ne Sevmiyorum
Sevmiyorum
Hiç Sevmiyorum
Örnek-4: 6’lı Likert-tipi soru
Çok iyi
İyi
Biraz İyi
Biraz Kötü
Kötü
Çok Kötü
Örnek-5: 7’li Likert-tipi soru
Tamamen
Uygun
Uygun
Biraz
Uygun
Tarafsızım
Biraz
Uygunsuz
Uygunsuz
Kesinlikle
Uygunsuz
Yukarıda bahsedilen çalışmasında Likert katılımcıların uluslararasıcılık konusundaki
tutumlarını ölçmek için 9 adet 5’li Likert-tipi soru, Afro-Amerikan hakları konusundaki
188
Eğitim Araştırmalarında Likert Ölçeği ve Likert-Tipi Soruların Kullanımı ve Analizi
tutumlarını ölçmek için 6 adet 5’li Likert-tipi soru ve sömürgecilik konusundaki tutumlarını
ölçmek için 8 adet 5’li Likert-tipi soru kullanmıştır (1932:15-20). Katılımcıların herhangi bir
konu (boyut) hakkındaki tutumlarını ortaya koymak için soruları tek tek ele almamış o
boyutu ölçmek için kullandığı tüm soruları bir arada analiz etmiştir.
Son derece yaygın bir kullanıma sahip olmakla birlikte Likert ölçeği ve Likert-tipi
soruların doğru kullanımı ve analizi konusunda uzun süren bir kafa karışıklığı ve
anlaşmazlık söz konusudur (Carifio ve Perla, 2008: 1150). Bazı araştırmacılar Likert verilerin
t test gibi parametrik testler kullanılarak analiz edilebileceğini diğerleri ise bu tip verilerin
analizinde parametrik olmayan testlerin kullanılmasının daha doğru olduğunu
savunmaktadır.
Bu araştırmanın amacı literatürde yer alan farklı görüşlere yer vererek “Likert
Ölçeği” ve “Likert-tipi Soru” kavramlarına açıklık getirmek, eğitim araştırmalarında bu
kavram ve yöntemlerden hangisinin tercih edildiğini tespit etmek ve bu tip ölçeklerden elde
edilen verilerin istatistiksel analizinde hangi testlerin uygulanması gerektiğini örnek
analizler ile ortaya koymaktır.
“Likert-tipi Soru” ve “Likert Ölçeği” Kavramlarının Ayrımı
Literatürde bu tip soru ve ölçekleri tanımlarken “Likert ölçeği”, “Likert tipi ölçek”,
“Likert tipi soru”, “5’li Likert ölçeği”, “5’li Likert-tipi soru”, “Likert tipi anket” gibi çok farklı
kavramların ve çoğu zaman birbirinin yerine kullanıldığını görmekteyiz. Bu araştırma
kapsamında YÖK Tez Merkezinde tarama yapılarak Eğitim Bilimleri alanında Likert-tipi
soru veya Likert ölçeği kullanılarak yapılmış tezler arasından ulaşılabilir örneklem yolu ile
seçilmiş 64 adet Yüksek Lisans ve Doktora tezi incelenmiştir. İncelenen tezlerde çoğunlukla
Likert tipi ölçek ve Likert tipi anket” ifadelerinin kullanıldığı görülmüştür. Bu konudaki
kavram karmaşası incelenen tezlerde de gözlemlenmiş ve araştırmacıların çoğu zaman
“Likert-tipi ölçek” ile “Likert tipi anket” kavramlarını veya “Likert-tipi soru” ile “Likert-tipi
ölçek” kavramlarını bir arada ve birbirlerinin yerine kullandıkları saptanmıştır.
Akademik yazımda bu kavramlar dikkatli seçilmeli ve kesinlikle birbirinin yerine
kullanılmamalıdır. Çünkü kavramların birbirinin yerine kullanılması sadece yazım hatası
değil, daha büyük istatistiksel hatalara yol açan bir durumdur. Yukarıda sayılan farklı
kavramlar arasında tercih edilmesi gereken alan yazımda tanımlanmış ve açıklanmış olan
189
Sakarya Üniversitesi Eğitim Fakültesi Dergisi; 2015; (30): 186-203
“Likert-tipi soru” veya “Likert ölçeği” kavramlarıdır. Bu iki kavram istatistiksel analizde
doğru test seçimi için önemli olduğundan burada açıklanmaya çalışılacaktır.
Likert Tipi Soru
Likert’in kendi çalışmasında kullandığı soru tipine benzeyen ancak seçenek sayı
veya kullanılan kelimeler farklı olan tek soruları ifade eder. Likert tipi soruların kullanıldığı
araştırmalarda her ne kadar birden çok soru kullanılsa da araştırmacının bu soruların
ortalama değerlerini kullanarak genel bir çıkarımda bulunma amacı yoktur. Sorular
birbirinden bağımsız olarak tek tek ele alınır. Tablo-2’de her biri başka bir değişkeni ölçmeye
yönelik hazırlanmış dolayısıyla birbirinden bağımsız değerlendirilmesi gereken Likert-tipi
sorulara örnek verilmiştir.
Tablo 2. Likert-tipi Sorular
Kesinlikle
Katılmıyorum
Katılmıyorum
Kararsızım
Katılıyorum
Kesinlikle
Katılıyorum
İstanbul Üniversitesini
seçtiğim için memnunum
Ailem üniversite tercihimde
bana çok yardımcı oldu
Danışman hocalarımız bize
yeterince yardımcı
olmaktadır
Likert-tipi Sorular Konusunda Literatürde Yer Alan Tartışmalar
Seçenek Sayısı
Likert-tipi sorulara anketlerinde yer veren araştırmacılar Likert’in yaptığı gibi
seçenek sayısı olarak genelde 5’li ölçek kullanmaktadırlar. Ancak literatürde 3’ten 18’e kadar
farklı seçenek sayılarının kullanıldığı ve en uygun seçenek sayısının tartışma konusu olduğu
görülmektedir (Preston ve Colman, 2000: 2). Tartışmanın kaynağı kullanılacak seçenek
sayısının ölçeğin geçerlik ve güvenirliği üzerine olası etkisidir. Jacoby ve Matell (1971: 499)
seçenek sayısının araştırma sonucu üzerinde anlamlı bir etkisinin olmadığını bu nedenle 3
seçenekli bir ölçeğin yeterli olacağını ifade etmektedir. Diğer taraftan 2, 3, 4, 5, 6, 7, 8, 9, 10,
11 ve 101 seçenekten oluşan ölçekleri geçerlik, güvenirlik ve kullanıcı tercihleri açısından
karşılaştıran Preston ve Colman (2000) bunun aksini iddia etmektedir. Preston ve Colman
(2000: 12) araştırmalarında 2, 3 ve 4 seçenekten oluşan ölçeklerin en düşük, 5 ve 6 seçenekten
oluşan ölçeklerin orta, 7-10 seçenekten oluşan ölçeklerin ise en yüksek geçerlik, güvenirlik ve
190
Eğitim Araştırmalarında Likert Ölçeği ve Likert-Tipi Soruların Kullanımı ve Analizi
kullanıcı tercihi değerlerine sahip olduklarını, 7-10 seçenekten oluşan ölçekler ile 101 puanlı
ölçek arasında ise anlamlı bir farklılık bulunmadığını ortaya koymuşlardır. Seçenek sayısın
belirlemede katılımcı profili de önemli bir unsurdur. Küçük yaştaki katılımcılar için daha az
seçenek sayısı önerilmektedir (Adelson ve McCoachk, 2010: 797).
Seçenek Etiketleri
Likert-tipi soruların avantajlarından biri de seçeneklerin etiketlenmesinde
araştırmacılara sağladığı geniş serbestliktir (Bkz. Şekil-2). Bu etiketlerin anket veya ölçekte
gösterilmesinde iki farklı uygulamanın var olduğunu görmekteyiz; a) Tüm seçeneklerin
etiketlenmesi, b) Sadece uç değerlerin etiketlenerek ara değerlerin boş bırakılması. Weijters,
Cabooter ve Schillewaert (2010: 244) bu iki sistem arasındaki farkı ortaya koydukları
araştırmalarında tüm seçenekleri etiketlemenin algılama, fark edilme ve çekiciliği
arttırdığını, yanlış işaretleme, boş bırakma ve aşırı uçlara yönelme eğilimini azalttığını ortaya
koymuşlardır.
Tarafsızlık/Kararsızlık Seçeneği
Ölçek geliştiriciler Likert-tipi sorularda kullanılabilecek en uygun seçenek sayısının
tek sayı mı yoksa çift sayıolduğu üzerinde tartışmaktadırlar (Adelson ve McCoachk,
2010: 797). Bu tartışmanın asıl amacı tarafsızlık veya kararsızlık ifade eden seçeneğine yer
verilip verilmeyeceğidir. Bazı araştırmacılar tarafsızlık/kararsızlık seçeneğine yer
verilmesinin ölçeğin ayırt ediciliğini ve dolayısıyla güvenirliğini arttıracağını iddia ederken,
bazı araştırmacılar ise bu seçeneğin kaldırılmasının katılımcıları daha çok düşünmeye sevk
edip daha kesin cevaplar vermelerini sağlayacağını belirtmektedir (Garland, 1991: 70).
Burada tartışılan bir başka husus da araştırmacıların tarafsızlık seçeneğini kullanma
amacıyla katılımcıların bu seçenekleri algılayış biçiminin her zaman örtüşmediği görüşüdür.
Araştırmacılar bu seçeneği, katılımcılar soruda verilen (pozitif ve negatif) iki uç seçenek
arasında, her iki seçeneğe eşit uzaklıkta kaldıklarında seçebilmeleri için kullanmaktadırlar.
Yani araştırmacılar için bu seçenek çoğu zaman ortalama, ılımlı bir konumu belirtme amacı
gütmektedir (Kulas ve Stachowski, 2009). Ancak bu seçenek katılımcılar için her zaman
ortalama veya ılımlı bir anlam ifade etmemektedir (Kulas, Stachowski, & Haynes, 2008).
Shaw ve Wright ‘a (1967) göre katılımcılar üç durumda bu seçeneği işaretlemektedirler:
1. Konu hakkında her hangi bir tutum veya fikirleri olmadığı zaman,
2. Konu hakkındaki tutum veya fikirlerini tam olarak tanımlayamadıkları zaman,
191
Sakarya Üniversitesi Eğitim Fakültesi Dergisi; 2015; (30): 186-203
3. Değerlendirme açısından dengede oldukları zaman.
Bunun dışında katılımcılar konuya ilgisiz veya kayıtsız olduklarında (Nowlis, Kahn
ve Dhar, 2002), kişisel sorularda gerçek cevaplarını gizlemek istediklerinde (Tourangeau,
Smith, & Rasinski, 1997), diğer cevapları kendilerine uygun bulmadıklarında, konu hakkında
yeterli bilgiye sahip olmadıklarında veya kesin cevaplar vermekten kaçındıklarında (Stone,
2004) bu seçeneği işaretlemektedirler.
Tarafsızlık/Kararsızlık Seçeneğinde Kullanılacak İfade
Yukarıda katılımcıların sorulan sorular hakkında yeterli bilgiye sahip olmadıklarında
ve kendilerine başka bir seçim hakkı verilmediğinde tarafsızlık/kararsızlık seçeneğini
işaretleyerek soruyu geçiştirdiklerinden bahsedilmişti. Bu durum veri toplama aracının
geçerlik ve güvenirliğini olumsuz etkilemektedir. Ryan ve Garland (1999, 109) yaptıkları üç
uygulamada kullanılan anketlerde “bilmiyorum” seçeneğine yer verildiğinde katılımcıların
ortalama % 20’sinin bu seçeneği işaretlediklerini ortaya koymuşlardır.
Likert-tipi Sorulara Getirilen Eleştiriler
Uygulaması, kodlaması ve ölçmesinin kolay olması, farklı sayıda seçenek
kullanımına izin vermesi, seçeneklerin etiketlenmesinde araştırmacılara serbestlik tanıması
ve katılımcılar için kolay anlaşılır olması (Tavakoli, 2012; Spector, 1992), tutum ve görüş
araştırmalarında Likert-tipi soruların sıklıkla kullanılmasını sağlamıştır. Ancak Likert-tipi
soruların eleştirildiği hususlar da söz konusudur. Literatürde Likert-tipi sorulara yöneltilen
eleştiriler beş ana başlık altında toplanabilir:
1. it Aralık: Seçenekler arasında eşit aralık söz konusu değildir (Tavakoli, 2012;
Goldstein ve Hersen, 1984).
2. Zorlanmış seçenek: Birçok anket ve ölçek sorusunda olduğu gibi Likert tipi sorularda
katılımcılardan verilen seçenekler arasından kendisine en uygun olanı seçmesini
istenmesi çoğu zaman katılımcıları “kötünün en iyisini” seçmeye zorlamaktadır.
3. Kabullenme eğilimi: Katılımcıların sorunun içeriğine bakmadan olumlu seçeneği
işaretleme eğilimidir.
4. Merkeze yöneliş eğilimi: Yukarıda bahsedildiği üzere çeşitli nedenlere katılımcılar
Likert tipi sorularda ortada yer alan seçeneği işaretleme eğilimindedir. Bu nedenle
tarafsızlık/karasızlık seçeneğine yer verilip verilmemesi tartışma konusudur. Yine bu
192
Eğitim Araştırmalarında Likert Ölçeği ve Likert-Tipi Soruların Kullanımı ve Analizi
seçenekte kullanılan “Kararsızım”, “Fikrim Yok” gibi ifadeler araştırmacılar
tarafından eleştirilmektedir.
5. Aşırı uçlara yöneliş eğilimi: İnsanlar “katılıyorum tamamen katılıyorum” veya
“onaylamıyorum kesinlikle onaylamıyorum” gibi iki dereceli bir seçenekle
karşılaştıklarında en olumsuz veya en olumlu seçeneği seçme eğilimindedirler
(Javaras ve Ripley, 2007; Baumgartner ve Steenkamp, 2001; Cronbach, 1950;
Cronbach, 1946).
Likert Ölçeği
Likert ölçeği, birden çok Likert-tipi sorunun bir araya getirilerek kullanıldığı ölçekleri
ifade eder. Tek bir araştırma problemini cevaplandırmak amacıyla iki veya daha fazla Likert
tipi soru oluşturmak ve analiz aşamasında bu soruların ortalama (birleştirilmiş) değerlerini
kullanmak şeklinde tanımlanmıştır (Clason ve Dormody, 1994). Bu ölçekte amaç tüm
soruların birleştirilmiş değerlerinden insanların bu konular üzerindeki ortalama tutumlarını
belirlemektir. Tablo-3’de sağlıklı beslenmeye yönelik tutumu ölçmek amacıyla birden çok
Likert-tipi sorunun bir arada kullanılmasıyla oluşturulmuş Likert ölçeğine örnek verilmiştir.
Tablo 3. Likert Ölçeği Örneği
Kesinlikle
Katılmıyorum
Katılmıyorum
Kararsızım
Katılıyorum
Kesinlikle
Katılıyorum
Sağlıklı beslenmeye çalışırım.
Fastfood her zaman ilk
tercihimdir.
Yemek pişirirken mümkün
olduğunca az yağ kullanmaya
çalışırım.
Abur-cubur tarzı gıdaları
sadece öğün aralarında tercih
ederim
Likert ölçekleri toplamalı ölçeklerdir çünkü katılımcının bir konu hakkındaki genel
görüşüne ulaşmak için tek tek soruları verdiği cevaplar toplanır. Bu nenle Likert ölçeği aynı
değişkeni ölçtüğü varsayılan Likert-tipi soruların rastgele bir araya getirilmesi ile
oluşturulamaz. Öncelikle biçimsel ve dil açısından bütünlük sağlanmalı, sorularda olgusal
ifadelere yer verilmemeli, ifadeler yanlış anlamalara yol açmayacak şekilde açık ve net
olmalı, eşit miktarda olumlu ve olumsuz ifadeye yer verilmelidir (Tezbaşaran, 2008, 12-13).
193
Sakarya Üniversitesi Eğitim Fakültesi Dergisi; 2015; (30): 186-203
İkinci olarak belirlenen soruların aynı değişkeni ölçtüğünden emin olmak için pilot çalışma
üzerinde madde analizi yapmak gereklidir. Likert ölçeğinde kullanılan her bir sorunun
ölçülmek istenilen tutum veya görüşü ölçme gücünü belirlemek in iki farklı analiz
kullanılır: a) Korelasyonlara dayalı analiz, b) İç tutarlık ölçütüne (alt ve üst grup ortalamaları
farkına) dayalı analiz (McIver ve Carmines 1982, Akt. Tezbaşaran, 2004, 78).
Likert-tipi Soruların İstatistiksel Analizi
Likert-tipi sorular 1’den başlayarak soruda kullanılan seçenek sayısınca kodlanır. Bu
kodlamada en olumsuz cevap en düşük (1) rakamı ile en olumlu cevap ise en yüksek rakam
ile temsil edilir. 1’den başlayıp devam eden bu sıralı kodlamadan dolayı Likert tipi sorular
sıralı (ordinal) veri olarak kabul edilir. Likert-tipi sorular aralı (interval) veri değildir. Çünkü
yukarıda bahsedilen kodlama sisteminde kullanılan rakamlar arasında matematiksel olarak
eşit aralık var iken bu rakamların temsil ettiği ifadeler arasında eşit bir aralık söz konusu
değildir (Tavakoli, 2012: 326; Goldstein ve Hersen, 1984, 52). Şekil 2’de görüleceği üzere bu
kodlama sisteminde kullanılan 3 ile 2 veya 2 ile 1 rakamları arasındaki aralık eşit iken bu
soruları cevaplayan katılımcıların bu üç cevabı birbirine eşit uzaklıkta gördükleri
söylenemez. Çoğunluk için “Katılmıyorum” ile “Kesinlikle Katılmıyorum” cevapları
arasındaki fark “Kararsızım” ile “Katılmıyorum cevapları arasındaki farktan daha azdır. Bu
alanda yapılan ampirik araştırmalar da katılımcıların Likert tipi sorularda seçenekler
arasındaki farkı eşit olarak algılamadıklarını ortaya koymaktadır (Hart, 1996).
Şekil 2. Likert Tipi Soruların Algılanışı.
Kararsızım
Katılmıyorum
Kesinlikle Katılmıyorum
(3)
(2)
(1)
Likert tipi sorular ordinal veri olarak kabul edildiğinden bu sorulardan elde edilen
verilerin istatistiksel analizinde parametrik olmayan istatistiksel testlerin kullanılması
gerekmektedir. Likert tipi sorulardan oluşan verilerin analizinde tanımlayıcı istatistik yani
aritmetik ortalama yerine medyan ve mod, standart sapma yerine ranj, grafik yerine
histogram kullanılması, fark ve korelasyon hesaplamalarında ise parametrik olmayan
testlerin kullanılması daha doğrudur (Boone ve Boone, 2012).
194
Eğitim Araştırmalarında Likert Ölçeği ve Likert-Tipi Soruların Kullanımı ve Analizi
Ancak literatür taramaları araştırmacıların çoğu zaman bu konuda hataya
düştüklerini ortaya koymaktadır. Clason ve Dormody (1994) Agricultural Education
dergisinde yayınlanmış ve veri toplama aracı olarak Likert ölçeği veya Likert tipi soruları
kullanmış 188 makaleyi incelemişlerdir. Bu inceleme sonucunda Likert tipi soruların
analizinde farklı istatistiksel yöntemlerin kullanıldığın ortaya koymuşlardır. İncelenen 188
makaleden 95’inde Likert tipi sorular kullanılmış ve bunların % 54’ünde sadece tanımlayıcı
istatistik (aritmetik ortalama, standart sapma, frekans vb.), % 13’ünde parametrik olmayan
testler (ki-kare, Mann-Whitney U testi, Kruskall-Wallis testi vb.) ve 34’ünde parametrik
testler (t-test, ANOVA vb.) kullanılarak istatistiksel analiz yapılmıştır (s.31).
Araştırma kapsamında incelediğimiz 65 yüksek lisans ve doktora tezinden 4’ünde
Likert-tipi soru kullanıldığı ve bunların 3’ünde verilerin analizi için parametrik olmayan
testlerin kullanıldığı ancak birinde parametrik testlerin kullanıldığı tespit edilmiştir.
Likert Ölçeğinin İstatistiksel Analizi
Likert-tipi soruların analizinde parametrik olmayan testlerin kullanılması hususunda
görüş birliği varken Likert ölçeğinin analizinde kullanılacak test türü konusunda iki ayrı
görüş söz öne sürülmektedir. Birinci görüşü destekleyen uzmanlara göre sıralı (ordinal) veri
her zaman ordinal veridir ve hiçbir şekilde aralı (interval) veri haline getirilemez (Jamieson,
2004). Bu nedenle bazı araştırmacılar ordinal veri analizinde parametrik testlerin
kullanılmasını “istatistiksel analizin yedi ölümcül günahından biri” olarak tanımlamışlardır
(Kuzon, Urbanchek, ve McCabe, 1996).
İkinci görüşe sahip uzmanlara göre ise Likert ölçeğinde yer alan sorulara verilen
cevapların aritmetik ortalamasının alınması veriyi aralı (interval) veri haline getirir ve bu
aritmetik ortalama üzerinde parametrik testler uygulanabilir (Carifio ve Perla, 2008). Yine
bazı araştırmacılara göre test türünün seçiminde veri türüne kıyasla örneklem büyüklüğü ve
dağılımın türü daha önemli kıstaslardır (Knapp, 1990, Akt. Jamieson, 2004).
Bu durumda Likert ölçeğinin analizinde hem parametrik (t-test, ANOVA vb.), hem
de parametrik olmayan (ki-kare, Mann-Whitney U testi, Kruskall-Wallis vb.) testler
kullanılabileceği iddia edilmektedir. İstatistik uzmanlarının arasındaki bu görüş ayrılığı alan
yazımda karşılık bulmuş ve araştırmacılar Likert ölçeğinden elde ettikleri verilerin
analizinde farklı testler kullanmışlardır.
195
Sakarya Üniversitesi Eğitim Fakültesi Dergisi; 2015; (30): 186-203
Kaptein, Nass ve Markopoulos (2010, 2391), CHI (2009) Konferansında sunulan
bildirileri incelenmiş ve bunların % 45’inde Likert tipi ölçeklerin kullanıldığını, Likert tipi
ölçeği kullanan araştırmacıların büyük çoğunluğunun (% 80.6) veri analizinde parametrik
testleri kullandığını ve sadece % 8.3’ünün parametrik olmayan testleri kullandığını tespit
etmişlerdir.
Bu araştırma kapsamında incelediğimiz 65 yüksek lisans ve doktora tezinden 61’inde
Likert tipi ölçek kullanılmıştır. Bu ölçeklerin % 90’ı (55) parametrik testler kullanılarak analiz
edilmiştir. Geriye kalan 4 araştırmada (ölçekten elde edilen veriler parametrik testlerin ön
koşullarını sağlamadığı için) parametrik olmayan testler kullanılmış, 2 araştırmada ise ölçek
verileri hem parametrik hem de parametrik olmayan testler kullanılarak analiz edilmiştir.
Likert ölçeğinden elde edilen verilerin analizinde hangi yaklaşımın daha güvenli ve
tutarlı sonuç verdiği farklı araştırmalarda test edilmiştir. Kaptein, Nass ve Markopoulos
(2010) 7’li Likert ölçeğinden elde edilen verilerin analizinde parametrik testler ile parametrik
olmayan testlerin güvenirliğini incelemişlerdir. Araştırmacılar parametrik ANOVA testi ile
bunun parametrik olmayan alternatifi Kruskall Wallis testini karşılaştırmışlar ve özellikle
örneklem sayısının küçük olduğu durumlarda (n < 50) parametrik olmayan testin daha
güvenilir sonuçlar verdiğini ortaya koymuşlardır (s.2393).
Nanna ve Sawilowsky (1998) 7’li Likert ölçeğinden elde edilen verilerin analizinde t-
testi ve Mann-Whitney-Willcoxon testini karşılaştırmış ve parametrik olmayan Mann-
Whitney-Willcoxon testinin daha güvenilir sonuçlar verdiğini ortaya koymuştur.
Glass, Peckham ve Sanders (1972:237) 5-7 seçenekli Likert ölçeğinden elde edilen
verilerin analizinde parametrik ANOVA testinin kullanımının uygun olduğunu. Bu test
kullanılarak aralı (interval) veri önkoşullarının ihlal edildiği durumlarda dahi (varyansların
eşitliği önkoşulu hariç) son derece kararlı ve güvenilir sonuçlar elde edilebileceğini ortaya
koymuşlardır.
Winter ve Dodou (2010) 5’li Likert ölçeğinden elde edilen verilerin analizinde t-testi
ve Mann-Whitney-Willcoxon testini karşılaştırmış ve her iki testte de tip-1 hata yapma
ihtimalinin %3’ün altında olduğu, her iki yaklaşımda da testin gücünün birbirine yakın
seviyelerde olduğunu saptamışlar bu nedenle bunlardan herhangi birini seçmenin yanlış
olmayacağı kanaatine varmışlardır.
196
Eğitim Araştırmalarında Likert Ölçeği ve Likert-Tipi Soruların Kullanımı ve Analizi
Bu araştırmada Likert ölçeklerinden elde edilen verilerin analizinde parametrik ve
parametrik olmayan testlerin ulaştığı sonuçları sınamak amacıyla ilk olarak parametrik
bağımsız gruplar t testi ile bunun parametrik olmayan karşılığı Mann-Whitney U Testi
karşılaştırılmıştır. Karşılaştırma amacıyla 1350 öğrenci üzerinde uygulanmış 5 adet 5’li Likert
tipi sorudan oluşan tutum ölçeği verileri üzerinden SPPS-21 programı kullanılarak farklı
büyüklüklerde örneklemler alınmıştır. Bu örneklemler üzerinde “Öğrencilerin tarih dersine
karşı tutumları cinsiyete ve sınıfa göre değişir” tezleri test edilmiştir. Rastgele seçilen
örneklemler arasında parametrik t test ön koşullarını taşıyan (normal dağılıma sahip) 27
örneklem üzerinde karşılaştırma yapılmıştır. Tablo 5’de görüleceği her iki testte ulaşılan σ
değerleri birbirine çok yakındır. Yine yapılan karşılaştırmaların 24’ünde (%89) t test ve
Mann-Whitney U testleri aynı sonuca ulaşarak H1 hipotezini ret edip H0 hipotezini kabul
etmiştir. Ancak yapılan karşılaştırmaların 3’ünde (%11) t test ve Mann-Whitney U testi farklı
sonuçlara ulaşmışlardır.
Tablo 5. t Test ile Mann-Whitney U Testi Karşılaştırması.
n
t test
Sig. (2-tailed)
Mann-Whitney U
Sig. (2-tailed)
Fark
(‰)
24
,099*
,161*
62
24
,133
,204
71
25
,074*
,116*
42
26
,232
,314
82
26
,380
,602
222
35
,774
,778
4
35
,965
,935
30
38
,761
,843
82
42
,586
,565
21
42
,827
,795
32
51
,291
,265
26
51
,366
,396
30
51
,652
,712
60
51
,928
,985
57
51
,497
,361
136
51
,112*
,069*
43
61
,648
,370
278
61
,072
,080
8
62
,161
,157
4
67
,122
,190
68
68
,218
,308
90
78
,002
,003
1
99
,891
,717
174
116
,673
,652
21
140
,524
,445
79
145
,551
,504
47
197
,007
,010
3
* t test ve Mann-Whitney U testi farklı sonuçlara ulaşmıştır.
197
Sakarya Üniversitesi Eğitim Fakültesi Dergisi; 2015; (30): 186-203
İkinci olarak Tablo 3’te gösterilen karşılaştırmanın bir benzeri parametrik tek yönlü
varyans analizi (ANOVA) ile bunun parametrik olmayan karşılığı Kruskal-Wallis Testi
arasında gerçekleştirilmiştir. 1350 kişilik çalışma evreni içerisinden SPSS-21 programı
kullanılarak farklı büyüklüklerde örneklemler seçilmiş ve bunlar arasında parametrik tek
yönlü varyans analizi (ANOVA) testinin ön koşullarını karşılayan 15 örneklem üzerinde
karşılaştırma yapılmıştır. Tablo 6’da görüleceği üzere her iki testte ulaşılan σ değerleri
birbirine çok yakındır. Yapılan karşılaştırmaların büyük çoğunluğunda (14) ANOVA ve
Kruskal-Wallis testleri aynı sonuca ulaşarak H1 hipotezini ret edip H0 hipotezini kabul
etmiştir. 15 karşılaştırmadan sadece birinde kullanılan testler farklı sonuçlara ulaşmıştır.
Tablo 6. ANOVA ile Kruskal-Wallis Testi karşılaştırması
n
ANOVA
Kruskal-Wallis
Fark (‰)
27
,214
,204
10
27
,150
,139
11
41
,168
,179
11
41
,640
,529
111
55
,003
,007
4
65
,792
,741
51
82
,642
,592
50
84
,198
,211
13
85
,729
,709
20
140
,687
,709
22
195
,308
,211
97
200
,622
,578
44
200
,093
,154
61
200
,023*
,105*
82
250
,318
,222
96
* ANOVA ve Kruskal-Wallis testleri farklı sonuca ulaşmıştır.
Son olarak Glass, Peckham ve Sanders’in (1972:237) Likert ölçeğinden elde edilen
verilerin analizinde parametrik ANOVA testinin veri önkoşullarının ihlal edildiği
durumlarda dahi (varyansların eşitliği önkoşulu hariç) son derece kararlı ve güvenilir son
verdiği” tezini sınanmıştır. Tek yönlü varyans analizi (ANOVA) testinin normal dağılım ve
varyansların eşitliği ön koşulunu yerine getirmeyen iki örneklem verisi üzerinde ANOVA ve
Kruskal-Wallis testlerinin ne tür bir sonuca ulaşacağı sınanmıştır. Tablo 7’de “Öğrencilerin
teknolojiye karşı tutumları öğrenme stillerine göre değişmektedir” hipotezi parametrik
ANOVA ve parametrik olmayan alternatifi Kruskal-Wallis testi ile test edilmiştir. Hipotezi
test etmek için yanlış test kullanıldığında (dağılım normal olmadığından burada ANOVA
198
Eğitim Araştırmalarında Likert Ölçeği ve Likert-Tipi Soruların Kullanımı ve Analizi
kullanılmamalıdır) dağılımda aslında var olan istatistiksel farkın var olmadığı sonucuna
varılacak dolayısıyla tip II (β) hataya düşülecektir.
Tablo 7. Normal Dağılım Ön Koşulunun Karşılanmadığı Durumda ANOVA ile Kruskal-Wallis Testi
Karşılaştırması
Tablo 8’de ise Çalışanların işyeri memnuniyetleri eğitim seviyesine göre
değişmektedir” hipotezi parametrik ANOVA ve parametrik olmayan alternatifi Kruskal-
Wallis testi ile test edilmiştir. Hipotezi test etmek için yanlış test kullanıldığında (grupların
varyansları eşit olmadığından burada ANOVA kullanılmamalıdır) dağılımda aslında
olmayan istatistiksel farkın var olmadığı sonucuna varılacak dolayısıyla tip I (α) hataya
düşülecektir.
Tablo 8. Varyansların Eşitliği Ön Koşulunun Karşılanmadığı Durumda ANOVA ile Kruskal-Wallis
Testi Karşılaştırması
ANOVA
Memnuniyet
Sum of Squares
df
Mean Square
F
Sig.
Between Groups
5,497
3
1,832
3,239
,023
Within Groups
110,889
196
,566
Total
116,385
199
Test Statistics
a,b
Memnuniyet
Chi-Square
6,133
df
3
Asymp. Sig.
,105
a. Kruskal Wallis Test
b. Grouping Variable:
Eğitimdurumu
199
Sakarya Üniversitesi Eğitim Fakültesi Dergisi; 2015; (30): 186-203
Sonuç, Tartışma ve Öneriler
Likert-tipi soru veya Likert ölçeği geliştirmesi, uygulaması ve değerlendirmesi kolay
olduğu için eğitim araştırmalarında tutum, eğilim ve görüş ölçmek amacıyla sıklıkla
kullanılmaktadır. Ancak özellikle “değerlendirme kolaylığı” konusu tartışma konusudur.
Üst düzey istatistiksel analizler gerektirmediği için değerlendirmesi kolaydır fakat bu tür
verilerin analizinde hangi test türünün kullanılacağı konusunda görüş birliği olmaması
araştırmacıların işini zorlaştırmaktadır. Bu aşamada karşılaşılan sorunları iki başlık altında
toparlayabiliriz:
a) Kavram karmaşasından kaynaklanan sorunlar: Likert-tipi sorular (3’lü, 5’li, 6’lı
vs.) kullanılarak oluşturulan bir anket ile Likert ölçeği aynı değildir. Yapılan
incelemelerde yanlış analiz kullanıldığı in eleştirilen çalışmalar büyük oranda
araştırmacıların Likert-tipi soruları Likert ölçeği gibi algıladığı araştırmalardır. Bu
tür çalışmaların doğrudan hatalı olarak değerlendirilmesinin nedeni birbirinden
bağımsız Likert-tipi sorularla oluşturulan bir ankette her sorunun ayrı ayrı analiz
edilmesi ve bu analizde parametrik olmayan (mod, medyan, ranj, Mann-Whitney
U, Kruskal-Wallis vb.) testlerin kullanılması gerektiği hususunda görüş birliği
olmasıdır.
b) Veri türü üzerinde yapılan tartışmalardan kaynaklanan sorunlar: Likert
ölçeklerinden elde edilen verinin sıralı veya aralı veri olarak tanımlanmasından
kaynaklanan bu sorunun mutlak çözümü mümkün görünmediğinden bu tip
ölçeklerden elde edilen verilerin analizinde kullanılacak yöntem tartışma konusu
olmaya devam edecektir.
Veri türü üzerinde yapılan tartışmalar nedeniyle Likert ölçeklerinin analizinde hangi
test türünün kullanılacağı konusunda üç ayrı görüş ortaya çıkmaktadır. Birinci görüşe göre
bu tip verilerin analizinde sadece parametrik olmayan testler kullanılabilir, ikinci görüşe
göre hem parametrik hem de parametrik olmayan testler kullanılabilir ve üçüncü görüşe
göre daha güvenli sonuçlar verdiği için sadece parametrik testler kullanılmalıdır.
Bu çalışma sonucunda araştırmacıların daha ziyade üçüncü görüşü benimsedikleri
dolayısıyla Likert ölçeği verilerini genellikle parametrik testler kullanarak analiz ettikleri
saptanmıştır. Her iki test türünün de birbirine yakın sonuçlara ulaşmasına rağmen
200
Eğitim Araştırmalarında Likert Ölçeği ve Likert-Tipi Soruların Kullanımı ve Analizi
araştırmacıların parametrik testleri daha çok tercih etmesinde bu testlerin daha güvenli
sonuçlar ortaya koyduğu inancının yanı sıra parametrik testlerin tanınırlığı ve popülerliği de
etkilidir (Kaptein, Nass ve Markopoulos, 2010: 2391). Burada sıklıkla hatırlatılan husus eğer
parametrik testler tercih edilecekse kullanılan verinin parametrik testlerin önkoşullarına
sahip olduğundan (yani örneklem sayısının 50’nin üstünde, dağılımın normal ve
varyansların eşit olduğundan) emin olunmasıdır (Boone ve Boone, 2012).
Kaynakça
Adelson, J.L., ve McCoach, D.B. (2010). Measuring the mathematical attitudes of elementary
students: the effects of a 4-point or 5-point likert-type scale. Educational and
Psychological Measurement, 70, 796-807, DOI: 10.1177/0013164410366694.
Baumgartner, H., & Steenkamp, J. B. E. M. (2001, May). Response styles in marketing
research: A cross-national investigation. Journal of Marketing Research, 38, ss.
143−156.
Boone, H.N. ve Boone, D.A. (2012). Analyzing Likert data. Journal of Extension, April 2012,
V.50, N.2.
Carifio, J., ve Perla, R. (2008). Resolving the 50-year debate around using and misusing Likert
scales. Medical Education, 42, ss. 11501152.
Clason, D. L. ve Dormody, T. J. (1994). Analyzing data measured by individual Likert-type
items.Journal of Agricultural Education, 35(4), ss. 31- 35.
Cramer, D. & Howitt, D.L. (2004). The SAGE dictionary of statistics: A practical resource for
students in the social sciences. Londra: SAGE.
Cronbach, L.J. (1946). Response sets and test validity.Educational and Psychological
Measurement, 6, ss. 475494.
Cronbach, L.J. (1950). Further evidence on response sets and test design. Educational and
Psychological Measurement, 10, ss. 3-31.
Edmondson, D. R. (2005). Likert scales: A history. In L. C. Neilson (Ed.), Proceedings of the
12th conference on historical analysis and research in marketing (CHARM)(pp. 127
133). Erişim: http://faculty.quinnipiac.edu/charm
Garland, R. (1991). The mid-point on a Likert rating scale: Is it desirable? Marketing Bulletin,
2, ss. 66-70.
Goldstein, G., & Hersen, M. (1984). Handbook of psychological assessment. New York:
Pergamon.
201
Sakarya Üniversitesi Eğitim Fakültesi Dergisi; 2015; (30): 186-203
Hart, M.C. (1996). Improving the discrimination of SERVQUAL by using magnitude scaling.
G. K. Kanji (Ed.), Total Quality Management in Action. London: Chapman and Hall.
Jamieson, S. (2004). Likert scales: how to (ab)use them. Medical Education, 2004; 38: 12171218.
Javaras, K.N. ve Ripley, B.D. (2007). An "unfolding" latent variable model for likert attitude
data: drawing ınferences adjusted for response style. Journal of the American Statistical
Association, Vol. 102, No. 478 (Jun., 2007), ss. 454-463. Erişim:
http://www.jstor.org/stable/27639876 .
Kaptein, M., Nass, C., ve Markopoulos, P. (2010). Powerful and consistent analysis of likert-
type rating scales. CHI 2010 Proceedings, ss.2391-2394.
Kulas, J. T., Stachowski, A. A., & Haynes, B. A. (2008). Middle response functioning inLikert-
responses to personality items.Journal of Business and Psychology, 22, ss.251260.
Kulas, J. T., Stachowski, A. A. (2009). Middle category endorsement in odd-numbered Likert
response scales: Associated item characteristics, cognitive demands, and preferred
meanings. Journal of Research in Personality, 43, ss.489493.
Kuzon, W.M., Urbanchek, M.G. ve McCabe, S. (1996). The seven deadly sins of statistical
analysis. Annals of Plastic Surgery, 1996; 37:265272.
Likert, R. (1932). A technique for the measurement of attitudes. Archives of Psychology, Vol.
22, ss. 5-55.
Nanna, M. J., & Sawilowsky, S. S. (1998). Analysis of Likert scale data in disability and
medical rehabilitation research. Psychological Methods, 3, ss.5567.
Nowlis, S. M., Kahn, B. E., & Dhar, R. (2002). Coping with ambivalence: The effect
ofremoving a neutral option on consumer attitude and preference judgments.Journal
of Consumer Research, 29, ss.319334.
Preston, C. C., & Colman, A. M. (2000). Optimal number of response categories in rating
scales: Reliability, validity, discriminating power, and respondent preferences. Acta
Psychologica, 104, ss. 1-15.
Ryan, C. ve Garland, R. (1999). The use of a specific non-response option on Likert-type
scales. Tourism Management, 20, ss.107-113.
Schutz, H. G., & Rucker, M. H. (1975). A comparison of variable configurations across scale
lengths: an empirical study. Educational and Psychological Measurement, 35, ss.319-324.
Spector, P. E. (1992). Summated rating scale construction: An introduction. Newbury
Park, CA: Sage.
Stone, M. H. (2004). Substantive scale construction. In E. V. Smith Jr. & R. M. Smith
(Eds.),Introduction to Rasch measurement (201225). Maple Grove, MN: JAM.
202
Eğitim Araştırmalarında Likert Ölçeği ve Likert-Tipi Soruların Kullanımı ve Analizi
Tavakoli, H. (2012). A dictionary of research methodology and statistics in applied
linguistics. Tahran: Rahnama.
Tezbaşaran, A.A. (2008). Likert tipi ölçek hazırlama kılavuzu (e-kitap). Erişim:
http://www.academia.edu/1288035/Likert_Tipi_Ölçek_Hazırlama_Kılavuzu
Tezbaşaran, A.A. (2004). Likert tipi ölçeklere madde seçmede geleneksel madde
analizi tekniklerinin karşılaştırılması. Türk Psikoloji Dergisi, 19 (54), 77-87.
Tourangeau, R., & Rasinski, K. A. (1988). Cognitive processes underlying contexteffects in
attitude measurement.Psychological Bulletin, 103, ss. 299314.
Weijters, B., Cabooter, E., & Schillewaert, N. (2010). The effect of rating scale format on
response styles: The number of response categories and response category labels.
Internanitonal Journal of Research in Marketing, 27, ss.236247.
Winter, J.C.F. & Dodou, D. (2010). Five-point likert items: T test vs Mann-Whitney-Wilcoxon.
Practical Assessment, Research & Evaluation, Vol 15, No 11, ss. 1-16.
203
... On the other hand, before sharing the survey, it is important to determine whether the parametric or non-parametric tests will be used in the analysis of data obtained with Likert scale or Likert-type questions. (Turan et al., 2015). Considering Likert's example of 4 measurement systems with available options, it could also be: agree, disagree, strongly agree, and strongly disagree. ...
Article
Full-text available
A student association could be established in a university or between the students outside the university. It can be established in accordance with special laws in order to discuss and solve the common problems of the students. The first step to establish an association is to choose the representatives of the students. After discussing the common problems of the students, the solutions and decisions are made by the representatives of the association within group which is in charge according to slate and policy of the association. The representatives members could be ranked within a group less or more than 13 members as the president, vice president, general secretary, etc. One of the association representative’s duties is to find solutions to the problems and guide the students to be more effective in their study life. This study was carried out on the Yemeni Student Association in Karabuk University. The representatives of the association are 13 students, and the total number of Yemeni students in Karabuk University is around 600 students. According to the questionnaire shared with the students, the members who are getting helped by the association are approximately 303 students. In this study, to evaluate the internal consistency and impartiality among the association member answers using the reliability analysis, 18 questions were asked in a survey and the number of students who answered the questions was 109 students. The method used in the reliability analysis was the Cronbach Alpha method. If α (Cronbach Alpha) ≥ 0.70, then the content of the questions is appropriate and the reliability analysis is accepted which means the internal consistency and impartiality among the association member answers are (very or highly) reliable. Otherwise, the reliability analysis should be re-applied by exchanging the order of the scales (answers) or by deleting items (questions). The survey was shared using Google Form containing 18 questions and 5-point Likert scale. The application of the reliability analysis was made by using SPSS program, and the categorical values were exchanged to numerical values before analysis. The categorization of the categorical values was as follows: Demographic information : age, gender (1=male, 2=female), educational status: (1=language preparation, 2= university), and compatibility questions (strongly agree=1, agree=2, disagree=3, strongly disagree=4, undecided=5). The number of questions which reliability analysis was applied on was 15 questions starting from Q4 to Q18. According to SPSS results, Cronbach alpha value was 0.939, so reliability analysis was accepted.
... Since the scale used consists of Likert-type questions (ordinal data), non-parametric statistical tests should be used even if the data show normal distribution during the analysis. In addition, it is more appropriate to use median and mode instead of mean in data analysis during descriptive statistics (Turan, Şimşek, & Aslan, 2015). For this purpose, in the statistical evaluation of the data, the median values were given in addition to the mean, and non-parametric statistical analyzes were used during the analyses. ...
Article
Full-text available
An essential component of preventing environmental issues is environmental education. Environmental education's primary goal is to raise people's environmental literacy—their understanding and sensitivity to the environment. The purpose of this study is to compare the environmental literacy of chemistry teacher candidates, chemistry teachers, and environmentally related professions in terms of their awareness of environmental issues, knowledge, attitude, and use. It also seeks to find out how gender and experience affect environmental literacy. A total of 793 people from three groups participated in the study. Participants completed an environmental literacy scale that included components for environmental knowledge, environmental attitude, environmental concern, and environmental use. According to the results of the research, it was determined that the three participant groups were sufficient in the components of environmental attitude, environmental use, and environmental concern, but their level of knowledge about environmental issues was not sufficient. Considering the total environmental literacy scores of the study groups, a statistically significant difference was determined in favor of chemistry teachers compared to the other groups. In addition, it was determined that the level of environmental literacy differed according to the o gender and professional experience of teachers.
... It has been observed that all of the measurement tools used are of the Likert type, 2 of them are of the 4-point Likert type, 2 of them are of the 5-point Likert type, and 1 of them is of the 7-point Likert type. According to some researchers, it is stated that Likert type scales are frequently used in educational studies on attitudes, opinions and tendencies due to the ease of implementation and evaluation (Turan et al., 2015). This view is supported by using the same measurement tool in all of the studies examined within the scope of the research. ...
Article
Full-text available
This systematic review of the literature aims to examine the empirical studies about internet addiction of gifted students. The articles reviewed in this study were accessed through the final search made on Google Scholar as well as the searches made in the Web of Science and Education Resources Information Center directories. After determining the keywords and accessing the articles, research articles were selected by the inclusion/exclusion criteria. Only five research articles met those criteria to be reviewed in this study. These research articles were reviewed in terms of methodology, data collection tool(s), participants, statistical analysis and findings. This research review indicated that quantitative methods were chosen in all of the studies and two to four data collection tools (survey, scale, etc.) were used in these studies. In addition, it was revealed that most of the participants consisted of gifted students at secondary and high school levels and male participants of the studies were more than females. It was understood that while research questions were included in four of the studies, hypotheses were not presented in any of them. On the other hand, it was seen that pre-analysis of the statistical analysis was used only in two studies, and these were limited to testing the assumption of normal distribution. While the findings of two of the studies indicated that there were no statistically significant differences according to the gender variable; the findings of the other three showed that there were statistically significant differences according to the gender variable, and this difference was in the direction of males in two studies and females in one study. In addition, only one study has examined internet addiction in the context of online game addiction and revealed that the addiction scores of gifted students were lower than their non-gifted peers. Findings of the current review of the literature were discussed and several recommendations were formed.
... Bu amaçla katılımcıların ölçekte yer alan 1) Hiç katılmıyorum, 2) Katılmıyorum, 3) Kararsızım, 4) Katılıyorum ve 5) Kesinlikle katılmıyorum yargılarından birini seçerek değerlendirme yapması planlanmıştır. [13][14][15][16] II. Madde Havuzunun Oluşturulması: Çalışmada, öncelikle literatür ve medyada yer alan haberlerden yararlanılarak aşı tutumuna ilişkin maddeler belirlenmiştir. ...
Article
Bu çalışma futbolda kullanılan Video Yardımcı Hakem (VAR) sistemine yönelik taraftar tutumlarını belirlemek amacıyla yapılan bir ölçme aracı geliştirme araştırmasıdır. Çalışma genel tarama modeli kullanılan betimsel bir araştırmadır. Araştırmanın grubu VAR sisteminin uygulandığı süper lig profesyonel futbol kulüplerinin taraftarlarıdır. Araştırmaya 397 katılımcı gönüllü olarak katılmıştır. Veriler, spor kulüplerinin taraftar gruplarının sosyal medya hesapları aracılığıyla web tabanlı olarak toplanmıştır. Geliştirilen ölçme aracına açıklayıcı ve doğrulayıcı faktör analizleri yapılmış ve uyum iyiliği indekslerine uygun değerler elde edilmiş, geliştirilen ölçeğin geçerlilik ölçütlerine uygunluğu tespit edilmiştir. Ölçme aracının iç tutarlık katsayısı α=,873 tespit edilerek ölçme aracının güvenilir olduğu ve alt boyutlarında hedeflenen özellikleri ölçtüğü ve geçerli olduğu sonucuna ulaşılmıştır. “Video Yardımcı Hakem Sistemi Taraftar Tutum Ölçeği” adı verilen ölçme aracı 9 ifadeli 7’li likert tipi ile hazırlanmış, futbola katkı, oyun yönetimi ve yarışma baskısı adı verilen 3 alt boyuttan oluşmaktadır. Araştırma sonucunda VAR sitemine karşı taraftar tutumlarını ölçmek amacıyla kullanılabilir, geçerli ve güvenilir bir ölçek oluşturulmuştur.
Book
Full-text available
There have been many fundamental change in the world, where globalization has taken place rapidly in recent times. As a result of the changes, trade borders between countries are eliminated, resulting in challenging competitive conditions. In this regard, businesses need to identify and implement various innovation and competition-oriented strategies to adapt to challenging competitive conditions. Businesses need to support intrapreneurship activities to be able to implement such strategies. It is thought that intrapreneurship characteristics such as risk-taking, innovation and proactiveness can support businesses' innovation activities and organisational innovation cultures. The aim of this study is to investigate the effects of intrapreneurship of enterprises operating on innovation and organizational innovation cultures in the logistics sector. The sample of this study consists of logistics sector employees. In this context, a questionnaire was applied to logistics sector employees. A total of 321 questionnaires were obtained. Multiple linear regression analysis was used to analyze the relationship between the obtained data and the variables. According to the results of the analysis, it has been determined that the risk-taking dimension has a significant effect on the dimensions of firm innovativeness, shared view, open-mindedness, technological innovation orientation, learning orientation, willingness to take risks and future market orientation. It was determined that the proactivity dimension had a significant effect on the dimensions of internal knowledge sharing, learning orientation, willingness to take risks, and future market orientation. It has been concluded that the innovation dimension has a positive and significant effect on the dimensions of firm innovation, commitment to learning, shared opinion, open-mindedness, internal knowledge sharing, technological innovation orientation, learning orientation, willingness to take risks and future market orientation.
Thesis
Full-text available
Bu araştırmada Hukuk ve Adalet dersi ile alakalı öğrenci ve öğretmenlerinin görüş ve değerlendirmelerinin nasıl ve ne şekilde olduğunu anlamaya yönelik olarak gerçekleştirilmiştir. Özellikle son 20 yıl içerisinde çok fazla göç alması ve buna bağlı çocuk yaş grubu nüfusun fazla olması gibi nedenlerden dolayı da araştırma sahası olarak Sultanbeyli ilçesinde yer alan ortaokullar seçilmiştir. Bu kapsamda araştırmacı tarafından öğrencilere yönelik Hukuk ve Adalet Dersinin İçeriği ve Yapısı Anketi (İYA) ile Hukuk ve Adalet Dersinin Teorik Bilgi ve Kazanım Anketi (TBKA) geliştirilmiştir. Her iki anket uzman görüşleri doğrultusunda Kapsam Geçerlilik İndeksi (KGİ) aşamalarından geçirilerek anketlere ait Hukuk ve Adalet dersi algısı, Hukuk ve Adalet dersine ilişkin uygulama ve davranış, Hukuk ve Adalet dersinin içeriğine ilişkin tutum, Hukuk ve Adalet dersine ilişkin teorik bilgi ve Hukuk ve Adalet dersinin yapısı ve işlenişi hakkında tutumları alt boyutları geliştirilmiştir. Söz konusu alt boyutlar cinsiyet, okul türü, sınıf, aylık gelir, anne eğitim, baba eğitim, göç nedeni, ders kaynağı değişkenleri açısından incelenmiştir. Öğrencilere anket yargıları içerisinde tam olarak ifade edemedikleri durumlar için de açık uçlu sorular da yöneltilmiş ve bu çerçevede nitel veriler elde edilmiştir. Öğretmenlerden de yarı-yapılandırılmış görüşme formu soruları ile Hukuk ve Adalet dersi ile ilgili görüş ve değerlendirmeleri elde edilmiştir. Nitel verilerin analizi aşamasında NVivo programından yararlanılmış ve betimsel yöntemle tematik kodlar oluşturularak kategorize edilmiştir. Daha sonra karma analiz yöntemi kapsamında nitel ve nicel veriler birlikte kullanılmış ve sonuçlar kısmında birleştirilmiştir. Nicel analiz verileri deneysel olmayan betimsel ilişkisel araştırma modeli ile desenlenmiştir. Nicel analiz verilerinde SPSS 26 programından yararlanılarak frekans, yüzde, ortalama, standart sapma, t-Testi ve ANOVA testi kullanılmıştır. Nicel analiz sonuçlarına göre öğrencilerin; Hukuk ve Adalet dersine ve hukuka yönelik algıları ile cinsiyet, aile aylık gelir düzeyi, anne ve baba eğitim düzeyi, aile göç durumu ve göç nedeni ve ders kaynağı değişkeni değişkenleri arasındaki farkın anlamlı olmadığı tespit edilmiştir. Buna karşın öğrencilerin Hukuk ve Adalet dersine ve hukuka yönelik algıları ile okul türü değişkenleri ve sınıf düzeyi değişkenleri arasında anlamlı fark olduğu tespit edilmiştir. Öğrencilerin, Hukuk ve Adalet dersine ilişkin uygulama ve davranış düzeyleri ile okul türü değişkenleri, sınıf düzeyi değişkenleri, baba eğitim düzeyi ve aile göç durumu ve göç nedeni değişkenleri arasındaki farkın anlamlı olmadığı tespit edilmiştir. Buna karşın öğrencilerin Hukuk ve Adalet dersine ilişkin uygulama ve davranış IX düzeyleri ile cinsiyet değişkenleri, aile gelir düzeyi değişkenleri, anne eğitim değişkeni ve ders kaynağı değişkenleri arasında anlamlı fark olduğu tespit edilmiştir. Nitel ve nicel analiz sonuçlarının karşılaştırmasına göre; öğretmenler, öğrencilerin Hukuk ve Adalet dersini seçmelerinde hukuk sistemini ve hukuki terimleri anlamak istemeleri, hukuk ve devlet ilişkisi hakkında bilgi sahibi olmak istemeleri, güncel hukuki sorunları ve adaletsizlikler hakkında yorum yapabilecek kadar hukuki bilgiye sahip olmak istemelerinin etkili olduğunu belirtmiştir. Öğretmenler ve öğrenciler Hukuk ve Adalet dersinin haftada iki saat olması gerektiğini belirtmişlerdir. Öğretmenler Hukuk ve Adalet ders kitabındaki soruların anlaşılırlık düzeyinin öğrenci seviyesine uygunluğu ile ilgili olarak düzeyin öğrenciler için gayet uygun, açık ve anlaşılır olduğunu belirtmiştir. Öğrenciler de ders kitabındaki ya da e-kitaptaki bilgilerin açık, sade ve anlaşılır bir dille yazılmış olduğunu belirtmişlerdir. Öğretmenler, Hukuk ve Adalet dersi işlenirken öğrencilerin zorlandığı ya da açıklayamadığı konular ile ilgili olarak yarıya yakını öğrencilerin açıklayamadığı herhangi bir konunun olmadığını belirtmişlerdir. Öğrencilerin de yarı yarıya yakını da Hukuk ve Adalet dersinde anlamını bilmediği çok kelime bulunmakta şeklinde değerlendirmelerde bulunmuşlardır. Öğretmenler Hukuk ve Adalet dersinin sonunda öğrencilerin özsaygı ve hak arayışlarına etkisi konusunda öğrencilerin özsaygı ve hak arayışlarında olumlu yönde gelişmeler yaşandığını, öğrencilerde hak ihlali durumunda neler yapacakları ile ilgili farkındalık ve beceri oluştuğunu ve öğrencilerin çevrelerine karşı daha adil ve duyarlı hareket etmeye başladıklarını belirtmişlerdir. Öğrenciler de haklarının çiğnendiğinde mahkemelerin işe yaradığını bildiklerini ve Hukuk ve Adalet dersini aldıktan sonra arkadaşlarının ve çevresindekilerin haklarına saygı duymaya başladıklarını ayrıca tüm insanların hiçbir ayrım gözetmeksizin eşit ve özgür yaşama hakkına sahip olduklarını savunmaya başladıklarını belirtmişlerdir. Genel olarak ele alındığında Hukuk ve Adalet dersinin öğrenci ve öğretmenler tarafından benimsenen ve kabul edilen bir ders olduğu ve öğrencilerin de bu ders sayesinde hukuki yollardan hak arama ve sorumluklarını bilme ile ilgili öğrenmeye yatkın oldukları anlaşılmaktadır.
Article
Full-text available
z Milli eğitim bakanlığı çağın insanının ihtiyacı olan problem çözme becerisinin öğrencilere kazandırılmasına büyük önem vermektedir. Bu çalışmanın amacı da, öğretmen problem çözme becerisi kazandırma yeterliğini ölçen geçerli ve güvenilir bir ölçme aracı geliştirmektir. Bu amaç doğrultusunda ölçeğe ilk olarak açımlayıcı faktör analizi uygulanmıştır. Daha sonra doğrulayıcı faktör analizi ile modelin uygunluğu test edilmiştir. Açımlayıcı faktör analizine göre ölçek, 17 madde ve 3 faktörlü yapı göstermiştir. Ölçeğin toplamda açıkladığı varyans %59.819'dur. Ölçeğin Crombach Alfa iç tutarlık katsayısı ise 0.91'dir. Çalışmada Sivas ili ve ilçelerinde görev yapan öğretmenlerden veri toplanmıştır. Açımlayıcı faktör analizi ve güvenilirlik analizi için 203, doğrulayıcı faktör analizi için 256 öğretmene ulaşılmıştır. Çalışma sonucunda ortaya çıkan modelin uyum indeksleri x2/sd=1.508, RMSEA=.045, RMR=.029, SRMR=.046, GFI=.930, AGFI=.904, CFI=.970, TLI=.963, IFI=.970 şeklindedir. Tüm faktörler istatistiksel olarak anlamlı bulunmuş, uyum indeksleri sonucunda elde edilen modelin iyi bir uyuma sahip olduğu ortaya konulmuştur.
Book
Full-text available
‘A dictionary of research methodology and statistics in applied linguistics’ is a reference guide which offers an authoritative and comprehensive overview of key terms and concepts in the areas of research and statistics as concerns the field of applied linguistics. The volume is in-tended as a resource to delineate the meaning and use of various concepts, approaches, methods, designs, techniques, tools, types, and processes of applied linguistics research in an efficient and accessible style. Some entries relating to statistical aspects of research are also used so as to help the researcher in the successful formulation, analysis, and execution of the research design and carry the same towards its logical end. This book makes use of approximately 2000 entries on the key concepts and issues of research with cross references where necessary. Cross-referencing is achieved in several ways. Within the text, there are terms which have their own alphabetical entries and are printed in SMALL CAP-ITAL LETTERS. There are also in-text entries that are defined within the body of the paragraph and are printed in bold letters. Other entries that are related to the term at issue that might be of interest and further investigation are either provided in the main text or listed at the end of each entry under ‘see’ and ‘see also’ respectively. This volume is designed to appeal to undergraduate and graduate students, teachers, lecturers, practitioners, researchers, consultants, and consumers of information across the field of applied linguistics and other related disciplines. I hope that this dictionary succeeds in fulfilling its intent as a resource that can convey essential information about research issues, practices, and procedures across the whole gamut of the applied linguistics. I would very much welcome reactions and comments from readers, especially relating to points where I may have lapsed or strayed from ac-curacy of meaning, consistency of style, etc., in the interests of improving coverage and treatment for future editions.
Article
Full-text available
Response styles are a source of contamination in questionnaire ratings, and therefore they threaten the validity of conclusions drawn from marketing research data. In this article, the authors examine five forms of stylistic responding (acquiescence and disacquiescence response styles, extreme response style/response range, midpoint responding, and noncontingent responding) and discuss their biasing effects on scale scores and correlations between scales. Using data from large, representative samples of consumers from 11 countries of the European Union, the authors find systematic effects of response styles on scale scores as a function of two scale characteristics (the proportion of reverse-scored items and the extent of deviation of the scale mean from the midpoint of the response scale) and show that correlations between scales can be biased upward or downward depending on the correlation between the response style components. In combination with the apparent lack of concern with response styles evidenced in a secondary analysis of commonly used marketing scales, these findings suggest that marketing researchers should pay greater attention to the phenomenon of stylistic responding when constructing and using measurement instruments.
Article
Full-text available
Likert questionnaires are widely used in survey research, but it is unclear whether the item data should be investigated by means of parametric or nonparametric procedures. This study compared the Type I and II error rates of the t test versus the Mann-Whitney-Wilcoxon (MWW) for five-point Likert items. Fourteen population distributions were defined and pairs of samples were drawn from the populations and submitted to the t test and the t test on ranks, which yields the same results as MWW. The results showed that the two tests had equivalent power for most of the pairs. MWW had a power advantage when one of the samples was drawn from a skewed or peaked distribution. Strong power differences between the t test and MWW occurred when one of the samples was drawn from a multimodal distribution. Notably, the Type I error rate of both methods was never more than 3% above the nominal rate of 5%, even not when sample sizes were highly unequal. In conclusion, for five-point Likert items, the t test and MWW generally have similar power, and researchers do not have to worry about finding a difference whilst there is none in the population. Likert scales are widely used in various domains such as behavioral sciences, healthcare, marketing, and usability research. When responding to a Likert scale, participants specify their level of agreement to statements with typically five or seven ordered response levels. Likert item data have distinct characteristics: discrete instead of continuous values, tied numbers, and restricted range.
Chapter
The SERVQUAL survey instrument is one of the most widely utilised techniques for deriving a measure of the quality of service industries (Parasuraman, Zeithaml and Berry, 1985, 1988; Zeithaml, Parasuraman and Berry, 1990). It has been extensively used, principally in the USA, for obtaining quantitative measures of consumer satisfaction. The instrument invites consumers to indicate the extent to which they agree with a series of statements which are designed to measure those elements of a service which consumers would expect as ideal (the Expectations score) and then those elements of a service that they have recently experienced (the Perceptions score) Satisfaction is then measured as the simple arithmetic ‘gap’ between Perceptions and Expectations (S=P-E). The scale is a composite of five dimensions (Tangibles, Reliability, Responsiveness, Assurance and Empathy). These dimensions will differ in salience as between different industries. In addition, consumers may place a higher value on some of these dimensions rather than others — for example, empathy might be more important in a hospital clinic but reliability in a bank. Respondents are also asked to indicate the importance of the relative weighting of the dimensions by allocating them a series of points which total to 100. In this way, it is possible for individual respondents to give much more weight to certain facets of the services under consideration than to others. A SERVQUAL score for each dimension can then be computed for each respondent by averaging the ‘gap’ scores for the questions relating to that dimension. It is then possible to produce a total weighted score for each customer by applying the weights that the customer attaches to each dimension.
Article
This article provides information for Extension professionals on the correct analysis of Likert data. The analyses of Likert-type and Likert scale data require unique data analysis procedures, and as a result, misuses and/or mistakes often occur. This article discusses the differences between Likert-type and Likert scale data and provides recommendations for descriptive statistics to be used during the analysis. Once a researcher understands the difference between Likert-type and Likert scale data, the decision on appropriate statistical procedures will be apparent.
Article
Using individual (not summated) Likert-type items (questions) as measurement tools is common in agricultural education research. The Journal of Agricultural Education published 188 research articles in Volumes 27 through 32. Responses to individual Likert-type items on measurement instruments were analyzed in 95, or more than half, of these articles. After reviewing the articles analyzing individual Likert-type items, 5 1 (54%) reported only descriptive statistics (e.g., means, standard deviations, frequencies/percentages by category). Paired Likert-type items or sets of items were compared using nonparametric statistical techniques (e.g., chi-square homogeneity tests, Mann-Whitney-Wilcoxon U tests, Kruskal-Wallis analysis of variance tests) in 12 (13%) of the articles. Means for paired Likert-type items were compared using parametric statistical procedures (e.g. t-tests or analysis of variance F-tests) in 32 (34%) of the articles. These data are introduced to illustrate that a variety of statistical methods are being used to analyze data from individual Likert-type items in the Journal of Agricultural Education. Which are most appropriate. ? On what bases should we make our choice of methods? This paper explores these questions. Likert Scales and Likert-Type Items Likert (1932) proposed a summated scale for the assessment of survey respondent's attitudes. Individual items in Likert's sample scale had five response alternatives: Strongly approve, Approve, Undecided, Disapprove, and Strongly disapprove. Likert noted that descriptors could be anything --it is not necessary to have negative and positive responses. He implies that the number of alternatives is also open to manipulation. Indeed, we see contemporary work using many classifications besides the traditional five point classifications; some researchers use an even number of categories, deleting the neutral response. The 95 articles analyzing individual Likert-type items in Volumes 27 through 32 of the Journal of Agricultural Education used response alternatives ranging from three to eight (or more) points (Table 1).
Article
Likert attitude data consist of responses to favorable and unfavorable statements about an entity, where responses fall into ordered categories ranging from disagreement to agreement. Social science and marketing researchers frequently use data of this type to measure attitudes toward an entity such as a policy or product. We focus on data on American and British attitudes toward their respective nations ("national pride"). We introduce a multidimensional unfolding model (MUM) to describe the relationship between the data and the attitudes underlying them. Unlike most existing models, the MUM allows the data to reflect not just attitudes, but also response style, which is defined as a consistent and content-independent pattern of response category selection such as a tendency to agree with all statements. The MUM can be used to model multiple attitudes, which allows researchers to expand their analysis of the data of interest to include all available Likert data so as to increase information on response style. For example, we include additional data on immigration attitudes to help distinguish the effects of response style and national pride on our data. The MUM can be used to fit linear models for the effects of background variables on attitudes. Resulting inferences about attitudes are adjusted for response style and should be less biased. Simulation results strongly suggest that, unlike Likert's popular scoring model, the MUM yields unbiased inferences even when there are unequal proportions of favorable and unfavorable statements.
Article
The paper argues that the use of non-response options in questionnaires relating to attitudinal research offers various advantages. First, if non-random patterns of response on individual items within a questionnaire occur, such patterns may hold valuable information for the researcher. Second, the provision of the non-response option may mean that any resultant analysis is based upon a sample with appropriate knowledge or opinions, thereby aiding discrimination. To support this view, various pieces of past research by the authors are presented where patterns of non-response are analysed. In each case it was found that the existence of the non-response option offered some new insight. Such insights could help to improve subsequent questionnaires, if used at the pilot study stage, or illustrate specific aspects of a sample’s attitudes – for example, in one case, about uncertainty over a council’s tourism policies.
Article
The purpose of this study was to compare how students in Grades 3 to 6 respond to a mathematics attitudes instrument with a 4-point Likert-type scale compared with one with an additional neutral point (a 5-point Likert-type scale). The 606 participating students from six elementary and middle schools randomly received either the 4-point or 5-point format of the Math and Me Survey. Regardless of whether a neutral midpoint was offered or not, the structure of the instrument was virtually the same, with equal intercepts, means, variances and covariances, pattern coefficients, and nearly all residuals. The 5-point scale is preferred with this population because with this format the reliability estimate for the Mathematical Self-Perceptions subscale was higher (p = .049), and the pattern coefficients were stronger. Additionally, this format provided less model misfit than the 4-point format. Based on these findings, the authors recommend administration of the Math and Me Survey in the 5-point format. These findings also indicate that despite what some educators and educational experts believe, children in Grades 3 to 6 are capable of discriminating among five response options and do not tend toward the neutral point more so than with a 4-point scale.