Conference PaperPDF Available

Öğrenci Seçme Sınavında (ÖSS) Öğrenci Başarımını Etkileyen Faktörlerin Veri Madenciliği Yöntemleriyle Tespiti

Authors:

Abstract

As is known, in our country, Student Selection Exam (ÖSS) is applied by Student Selection and Placement Center (ÖSYM) in every June. Over one and half million students take this exam every year. According to the results of this examination, the students who are possible to attend both the universities in Turkey and the other countries are determined. Data mining is the period of revealing the explicit or hidden patterns in huge amount of data via artificial intelligence, statistics or machine learning techniques. In this study, classification and clustering methods applied to the ÖSS student poll data that is collected in OSYM's legal web site in 2008 and the factors that affect success of students are determined. 1. Giriş Ülkemizde her yil ÖSYM'nin (Öğrenci Seçme ve Yerleştirme Merkezi) düzenlediği Öğrenci Seçme Sinavi'na bir buçuk milyondan fazla öğrenci katilmaktadir. Ülkemizde yapilan bu sinavin amaci, öğrencileri bir üst eğitim basamağina seçmekle birlikte, öğrencilerin okul müfredatinda yer alan üst düzey düşünme süreçlerine göre öğrencilerin değerlendirmesini yapmaktir. Bu kapsamda ele alindiğinda, ÖSS'nin bu sinava giren öğrenciler için büyük bir öneme sahip olduğu görülebilir. Öğrencilerin sinavlarda ya da derslerde başarili olmasinin sağlanmasi ancak başariyi etkileyen faktörlerin belirlenmesi ile mümkündür. Bu nedenle öğrencilerin ÖSS'deki başarisini etkileyen faktörlerin belirlenmesi bu sinavdan elde edilecek başarinin artmasinda önemli rol oynayacaktir.
5. Uluslararası İleri Teknolojiler Sempozyumu (IATS’09), 13-15 Mayıs 2009, Karabük, Türkiye
ÖĞRENCİ SEÇME SINAVINDA (ÖSS) ÖĞRENCİ BAŞARIMINI ETKİLEYEN
FAKTÖRLERİN VERİ MADENCİLİĞİ YÖNTEMLERİYLE TESPİTİ
DETERMINATION OF THE FACTORS INFLUENCING STUDENT’S
SUCCESS IN STUDENT SELECTION EXAMINATION (OSS) VIA DATA
MINING TECHNIQUES
Ahmet Selman Bozkır a, *, Ebru Sezer a ve Bilge GÖK b
a Hacettepe Üniversitesi Bilgisayar Mühendisliği Bölümü, Ankara, Türkiye, E-posta: {selman,esezer}@cs.hacettepe.edu.tr
b Hacettepe Üniversitesi Sınıf Öğretmenliği Bölümü, Ankara, Türkiye, E-posta: bilgeb@hacettepe.edu.tr
Özet
Bilindiği üzere ülkemizde Öğrenci Seçme Sınavı her yıl
Haziran ayında ÖSYM tarafından yapılmaktadır. Bu sınava
her yıl bir buçuk milyonun üzerinde öğrenci girmektedir.
Sınav sonucuna göre, Türkiye’de ve yabancı ülkelerde yer
alan üniversitelere girecek olan öğrenciler tespit
edilmektedir.
Veri madenciliği, büyük miktarda veri içinde yer alan gizli
ya da açık örüntülerin yapay zekâ, istatistik ve makine
öğrenmesi gibi yöntembilimler yardımıyla ortaya
çıkarılması sürecidir.
Bu çalışmada ÖSYM’nin resmi internet sitesinde 2008
yılında uygulanmış olan ÖSS öğrenci anketinden elde
edilen veriler üzerinde sınıflandırma ve kümeleme
yöntemleri uygulanmış ve öğrencilerin ÖSS sınavında
gösterdikleri başarıyı etkiyen faktörler tespit edilmiştir.
Anahtar kelimeler: Veri Madenciliği, ÖSS, Sınıflandırma,
Kümeleme, Karar Ağaçları
Abstract
As is known, in our country, Student Selection Exam
(ÖSS) is applied by Student Selection and Placement
Center (ÖSYM) in every June. Over one and half million
students take this exam every year. According to the
results of this examination, the students who are possible
to attend both the universities in Turkey and the other
countries are determined.
Data mining is the period of revealing the explicit or hidden
patterns in huge amount of data via artificial intelligence,
statistics or machine learning techniques.
In this study, classification and clustering methods applied
to the ÖSS student poll data that is collected in OSYM’s
legal web site in 2008 and the factors that affect success
of students are determined.
Keywords: Data Mining, OSS, Classification, Clustering,
Decision Trees
1. Giriş
Ülkemizde her yıl ÖSYM’nin (Öğrenci Seçme ve
Yerleştirme Merkezi) düzenlediği Öğrenci Seçme Sınavı’na
bir buçuk milyondan fazla öğrenci katılmaktadır. Ülkemizde
yapılan bu sınavın amacı, öğrencileri bir üst eğitim
basamağına seçmekle birlikte, öğrencilerin okul
müfredatında yer alan üst düzey düşünme süreçlerine göre
öğrencilerin değerlendirmesini yapmaktır. Bu kapsamda
ele alındığında, ÖSS’nin bu sınava giren öğrenciler için
büyük bir öneme sahip olduğu görülebilir. Öğrencilerin
sınavlarda ya da derslerde başarılı olmasının sağlanması
ancak başarıyı etkileyen faktörlerin belirlenmesi ile
mümkündür. Bu nedenle öğrencilerin ÖSS’deki başarısını
etkileyen faktörlerin belirlenmesi bu sınavdan elde edilecek
başarının artmasında önemli rol oynayacaktır.
ÖSYM, 2008 yılı ÖSS sınav döneminde sınava giren
öğrencilerin katıldığı bir anketi resmi internet sitesi
üzerinden düzenlemiştir. Bu ankette öğrencilerin sosyal
durumları, eğitim hayatları ve ebeveynlerinin eğitim
durumları gibi birçok alanda yaklaşık 80 adet soru
sorulmuştur.
Çalışmada kullanılan temel veri kümesi, ankete katılım
göstermekle birlikte 2008 yılında sınavına girmiş olan
10.000 öğrenciyi kapsamaktadır. Başlangıçtaki veri
kümesine, sınav başarısını etkiyen faktörlerin tespiti için,
yine bu öğrencilere ait OBP (orta öğretim başarı puanı),
AOBPSAYISAL, AOBPEA, AOBPSOZEL gibi ağırlıklı orta
öğretim başarı puanları ile birlikte diğer birçok puan türüne
ait veriler eklenerek sonuç veri kümesi elde edilmiştir.
Bu çalışmanın amacı elde edilen bilgiler doğrultusunda,
ÖSS’de başarıyı temsil etmekte kullanılan sözel, sayısal,
eşit ağırlık puanları ve bu puan türlerinde Türkiye’deki
başarı sıralarıyla birlikte OBP ve AOBP türlerindeki puanlar
gibi bazı sonuçları etkileyen en önemli faktörleri bulmaktır.
Bununla birlikte Matematik, Fen, Sosyal Bilgiler, Türkçe ve
Sanat derslerine gösterilen ilginin, bu derslerde öğrencinin
kendini başarılı görme derecesinin ve bu dersler için
ayrılan ödev zamanının üstte belirtilen sonuçlar üzerindeki
etkileri araştırılmıştır. Araştırma sonucunda oldukça
çarpıcı bağıntılar yakalandığışünülmektedir.
Bildiride veri madenciliği kavramı ele alınarak çalışmada
kullanılan veri madenciliği yöntemleri bölüm 2’de
sunulmuş, bölüm 3’te konuyla ilgili benzer çalışmalardan
söz edilmiş ve bölüm 4’te çalışmada yer alan analizlerin
oluşturulma süreci ve elde edilen sonuçları verilmiştir.
© IATS’09, Karabük Üniversitesi, Karabük, Türkiye
Bozkır, A.S., Sezer, E. ve Gök, B.
2. Veri Madenciliği
Veri madenciliği, yararlı bilginin büyük veri depolarından
otomatik olarak keşfedilme sürecidir [1]. Diğer bir deyişle,
veri madenciliği tek başına bir şey ifade etmeyen veriler
içindeki gizli örüntüleri ve ilişkileri ortaya çıkarmak için
istatistik, yapay zekâ ve makine öğrenmesi gibi
yöntemlerin ileri veri çözümleme araçlarıyla kullanılmasını
kapsayan süreçler topluluğudur [2]. Veri madenciliği
yöntemleri iki grupta toplanmaktadır:
1. Kestirimsel yöntemler (karar ağaçları, regresyon,
destek vektör makineleri vs.)
2. Tanımlayıcı yöntemler (kümeleme, birliktelik
kuralları vs.)
Kestirimsel modellerde amaç mevcut verileri kullanarak
geleceğe yönelik kestirimler yapabilmek iken, tanımlayıcı
modellerde amaç yine mevcut veri içindeki gizli ilişkileri,
kümeleri ve veriyi niteleyebilecek olan özellikleri ortaya
çıkarmaktır [2].
Bu araştırmada her iki yöntem grubundan da
yararlanılmıştır. Öğrenci başarımını temsil eden niteliklerin
(Ör: ÖSSSAYISAL2 puanı) tahmininde karar ağaçları
tekniğinden yararlanılırken, çeşitli öğrenci profillerinin
oluşturulmasında kümeleme yöntemi kullanılmıştır.
Çalışmanın yapıldığı uygulama platformu olarak aşağıda
belirtilen bazı özellikleri nedeniyle Microsoft’un bir ürünü
olan Analysis Services 2008 seçilmiştir.
2.1. Karar Ağaçları
Karar ağaçları, başarım oranının yüksekliği yanında kolay
anlaşılır bir grafiksel yorumu olması sebebiyle en çok
tercih edilen kestirimsel yöntemdir. Bir karar ağacı için en
genel veri madenciliği görevi sınıflandırmadır [3].
Bir karar ağacı algoritmasının prensipte görevi veriyi
özyinelemeli olarak alt veri gruplarına dallanma yaparak
bölmektir. Bu ayrım aşamasında oluşan her yeni dal bir
kuralı ifade etmektedir.
Karar ağacı algoritmaları içinde ID3, C4.5, C5.0, M5P, J48,
Microsoft Decision Trees algoritmaları sıklıkla kullanılan
algoritmalardır. İyi bir karar ağacı algoritması hem ayrık
hem de sürekli veriler üzerinde çalışabilmelidir. Sürekli veri
üzerinde oluşturulan modellere regresyon ağacı adı
verilmektedir.
Niteliklerin birbirleri üzerindeki etkilerini sergileyen
bağımlılık ağları grafiğini üretebilme özelliğinden dolayı
Microsoft Decision Trees algoritması tercih edilmiştir.
2.2. Kümeleme
Kümeleme en basit deyişle, veri içindeki doğal grupların
keşfedilmesi işlemidir. İnsanoğlu için beş ya da altı niteliğe
sahip bir nesneler topluluğunu, niteliklerdeki benzerliklere
bakarak gruplamak mümkünken bu sayının çok daha fazla
olması durumunda bu işlem olanaksız hale gelmektedir.
Bu noktada tanımlayıcı bir veri madenciliği yöntemi olan
kümeleme devreye girmekte ve veriyi çeşitli tekniklerle
önceden sayısı bilinmeyen kümelere bölmektedir.
Bu çalışmada yine Analysis Services 2008 ürünü ile birlikte
gelen Expectation Maximization (EM) algoritması
kullanılmıştır.
3. Önceki Çalışmalar
Bir çalışmada veri madenciliği yöntemleri ÖSS verilerine
uygulanarak Türkiye ve İzmir genelinde çeşitli istatistik
sonuçlar ortaya konmuştur [4]. Diğer bir çalışmada ise
ÖSS verilerine karar ağaçları ve birliktelik kuralları
yöntemleri uygulanarak öğrencilerin tercih profilleri ortaya
konulmaya çalışılmıştır [5]. Yine başka bir çalışmada ÖSS
sonuçları yıllara, bölgelere ve okul türlerine göre
incelenmiştir [6].
4.Uygulama
Çalışmanın özünü oluşturan veri kümesi daha önceki
bölümlerde de verildiği üzere ÖSYM’nin internet sitesinde
2008 ÖSS dönemine ilişkin yayınlanmış olan öğrenci bilgi
anketini temel almaktadır. Bu anket içersinde yer alan
birçok soru içersinden çalışmanın amacına yönelik olarak
öğrencilerin Matematik, Türkçe, Fen Bilgisi, Sosyal Bilgiler,
Yabancı Dil ve Sanat derslerine olan ilgileri ve bu derslere
ayırdıkları ödev süreleri ile yine bu derslerde kendilerini ne
kadar başarılı buldukları gibi sorular seçilmiştir. Buna ek
olarak cinsiyet, yaş, alan belirleme, sınıf mevcudu,
ebeveynlerin eğitim düzeyi, kardeş sayısı, internet ve
bilgisayar erişimi, gazete alımı, lise döneminde alınan özel
ders ve dershane durumu vs. gibi diğer sosyal bilgileri
içeren sorular da seçilmiştir.
Ankette yer alan toplam 80 adet soru öğrencilerin okulda
aldıkları eğitimle ilgili durumları ve sosyal durumlarını
araştırmaya yönelik dereceleme sorularından
oluşmaktadır. Çalışmanın ilk aşamasında konuyla
yakından ilgisi bulunmayan veya sıklıkla boş cevap içeren
sorular veri kümesinden çıkarılmıştır. Çalışmanın amacı
ÖSS başarımını etkileyen faktörleri tespit etmek
olduğundan, bu noktada öğrencinin başarı ölçütü olarak
kabul edilen sınavda yerleşme durumu, türlerine göre ÖSS
puanları ve başarı sırası, OBP, AOBPSAYISAL,
AOBPSÖZEL ile AOBPEA puanları veri kümesine
eklenmiştir. Bu eklemelerden sonra sonuç veri kümesi 77
niteliğe sahip olmuştur.
Veriler ÖSYM’den geldikleri ilk biçim olan SPSS kütük
biçiminden, Analysis Services için tanınabilir bir kütük
biçimi olan Microsoft Access kütük biçimine
dönüştürülmüştür. Ayrık veri içeren nitelikler içinde sayısal
olarak kodlanmış veriler gerçek metinsel karşılıklarına
dönüştürülerek anlaşılabilirlik arttırılmıştır.
Veri madenciliği yöntemlerinin uygulanacağı verinin temiz
ve tutarlı olması (boş verinin olmaması, uygunsuz değerleri
içermemesi) uygulamanın başarısıısından çok
önemlidir. Bu nedenle birçok soruyu boş bıraktığı tespit
edilen 48 katılımcı, 10.000 katılımcının bulunduğu veri
kümesinden çıkarılmıştır. Kalan 9952 katılımcıdan 1000
adedi test amaçlı, kalan 8952 adedi ise karar ağacı ve
kümeleme modelinde eğitim amaçlı olarak ayrılmıştır.
Bozkır, A.S., Sezer, E. ve Gök, B.
4.1. Karar Ağacı Modeli Çalışması
Oluşturulan eğitim kümesi üzerinde Microsoft Decision
Trees algoritması varsayılan parametrelerle kullanılarak iki
farklı model oluşturulmuştur.
Birinci modelde, öğrencilerin çeşitli alanlardaki başarı
sıralamasında doğal bir etkiye sahip olması sebebiyle
sayısal, sözel ve eşit ağırlık türündeki puanlar hem girdi
hem de kestirim amaçlı (prediction) kullanılmıştır. İkinci
modelde sayısal, sözel ve eşit ağırlık türündeki puanlar
sadece tahmin amaçlı (prediction only) kullanılarak diğer
nitelikler üzerinde etki oluşturmayacak bir model
oluşturulmuştur. Böyle bir yöntem izlenmesinin başlıca
nedeni öncül-soncul ilişkisi göz önüne alındığında, sayısal,
sözel ve eşit ağırlık puanlarının, OBP veya benzer biçimde
diğer herhangi bir sosyal nitelik üzerinde mantıksal bir
faktör olamayacağı gerçeğidir. Sınav sonuçlandırma
sürecinde, öğrencilerin eğitim hayatları boyunca elde
ettikleri OBP, AOBPSAYISAL, AOBPSÖZEL, AOBPEA
gibi puanlar ve net doğru sayıları girdiyi oluşturmakta ve
nihai puanlar bu girdiler doğrultusunda hesaplanmaktadır.
Veri madenciliği açısından, nihai ÖSS puanlarının hem
girdi hem de tahminsel olarak tanımlandığı bir model,
öğrencilerin başarı sıralamasını etkileyen faktörleri tespit
etmede başarılı sonuçlar üretebilir ancak diğer nitelikler
üzerinde anlamsız sonuçları da beraberinde getirir.
Dolayısıyla doğru bir analiz için ikinci bir karar ağacı
modelinin oluşturulması kaçınılmazdır.
Oluşturulan ikinci karar ağacında sayısal, sözel ve eşit
ağırlık türlerine ait sonuç puanlar sadece kestirim
(prediction only) olarak tanımlanmış, diğer niteliklerde bir
değişiklik yapılmamıştır.
Bağımlılık ağları (Dependency Network), oluşturulan
modelin içeriğinden yola çıkarak nitelikler arasındaki
ilişkileri gösterir [3]. Bu çalışmada da aynı tür ilişkileri
yakalamak için Microsoft Decision Trees algoritması
yardımıyla oluşan bağımlılık ağları ile niteliklerin birbirleri
üzerindeki etkileri tespit edilmiştir.
Şekil 1. Model üzerinde oluşan bağımlılık ağı.
Oluşturulmuş iki farklı karar ağacı modeline ait birleştirilmiş
bulgular Çizelge 1’de listelenmiştir. Çizelgede, çeşitli
niteliklere göre farklı sayıda faktör sunulmuştur.
Niteliklerden bazılarını etkileyen faktör sayısı beşi
geçemezken bazı nitelikler için bu sayı 15’i geçmektedir.
Çizelge 1 Bağımlılık ağı bulguları.
Nitelik Etkileyen Faktörler
OBP 1.AOBPEA (%98)
2.AOBPSAYISAL (%97)
3.AOBPSÖZEL (%95)
4.Yaşı (%94)
5.Okul Türü (82%)
6.İlgi – Sanat Dersleri (%70)
7.Mat. Ödv. Zaman (%61)
8.Fen B. Lab. Kul. (%58)
9.Lisede Sınıf Mevcut (%48)
10.Anne Egt. Düz. (%48)
11.Eve Gazete Alımı (%46)
12.Baş. Bul. Yab. Dil (%45)
13.Baba Egt. Düz. (%44)
14.Baş. Bul.Türkçe (%43)
15.Lisede Dershane (%42)
AOBPSAYISAL 1.Yaşı (%95)
2.AOBPEA (%95)
3.OBP (%94)
4.AOBPSÖZEL (%94)
5.Okul Türü (%85)
6.Fen B. Lab. Kul. (%74)
7.Eve Gazete Alımı (%45)
8.Tepegöz Kullanımı (%43)
9.Lisede Sınıf Mevcut (%41)
10.D.Yön. F.K. İlişki (%40)
AOBPSÖZEL 1.AOBPSAYISAL (%99)
2.Yaşı (%98)
3.OBP (%98)
4.AOBPEA (%98)
5.Okul Türü (%53)
AOBPEA 1.Yaşı (%96)
2.AOBPSÖZEL (%95)
3.OBP (%95)
4.AOBPSAYISAL (%95)
5.Okul Türü (%51)
6.Alan Belirleme (%50)
ÖSSSAY1 1.AOBPSAYISAL (%100)
2.AOBPEA (%99)
3.OBP (%98)
4.AOBPSÖZEL (%96)
5.Yaşı (%95)
6.Baş. Bul. Mat. (%81)
7.Baş. Bul. Fen Bil. (%71)
8.İlgi – Sosyal Bilimler (%60)
9.D.Yön. F.K. İlişki (%60)
10.Alan Belirleme (%56)
ÖSSSAY2 1.AOBPEA (%98)
2.OBP (%98)
3.AOBPSÖZEL (%95)
4.AOBPSAYISAL (%94)
5.Yaşı (%94)
6.Baş. Bul. Mat. (%81)
7.Okul Türü (%79)
8.İlgi – Sosyal Bilimler (%76)
9.Baş. Bul. Yab. Dil (%75)
10.İlgi –Sanat Dersleri (%69)
ÖSSSÖZ1 1.AOBPSÖZEL (%91)
Bozkır, A.S., Sezer, E. ve Gök, B.
2.Yaşı (%91)
3.OBP (%91)
4.AOBPSAYISAL (%90)
5.AOBPEA (%90)
6.Okul Türü (%78)
7.Lisede Dershane (%71)
8.Baş. Bul. Türkçe (%70)
9.İlgi – Sosyal Bilimler (%68)
10.İlgi – Fen Bilimleri (%59)
ÖSSSÖZ2 1.Yaşı (%97)
2.AOBPSAYISAL (%95)
3.OBP (%91)
4.AOBPSÖZEL (%90)
5.AOBPEA (%90)
6.Baş. Bul. Fen Bil. (%81)
7.İlgi – Sanat Dersleri (%80)
8.D.Yön. Det.Anl. Çalış. (%80)
9.Okul Türü (%78)
10.Fen B. Ödv. Zmn. (%76)
ÖSSEA1 1.AOBPSÖZEL (%100)
2.OBP (%99)
3.AOBPSAYISAL (%99)
4.Yaşı (%96)
5.AOBPEA (%94)
6.Lisede Dershane (%81)
7.Okul Türü (%79)
8.Yab. Dil. Lab. Kul. (%65)
9.Baş. Bul. Fen Bil. (%52)
10.Alan Belirleme (%51)
ÖSSEA2 1.AOBPSÖZEL (%90)
2.OBP (%90)
3.AOBPSAYISAL (%90)
4.Yaşı (%89)
5.AOBPEA (%89)
6.Okul Türü (%83)
7.İlgi – Yabancı Dil Ders (%75)
8.Kardeş Sayısı (%71)
9.Baş. Bul. Fen Bil. (%70)
10.Türkçe Ödev Zamanı (%68)
Yerleşme
Durumu
1.ÖSSEA1 (%60)
Yerleştiği
Tercih Sırası
1.ÖSSSAY1 (%89)
2.ÖSSSÖZ2 (%89)
3.ÖSSEA2 (%88)
4.ÖSSSÖZ1 (%87)
5.OBP (%86)
6.AOBPSAYISAL (%84)
7.ÖSSSAY2 (%84)
8.ÖSSEA1 (%80)
9.AOBPEA (%79)
10.AOBPSÖZ (%79)
Başarı Sırası
(SAY1)
1.AOBPEA (%96)
2.ÖSSSAY1 (%94)
3.ÖSSSÖZ1 (%94)
4.ÖSSEA1 (%90)
5.AOBPSAYISAL (%87)
Başarı Sırası
(SAY2)
1.ÖSSSAY1 (%95)
2.ÖSSSAY2 (%94)
3.ÖSSSÖZ1 (%94)
4.ÖSSEA2 (%93)
5.ÖSSEA1 (%92)
Başarı Sırası
(SÖZ1)
1.ÖSSSÖZ1 (%88)
2.AOBPEA (%86)
3.ÖSSSAY2 (%86)
4.OBP (%84)
5.ÖSSEA1 (%80)
Başarı Sırası
(SÖZ2)
1.ÖSSSÖZ1 (%98)
2.ÖSSEA2 (%97)
3.ÖSSSÖZ2 (%91)
4.ÖSSEA1 (%90)
5.ÖSSSAY1 (%89)
Başarı Sırası
(EA1)
1.ÖSSEA1 (%95)
2.ÖSSSÖZ1 (%91)
3.ÖSSSAY1 (%91)
4.ÖSSSÖZ2 (%88)
5.ÖSSSAY2 (%88)
Başarı Sırası
(EA2)
1.AOBPSÖZEL (%95)
2.ÖSSEA1 (%95)
3.ÖSSSAY1 (%95)
4.ÖSSSÖZ1 (%93)
5.AOBPEA (%93)
Alan Belirleme 1.Okul Türü (%77)
2.AOBPEA (%70)
3.Lisede Sınıf Mevcut (%67)
4.Lisede Dershane (%53)
İlgi – Fen
Bilimleri
Dersleri
1.Baş. Bul. Fen Bil. (%85)
2.İlgi – Yabancı Dil Ders (%80)
3.İlgi – Mat. Ders (%75)
Kendini Fen
Bilimleri
Derslerinde
Başarılı Bulma
1.İlgi – Fen Bilimleri (%91)
2.Baş. Bul. Mat. (%76)
3.Baş. Bul. Yab. Dil (%75)
4.İlgi – Yabancı Dil Ders (%45)
Fen Bilimleri
Derslerine
Ayrılan Ödev
Zamanı
1.Mat. Ödv. Zaman (%81)
2.İlgi – Fen Bilimleri (%81)
3.Baş. Bul. Fen Bil. (%80)
4.Sosyal Bil. Ödv. Zmn (%58)
5.Türkçe Ödev Zamanı (%56)
İlgi –
Matematik
Dersleri
1.Baş. Bul. Mat. (%92)
2.İlgi – Fen Bilimleri (%78)
Kendini
Matematik
Derslerinde
Başarılı Bulma
1.İlgi – Mat. Ders (%92)
2.Baş. Bul. Fen Bil. (%78)
3.Baş. Bul. Türkçe Dersi (%59)
4.Baş. Bul. Yab. Dil (%40)
Matematik
Derslerine
Ayrılan Ödev
Zamanı
1.Türkçe Ödev Zamanı (%89)
2.Fen B. Ödv. Zmn. (%76)
3.Baş. Bul. Mat. (%78)
4.Sosyal Bil. Ödv. Zmn (%57)
İlgi – Türkçe
Dersi
1.Baş. Bul. Türkçe (%86)
2.İlgi – Sosyal Bilimler (%78)
3.İlgi – Mat. Ders (%72)
4.Baş. Bul. Sosyal Bil. (%78)
Bozkır, A.S., Sezer, E. ve Gök, B.
Kendini Türkçe
Dersinde
Başarılı Bulma
1.İlgi – Türkçe Dersi (%84)
2.Baş. Bul. Sosyal Bil. (%77)
3.AOBPEA (%72)
4.İlgi – Sosyal Bilimler (%68)
5.Baş. Bul. Yab. Dil (%58)
Türkçe Dersine
Ayrılan Ödev
Zamanı
1.Mat. Ödv. Zaman (%84)
2.Sosyal Bil. Ödv. Zmn (%80)
3.D.Yön. Det.Anl. Çalış. (%45)
İlgi – Sosyal
Bilimler
Dersleri
1.Baş. Bul. Sosyal Bil. (%87)
2.Baş. Bul. Mat. (%78)
3.İlgi – Mat. Ders (%75)
4.İlgi – Türkçe Dersi (%70)
5.Baş. Bul. Türkçe (%45)
Kendini Sosyal
Bilimler
Derslerinde
Başarılı Bulma
1.İlgi – Sosyal Bilimler (%86)
2.Baş. Bul. Türkçe (%76)
3.Baş. Bul. Yab. Dil (%70)
4.İlgi – Türkçe Dersi (%61)
Sosyal Bilimler
Derslerine
Ayrılan Ödev
Zamanı
1.Türkçe Ödev Zamanı (%85)
2.İlgi – Sosyal Bilimler (%70)
3.Fen B. Ödv. Zmn. (%61)
4.Mat. Ödv. Zaman (%57)
5.İlgi – Türkçe Dersi (%46)
İlgi – Yabancı
Dil Dersleri
1.Baş. Bul. Yab. Dil (%86)
2.İlgi – Sanat Dersleri (%77)
3.İlgi – Fen Bilimleri (%61)
Kendini
Yabancı Dil
Derslerinde
Başarılı Bulma
1.İlgi – Yabancı Dil Ders (%87)
2.Baş. Bul. Sanat Ders (%75)
3.Baş. Bul. Türkçe (%65)
4.Baş. Bul. Fen Bil. (%57)
5.Baş. Bul. Mat. (%50)
İlgi – Sanat
Dersleri
1.Baş. Bul. Sanat Ders (%87)
2.İlgi – Yabancı Dil Ders (%79)
Kendini Sanat
Derslerinde
Başarılı Bulma
1.İlgi – Sanat Dersleri (%87)
2.Baş. Bul. Yab. Dil (%76)
3.Baş. Bul. Mat. (%50)
Verilmiş olan çizelgedeki kısaltmaların tam karşılıkları
aşağıdaki Çizelge 2’de sunulmuştur:
Çizelge 2 Bağımlık ağında kullanılan kısaltmalar.
Kısaltma Kısaltmanın Gerçek Karşılığı
OBP Orta Öğretim Başarı Puanı
AOBPSAYISAL Ağırlıklı Orta Öğretim Başarı Puanı
(SAYISAL)
AOBPSÖZEL Ağırlıklı Orta Öğretim Başarı Puanı
(SÖZEL)
AOBPEA Ağırlıklı Orta Öğretim Başarı Puanı
(EŞİT AĞIRLIK)
Mat. Ödv. Zaman Matematik dersleri için ayrılan ödev
zamanı
Fen B. Ödv. Zmn. Fen bilimleri derslerine ayrılan ödev
zaman
Sosyal Bil. Ödv.
Zmn
Sosyal bilimleri derslerine ayrılan
ödev zamanı
Baş. Bul. Mat. Öğrencinin matematik derslerinde
kendini ne derece başarılı bulduğu
Baş. Bul. Fen Bil. Öğrencinin fen bilimleri derslerinde
kendini ne derece başarılı bulduğu
Baş. Bul. Türkçe Öğrencinin Türkçe derslerinde kendini
ne derece başarılı bulduğu
Baş. Bul. Yab. Dil Öğrencinin yabancı dil derslerinde
kendini ne derece başarılı bulduğu
Baş. Bul. Sosyal
Bil.
Öğrencinin sosyal bilimler derslerinde
kendini ne derece başarılı bulduğu
Baş. Bul. Sanat
Ders
Öğrencinin sanat ağırlık derslerde
kendini ne derece başarılı bulduğu
D.Yön. Det.Anl.
Çalış
Ders Çalışma Yöntem: Tüm detayları
anlamaya çalışırım
D.Yön. F.K. İlişki Ders Çalışma Yöntem: Farklı
konularla ilişkilendiririm
Fen B. Lab. Kul. Fen bilimleri derslerinde laboratuar
kullanımı
Anne Egt. Düz. Anne Eğitim Düzeyi
Baba Egt. Düz. Baba Eğitim Düzeyi
Çizelge 1 incelendiğinde tespit edilebilen bulgulardan öne
çıkanlar aşağıda listelenmiştir:
Öğrencilerin herhangi bir derse gösterdikleri ilgi ile
o derste kendilerini başarılı bulmaları arasında
karşılıklı korelasyon bulunmaktadır. Bu kural tüm
dersler için tespit edilmiştir.
Bütün ders türleri için öğrencilerin kendilerini
başarılı görmelerini etkileyen faktörler ele
alındığında yabancı dil derslerinde kendilerini
başarılı bulmaları önemli yer tutmaktadır.
OBP’yi etkileyen faktörler içerisinde sanat
derslerine gösterilen ilginin %70 ve de eve gazete
alımının %46 olması dikkat çekicidir.
OBP, AOBPSAYISAL, AOBPSÖZEL, AOBPEA ve
tüm ÖSS puan türlerine etkiyen faktörler içersinde
öğrencinin yaşı ilk beşte yer almıştır.
ÖSSSÖZ1 ve ÖSSSÖZ2 puan türlerine etkiyen
faktörler içersinde Fen Bilimleri derslerine
gösterilen ilginin (%59) ve ayrılan ödev zamanının
(%76) önemli bir orana sahip olması dikkat
çekicidir.
Sosyal Bilimlere gösterilen ilgiye etkiyen faktörler
içersinde öğrencinin kendini Matematik
derslerinde başarılı bulması %78 ile ikinci sırada,
Matematik derslerine gösterilen ilgi %75 ile
üçüncü sırada yer almıştır.
ÖSSSAYISAL1, ÖSSÖZEL1 ve ÖSSEA1 puanları
üzerine etkiyen faktörler ile sırasıyla
ÖSSSAYISAL2, ÖSSSÖZE2 ve ÖSSEA2
puanları üzerine etkiyen faktörler arasında büyük
benzerlikler vardır.
‘Lisede Dershane’ niteliğinin sadece ÖSSEA1
(%81) ve ÖSSSÖZ1 (%71) puanları üzerinde
etkili olması dikkat çekicidir.
Çizelge 1’de belirtilmiş bulgular üzerinden daha birçok
yorum çıkarmak mümkündür. Ancak çalışmanın sınırlı
sayıda sayfaya sahip olması nedeniyle ilginç olduğu
şünülen daha birçok yorum okuyucuya bırakılmıştır.
4.2. Kümeleme Modeli Çalışması
Kümeleme çalışmasının amacı çeşitli öğrenci profillerinin
ortaya konulması ve oluşan kümeler içerisinde en başarılı
ve başarısız kümelerin genel olarak özelliklerinin
Bozkır, A.S., Sezer, E. ve Gök, B.
karşılaştırılabilineceği bir ortamın yaratılmasıdır.
Şekil 2. Kümeleme modelinde keşfedilen kümeler.
Kümeleme tekniği ile ankete katılan öğrenciler çeşitli
gruplara bölünmüştür. Daha esnek ve başarılı kümeleme
yapması nedeniyle Expectation Maximization
algoritmasının kullanıldığı kümeleme modelinde belli bir
küme sayısı verilmemiş olup algoritmanın otomatik
kümeleme yapması sağlanmıştır.
Analiz sonucunda 7 adet küme tespit edilmiştir. Oluşan
kümeler içerisinde gerek bir yüksek öğretim programına
yerleşme oranı gerekse de diğer birçok nitelik temel
alındığında en başarılı küme, 800 katılımcıya sahip “Küme
6” olarak belirlenmiştir. Yine aynı özellikler dikkate
alındığında, 2072 katılımcıya sahip “Küme 2” en başarısız
küme seçilmiştir. Bunlara ek olarak “Küme 3”, sahip olduğu
1935 katılımcısıyla orta sırada yer alan diğer önemli bir
küme olarak ortaya çıkmaktadır.
Şekil 3. Küme profil grafiği.
Yukarıda belirtilen üç kümenin çeşitli özellikleri ve belirgin
farkları Çizelge 3’de listelenmiştir. Sayısal niteliklerde
temel olarak ortalama ve standart sapmalar belirtilmiştir.
Çizelge 3 Kümeleme sonuçları.
Nitelik Küme 6 Küme 3 Küme 2
OBP 85,86 +/-
8,85
73,91 +/-
11,20
65,99 +/-
8,14
AOBPSayısal 94,44 +/-
3,22
82,03 +/-
8,96
71,46 +/-
6,81
AOBPSözel 95,32 +/-
2,64
85,34 +/-
7,16
76,56 +/-
5,94
AOBPEA 95,36 +/-
2,61
84,39 +/-
7,82
74,45 +/-
6,35
Yerleşme Evet: %87
Hayır: %13
Evet: %65
Hayır: %35
Evet:%50
Hayır:%50
Yaş 18,55 +/-
0,92
19,61 +/-
1,95
21,31 +/-
3,93
Cinsiyet Erkek: %47
Kız: %53
Erkek: %70
Kız: %30
Erkek: %67
Kız: % 33
Okul Öncesi
Eğitim
Hiç: %40
1 yıl: %33
2 yıl: %15
3 yıl: %6
>4 yıl: %4
Hiç: %66
1 yıl: %24
2 yıl: %6
3 yıl: %2
>4 yıl: %1
Hiç: %77
1 yıl: %17
2 yıl: %3
3 yıl: %1
>4 yıl: %0
ÖSSSAY1 249,04 +/-
26,11
219,44 +/-
28,28
155,11 +/-
14,94
ÖSSSAY2 238,19 +/-
29,32
200,38 +/-
29,04
47,43 +/-
70,50
ÖSSSÖZ1 257,37+/-
14,50
211,11 +/-
28,31
196,32 +/-
25,29
ÖSSSÖZ2 94,61 +/-
114,48
0 177,42 +/-
27,59
ÖSSEA1 261,33 +/-
14,81
221,61 +/-
26,65
181,70 +/-
20,42
ÖSSEA2 236,74 +/-
16,92
184,75 +/-
42,35
160,62 +/-
33,45
Okul
Birincisi
Evet: %2
Hayır: %98
Evet: %0
Hayır: %100
Evet: %0
Hayır: %100
Bilgisayar
Erişimi
Var: %93
Yok: %7
Var: %84
Yok: %15
Var: %81
Yok: %17
İnternet
Erişimi
Var: %87
Yok: %13
Var: %73
Yok: %26
Var: %74
Yok: %25
Çalışma
Odası
Var: %96
Yok: %4
Var: %86
Yok: %14
Var: %74
Yok: %24
İlköğretimde
Dershane
Hiç: %15
1 yıl: %33
2 yıl: %31
3 yıl: %9
>4 yıl: %11
Hiç: %44
1 yıl: %28
2 yıl: %16
3 yıl: %6
>4 yıl: %5
Hiç: %74
1 yıl: %15
2 yıl: %6
3 yıl: %2
>4 yıl: %2
İlköğretimde
Özel Ders
Hiç: %74
1 yıl: %19
2 yıl: %3
3 yıl: %2
>4 yıl: %1
Hiç: %82
1 yıl: %10
2 yıl: %3
3 yıl: %1
>4 yıl: %2
Hiç: %84
1 yıl: %9
2 yıl: %3
3 yıl: %1
>4 yıl: %0
Lisede
Dershane
Hiç: %2
1 yıl: %11
2 yıl: %38
Hiç: %17
1 yıl: %24
2 yıl: %34
Hiç: %52
1 yıl: %27
2 yıl: %13
Bozkır, A.S., Sezer, E. ve Gök, B.
3 yıl: %40
>4 yıl: %7
3 yıl: %19
>4 yıl: %6
3 yıl: %5
>4 yıl: %1
Lisede Özel
Ders
Hiç: %65
1 yıl: %21
2 yıl: %10
3 yıl: %4
>4 yıl: %0
Hiç: %76
1 yıl: %13
2 yıl: %6
3 yıl: %3
>4 yıl: %1
Hiç: %83
1 yıl: %10
2 yıl: %4
3 yıl: %1
>4 yıl: %0
Lisede Sınıf
Mevcut
<20: %13
20-30: %75
31-40: %9
41-50: %2
>50: %0
<20: %10
20-30: %46
31-40: %30
41-50: %11
>50: %3
<20: %5
20-30: %29
31-40: %37
41-50: %20
>50: %9
Başarı
Sırası-SAY1
89.924 +/-
94.313
243.707 +/-
227.146
991.693 +/-
282.915
Başarı
Sırası-SAY2
73.375 +/-
72.515
313.460 +/-
395.319
1.337.283
+/- 200.858
Başarı
Sırası-SÖZ1
90.707 +/-
103.714
645.204 +/-
379.756
846.249 +/-
327.731
Başarı
Sırası-SÖZ2
851.427 +/-
639.406
1.380.000 689.051 +/-
458.957
Başarı
Sırası-EA1
61.866 +/-
61.785
414.392 +/-
322.084
933.528 +/-
267.668
Başarı
Sırası-EA2
64.600 +/-
65.650
507.498 +/-
401.745
953.812 +/-
415.927
Kardeş
Sayısı
Hiç: %8
1: %51
2-3: %34
4-6: %5
>7: %0,5
Hiç: %5
1: %35
2-3: %43
4-6: %12
>7: %5
Hiç: %5
1: %28
2-3: %46
4-6: %15
>7: %6
Evde
Yabancı Dil
Bilen
Yetişkin
Var: %47
Yok: %50
Var: %35
Yok: %61
Var: %27
Yok: %61
Kümeleme sonuçları içersinde en başarılı, en başarısız ve
orta sırada yer alan bu üç küme incelendiğinde bazı ortak
çıkarımlar şu şekilde listelenmektedir:
En başarılı kabul edilen “Küme 6”, başarı
sıralamalarında, sonuç puanları ile orta öğretim
başarı puanlarında en yüksek başarı aralığını
yakalamıştır. Tam tersi bir durum Küme 2 için
geçerlidir.
OBP, AOBPSAYISAL, AOBPSÖZEL ve AOBPEA
ile sınav sonucunda elde edilen puanlar arasında
yüksek korelasyon mevcuttur.
Okul öncesi eğitime, ilköğretim ve lisede özel ders
ve dershaneye harcanan zaman yakalanan
başarıyla doğru orantıya sahiptir.
Bilgisayar ve internet erişiminin yakalanan başarı
üzerinde önemli etkisi görülmemiştir.
Kardeş sayısı ve lisedeki sınıf mevcudu ile
yakalanan başarı arasında ters orantı olduğu
saptanmıştır.
5. Sonuç
Bu çalışmada ÖSYM tarafından 2008 ÖSS adayları için
resmi internet sitesi üzerinden yapılan anket verileri
üzerinde veri madenciliği yöntemleri kullanılarak,
öğrencilerin başarılarını etkileyen faktörler araştırılmıştır.
Araştırma kapsamında, OBP puanı tüm öğrencilerin
ÖSS’de ortak başarı ölçütü olarak ele alınırsa bu puan
türüne etkiyen en önemli beş faktörün yaş, okul türü, sanat
derslerine ilgi, matematik dersi için harcanan ödev zamanı
ve fen bilgisi laboratuar kullanım oranı olduğu görülmüştür.
Diğer tüm puan türlerinde de yaşın önemli bir etken olduğu
görülmektedir. Ayrıca okullarda sunulan teknik imkânların
ÖSS başarısı üzerinde önemli etkileri tespit edilmiştir.
Özellikle kümeleme analizinde görüleceği üzere öğrencinin
sahip olduğu sosyal, kültürel ve ekonomik imkânların ÖSS
başarısına büyük katkısı bulunmaktadır. Sanat derslerine
gösterilen ilginin OBP puanı üzerindeki dikkat çekici etkisi
ve dershaneye gitme oranının başarı üzerindeki etkisinin
beklenenden düşük çıkması araştırmanın sonucunda elde
edilen ilginç bulgulardan birkaçıdır.
Bu araştırmada, veri madenciliği yöntemlerinden karar
ağaçları ve kümeleme kullanılmış ve sonuçları
duyurulmuştur. Yine aynı veri üzerinde birliktelik kuralları
(association rules) çıkarsanacak ve sonuçları
duyurulacaktır.
Teşekkür
Çalışmaya konu olan verilerin sahibi ÖSYM’ne içtenlikle
teşekkür edilmektedir.
Kaynaklar
[1] Tan P.T., Steinbach M. And Kumar V., Introduction to
Data Mining. Addison Wesley, Boston, 2006.
[2] Bozkır, A.S., Gök, B., Sezer, E. Üniversite
Öğrencilerinin İnterneti Eğitimsel Amaçlar İçin
Kullanmalarını Etkileyen Faktörlerin Veri Madenciliği
Yöntemleriyle Tespiti, in BUMAT 2008: Bilimde
Modern Yöntemler Sempozyumu, 2008.
[3] Tang Z. and MacLennan J., Data Mining with Sql
Server 2005. Wiley Publishing Inc, Indiana, 2005.
[4] Kılanç, B., Türkiye’nin ÖSS Tercihleri, 1.Psikolojik
Danışman ve Veli Bilgilendirme-Yönlendirme
Sempozyumu, 2008.
[5] Dolgun, M. Ö., Özdemir, T.G., Deliloğlu, S., Öğrenci
Seçme Sınavında (ÖSS) Öğrencilerin Tercih
Profillerinin Veri Madenciliği Yöntemleriyle Tespiti, in
Bilişim” 07 Kongresi, 2007.
[6] Berberoğlu, G. and Kalender, İ., Öğrenci Başarısının
Yıllara, Okul Türlerine, Bölgelere Göre İncelenmesi:
ÖSS ve PISA Analizi, Eğitim Bilimleri ve Uygulama.
vol. 4, 7, 21-35, 2005.
... In this context, it is predicted that the decision tree method, which is one of the data mining methods that does not have many applications in the field of education, is different from other studies that carry out the decision tree method, thanks to this method, it is important for the students who are placed in the teacher biology department to have information about the students in terms of the universities they prefer and will contribute to the field. Finding some of the studies on local university preferences: Bozkır et al. (2009), since they showed what they have done, the information survey obtained from the web address of ÖSYM, the data of the 2008 ÖSS data collected in general, have been analyzed using data mining, and the results such as equal weight, numerical, verbal measurement and comprehensive secondary education success measurement that show success in ÖSS are the best. They aimed to identify important factors. ...
Article
Bu araştırmada 2022 YKS sonuçlarına göre biyoloji öğretmenliği programlarına yerleşen öğrencilerin tercih ettikleri üniversiteler üzerinde etkisi olduğu düşünülen bağımsız değişkenlerden hangilerinin anlamlı bir etkiye sahip olduğu ve bu değişkenlerin önem sırasının belirlenmesi amaçlanmıştır. Bu amaçla Biyoloji Öğretmenliği Yükseköğretim girdi göstergeleri 2022 verileri yokatlas.yok.gov.tr sayfasından indirilmiş ve incelenerek bağımsız değişkenler belirlenmiştir. Sonrasında veri madenciliği yöntemleri ile veriler analiz edilmiştir. Araştırmada veri madenciliği yaklaşımlarından eldeki verilere en uygun olduğu düşünülen C&RT algoritması ile karar ağacı oluşturulmuştur. Çalışmadan elde edilen bulgulara göre biyoloji öğretmenliği programlarına yerleşen öğrencilerin tercih ettikleri üniversiteler açısından tercih etme düzeyini; tavan başarı sırası, Ege bölgesi, üniversitenin bulunduğu şehirde yaşama, lise türü ve cinsiyet belirlemiştir.
... Güner & Çomak (2011) Their study is based on the student survey published on OSYM web site with respect to 2008 University Entrance Exam. The analysis is based on decision trees and clustering models (Bozkir et al., 2009). Another analysis by Kardan et al. (2013) reviews the potential factors which have an impact on students' satisfaction levels with the online courses they had elected. ...
Article
Full-text available
Universities offer technical elective courses to allow students to improve themselves in various parts of their majors. Each semester, the students make a decision regarding these technical electives, and the most common expectations students have in this context include, getting education at a better school, getting a better job, and getting higher grades with a view to securing admission into more advanced degree programs. Electing a course on the basis of the interests and skills of the student will naturally translate into achievement. Advisors, in this context, play a major role. Yet, the substantial workload advisors have already assumed prevent them dedicating enough time for exploring the interests and skills of the students, and hence hinder the development of the required relationship between students and their advisors. This study attempts to estimate the achievement level a student intends to elect, on the basis of graduate data received from the database of students of Sakarya University, Faculty of Computer and Information Sciences, and led to the development of a decision-support system. The application used ANFIS and artificial neural network methods among the artificial intelligence techniques, alongside the linear regression model as the mathematical model, whereupon the performance of the methods were compared over the application. In conclusion, it was observed that artificial intelligence techniques provided more relevant results compared to mathematical models, and that, among the artificial intelligence techniques feed forward backpropagation neural network model offered a lower standard deviation compared to ANFIS model.
Article
Artificial intelligence (AI), which has attracted great attention in recent years, has been widely used in the field of education as in many other fields. AI in education is used to improve student learning, support teachers and provide a more personalized educational experience. AI plays an important role with adaptive learning systems in improving students' learning processes. These systems assess students' individual needs and provide them with appropriate learning materials. AI also monitors students' performance, identifies their weaknesses, and provides additional support in these areas. Thus, students are enabled to learn more effectively and to reveal their full potential. By supporting teachers, AI facilitates classroom management and helps teachers use their time more efficiently. Automated assessment systems allow teachers to quickly assess assignments and exams, while improving the process of providing feedback. In addition, AI also helps teachers understand students' interests and learning styles, so that more personalized instruction can be offered. Another important use of AI in education is student counseling. AI-based counseling systems can guide students in matters such as career choices, university applications, and academic planning. These systems can provide students with viable career options, support the application process, and help them identify their future goals. As a result, the use of AI in education has great potential to improve student learning processes, provide support to teachers and provide a more personalized educational experience. In this study; The subject of AI was examined in a general framework under the title of education and the role of AI in education was discussed. It is thought that AI will contribute to the field by revealing the teacher and how it can be used in the field of education.
Thesis
Bu çalışmada, Millî Eğitim Bakanlığı’na bağlı olarak uzaktan eğitim yöntemi ile hizmet veren açık öğretim liselerinde öğrenim gören öğrencilerin mezuniyet, okul terk ve devam durumlarının tahmininin, okul terk durumlarının erken tahmininin ve okulu terk eden öğrencilerin profillerinin Eğitsel Veri Madenciliği ile incelenmesi amaçlanmıştır. Eğitsel Veri Madenciliği, sağlık ve pazarlama gibi hayatın birçok alanında başarıyla uygulanan veri madenciliği yönteminin eğitim alanındaki sorunların çözümü için uygulanmasıdır. Çalışma kapsamında açık öğretim liseleri öğrencilerine ait öğrenci bilgi sisteminden alınan verilerle üç farklı modelleme çalışması yapılmıştır. Modelleme çalışmalarında veri madenciliği araştırmalarında izlenen genel süreç izlenmiş ve bu sürecin net bir şekilde tanımlandığı CRISP-DM (Cross Industry Standard Processfor Data Mining) süreç modeli takip edilmiştir. İlk olarak, 2013 yılında açık öğretim liselerine ilk kez kayıt yaptıran 484.164 öğrenciye ait veri seti kullanılarak öğrencilerin normal öğrenim süresi sonundaki mezuniyet, okul terki ve devam durumlarının tahmini için sınıflandırma analizi yapılmıştır. Sınıflandırma analizinde Eğitsel Veri Madenciliği çalışmalarında sıklıkla kullanılan J48, Decision Tree, kNN, Naive Bayes ve Random Forest algoritmaları kullanılmış ve farklı veri dönüştürme teknikleri uygulanarak modeller geliştirilmiştir. Modellerin geçerliliğini sağlamak için veri seti dışarda tutma yöntemine göre %70 eğitim, %30 test veri seti olmak üzere ikiye ayrılarak eğitim veri seti ile geliştirilen modeller, modellerin daha önce görmedikleri test veri seti ile test edilmiştir. Analizler sonucunda geliştirilen modellerin performansları genel sınıflandırma ölçütlerine göre raporlanarak doğru sınıflandırma oranı (DSO) ve Kappa ölçütlerine göre değerlendirilmiştir. Değerlendirme sonucunda J48 algoritmasıyla geliştirilen modelin %80,47 DSO ve 0,61 Kappa değeriyle en başarılı model olduğu görülmüştür. Bu modele göre öğrencilerin durumlarını tahmin etmede en önemli özelliğin toplam kredi sayısı olduğu tespit edilmiştir. İkinci modelleme çalışmasında öğrencilerin okul terk durumlarının erken tahmin edilip edilemeyeceği araştırılmıştır. Bu amaçla ilköğretim mezunu olarak doğrudan açık öğretim liselerine kayıt yaptıran öğrencilerin, normal öğrenim süreleri sonundaki okul terk durumlarının tahmini için sınıflandırma analizi yapılmıştır. Analizlerde geliştirilen modeller performans ölçütlerine göre değerlendirildiğinde J48 algoritması ile geliştirilen modelin %70,85 DSO ve 0,208 Kappa değeri ile öğrencilerin öğrenimlerini bırakma durumlarını kayıt yaptırdıkları tarih itibariyle tahmin edebileceği tespit edilmiştir. Bu modele göre öğrencilerin okul terk durumlarını erken tahmin etmede en önemli özelliğin kayıtlı oldukları açık öğretim lisesinin türü olduğu tespit edilmiştir. Çalışmada açık öğretim liselerine kayıt yaptırmış fakat daha sonra öğrenimlerini bırakmış olan toplam 2.317.130 öğrenci verisi kullanılarak, bu öğrencileri özelliklerine göre gruplandırmak için kümeleme analizi yapılmıştır. Kümeleme analizinde k-Means algoritması kullanılmıştır. Her bir lise türü için ayrı ayrı gerçekleştirilen kümeleme analizlerinde öğrencilerin özelliklerine göre üç kümeye ayrıştıkları tespit edilmiştir. Öğrencilerin kümelere ayrılmasında ortalama toplam kredi sayısı ve ortalama toplam aktif olunan dönem sayısı özelliklerinin etkili olduğu görülmüştür. Ayrıca kümeleme analizi ile öğrencilerin homojen bir grup olmadığı ve bazı özelliklere göre farklılaştıkları görülmüştür. Çalışma sonuçları okulu terk etme eğilimlerindeki öğrenciler için bir erken uyarı sistemi geliştirilerek risk altındaki öğrencilerin önceden belirlenip bu öğrencilerin öğrenimlerini bırakmamaları için önlemler alınabileceğini göstermektedir. Kümeleme analizi sonuçları ise öğrenimlerini bırakmış olan öğrencilerin yeniden öğrenimlerine dönmeleri için geliştirilecek stratejilerde bu öğrencilerin özelliklerinin dikkate alınarak, özelleştirilmiş uygulamalar geliştirilmesinde kullanılabileceğini göstermektedir. ------------------------------------------------------------------------------------------ EXAMINING DROPOUT AND GRADUATION STATUS OF OPEN HIGH SCHOOL STUDENTS USING EDUCATIONAL DATA MINING This study aimed to predict the dropout, graduation, and attendance status of students, early prediction of dropout status, and clustering students who dropped out of open high schools using Educational Data Mining. Educational Data Mining is the application of data mining methods, which is successfully applied in many areas of life such as health and marketing, to solve the problems in the field of education. Within the scope of the study, three different modeling studies were carried out with data obtained from the student information system of open education high schools. In modeling processes, CRISP-DM (Cross Industry Standard Process for Data Mining) model was used. Firstly, a classification analysis was performed to predict the status of students at the end of their normal education duration with the data set of 484.164 students who registered for open high schools for the first time in 2013. Students' status was defined in three categories as continuing, graduation, and dropping out of education. In the classification analysis J48, Decision Tree, kNN, Naive Bayes, and Random Forest classification algorithms, which are frequently used in Educational Data Mining studies, were used and models were developed by applying different data transformation techniques. In order to ensure the validity of the models, the data set was divided into two as 70% training and 30% test datasets according to the holdout method, and the models developed with the training dataset were tested with the test dataset. The performances of the models were reported according to the classification metrics and evaluated according to the accuracy and Cohen’s Kappa coefficient. As a result of the evaluation, it was seen that the model developed with the J48 algorithm was the most successful model with 80,47% accuracy and 0,61 Kappa coefficient. According to this model, it has been determined that the most important attribute in predicting the status of students is the total number of credits. In the second modeling study, it was examined whether the dropout status of students could be predicted early. For this purpose, classification analysis was conducted to predict the dropout status of the students who were registered for open education high schools directly as primary school graduates. When the developed models are evaluated according to performance metrics, it has shown that the model developed with the J48 algorithm can predict the dropout status of the students as of the day they register, with 70,85% accuracy and 0,208 Kappa. Finally, cluster analysis was conducted to discover groups of 2.317.130 students who had previously registered for open high schools but dropped out of school. The k-Means algorithm was used in the cluster analysis, and the analyzes were performed separately for each high school type, it was seen that the students were gathered in three clusters according to attributes. With cluster analysis, it was seen that the learners were not a homogeneous group, but they differed according to some attributes. The results of the study show that an early warning system can be developed for students with a tendency to drop out, and additional measures can be taken to identify students at risk and not to drop out of their education. Cluster analysis results show that it can be used to develop customized applications, taking into account the attributes of these students, in the strategies to be developed for students who have dropped out to return to their education again.
Thesis
Bilgi ve iletişim teknolojilerini kullanan tüm kurumlar, bilgisayar sistemleri ve elektronik araçların ürettikleri verileri, kurumlarının veri tabanlarına kaydetmektedirler. Veri madenciliği, çok büyük miktarda bilginin depolandığı veri tabanlarından, amacımız doğrultusunda, gelecek ile ilgili tahminler yapmamızı sağlayacak, anlamlı olan veriye ulaşma ve veriyi kullanma işidir. Bilgi ve iletişim teknolojilerinde yaşanan gelişmelere paralel olarak, bu alanlarda kullanılan yazılım teknolojileri de sürekli gelişme halindedir. İnsanların yeni gözdesi, zaman ve mekandan bağımsız olmak ve hareket özgürlüğü anlamına gelen ?mobilite? olmuştur. Günümüzde ülke nüfusu sayısı kadar GSM Şebekesi abonelikleri, her bireyde mobil iletişim araçları, pek çok bireyin çift hatlı kullanıma geçmeleri ve mobil iletişimin sadece sesli görüşme için değil aynı zamanda görüntülü iletişim ve internet gibi başka amaçlarla da kullanılması göstermektedir ki, mobil iletişim hayatımızda çok büyük önem taşımaktadır. Bu kadar çeşitli kullanım alanı ve yoğun kullanım, mobil iletişimde üretilen verilerin boyutunu çok büyük ölçeklere çıkarmıştır. Böylece mobil iletişim alanında veri madenciliğini kullanmak, yöneticiler ve işletme sahipleri için kaçınılmaz olmaktadır. Bu tez çalışmasında MS Visual Studio C#.NET 2008 programlama dili kullanılarak, üç ayrı GSM şebekesinin sinyal verilerini cep telefonundan alarak veri tabanı oluşturan bir program geliştirilmiştir. Kaydedilen bu veriler veri madenciliği için uygun hale getirilmiş, ardından Frekans Analizi ve İki Aşamalı Kümeleme yöntemleriyle analiz edilerek sonuçlara ulaşılmıştır. Elde edilen sonuçlar göstermiştir ki, A Şebekesi sinyal gücü baz alındığında en yüksek oranda çekim gücüne ve en istikrarlı çekim seviyesine sahiptir. Daha sonra bu şebekeyi B Şebekesi izlemektedir. Çekim gücü performansı açısından en düşük performans gösteren şebeke C Şebekesi olmuştur. Ayrıca elde edilen diğer farklı bulgular da değerlendirilerek yorumlanmıştır.
Article
Full-text available
İnsan niteliğinin en önemli parçası olan özgürlük, herhangi bir kısıtlamaya, zorlamaya bağlı olmaksızın düşünme veya davranma durumudur. Bir araştırma kuruluşu olan Kanada merkezli Fraser Enstitüsü 2008 yılından bu yana her yıl İnsani Özgürlük Endeksi isimli küresel açıdan anlamlı bir endeks yayınlamaktadır. Bu endekste yer alan ülkeler; kişisel özgürlük ve ekonomik özgürlük endekslerine göre 10'un daha fazla özgürlüğü temsil ettiği 0-10 arası bir ölçekte İnsani Özgürlük Endekslerine göre sıralanmaktadır. Bu çalışmada, 2018 yılı İnsani Özgürlük Endeksinde yer alan veriler dikkate alınarak öncelikle kriterlerin ağırlık dereceleri Entropi yöntemi ile hesaplanmış ve oluşturulan ağırlıklı endeks değerleri WEKA 3.8 paket programında çözümlenerek kümeleme yapılmıştır. Çalışmada kullanılan kişisel özgürlük ve ekonomik özgürlük endeks puanları Entropi yöntemi ile ağırlıklandırıldığında kişisel özgürlük kriterinin ağırlığının daha fazla olduğu görülmüştür. WEKA programında çeşitli algoritmalar ile yapılan analiz sonucunda en anlamlı sonucu Canopy algoritması vermiştir. Canopy algoritması ile ülkeler 9 kümeye ayrılarak en genel anlamda ülkelerin ekonomik ve kişisel özgürlükleri açısından farklılıklar olduğu sonucuna ulaşılmıştır.
Article
Veri madenciliği yöntemlerinden biri olan sınıflandırma, en çok kullanılan veri madenciliği yöntemidir. Bir veri veya veri grubunun mevcut sınıflardan hangisine ait olduğunun belirlenmesi olarak tanımlanmaktadır. Sınıflandırma çalışmalarında en önemli kriter yüksek başarımlı bir sınıflandırıcı model oluşturabilmektir. Ancak başarımı etkileyen birçok neden bulunmaktadır. Kullanılan test yöntemlerinin yanı sıra veri setine ait özellikler de başarımı etkileyen unsurlardan biridir. Bu makalede, hem test tekniklerinin hem de veri setinin özelliklerinin başarıma etkisi detaylı olarak incelenmektedir. Bu amaçla, literatürde yaygın olarak kullanılan 32 farklı veri seti kullanılarak deneyler gerçekleştirilmiştir. Ayrıca çalışmada 9 farklı sınıflandırma algoritması da kullanılarak bu algoritmaların veri setleri üzerindeki başarımları da kıyaslanmıştır. Elde edilen sonuçlar, algoritmaların etkinliğinin yanı sıra test yöntemlerinin başarıma etkilerini de ortaya çıkarmıştır. Veri setine ait parametrelerin sınıflandırma başarımına etkileri makalede detaylı olarak ortaya konulmuştur.
Conference Paper
Full-text available
ÖZET Yapay zekâ, insan zekasını taklit eden sistemler olarak tanımlanabilir. Yapay zekâ kavramı resmi olarak ilk defa 1956 yılında ortaya çıkmıştır. Günümüze kadar geçen süre boyunca bilgi ve iletişim teknolojilerindeki gelişmeler yapay zekanın geniş bir yelpazede kullanılmasının önünü açmıştır. Yapay zekâ başta araştırma-geliştirme çalışmaları olmak üzere sağlık, güvenlik, perakende, sesli asistanlar, bilgi ve iletişim teknolojileri gibi birçok alanda kullanılmaktadır. Yapay zekanın kullanım alanlarından biri de eğitimdir. Eğitimde yapay zekâ kullanımı gün geçtikçe artmaktadır. Yapılan araştırmalar eğitimde yapay zekâ çalışmalarının ve buna bağlı olarak eğitimde yapay zekaya ilişkin yatırımların artacağını öngörmektedir. Dünya üzerinde ülkeler eğitimde yapay zekâ stratejilerini oluşturmakta buna göre planlamalarını yapmaktadır. Eğitimde yapay zekâ kullanımını öğrenme analitiği çerçevesinde incelemek yararlı olacaktır. Öğrenme analitiği, hedefler (değerlendirme, tahmin), veri (açık, korumalı), yöntemler (yapay zekâ, eğitsel veri madenciliği, makine öğrenmesi, istatistiksel analiz), kısıtlamalar (gizlilik ve etik) ve paydaşlardan (öğrenciler, öğretmenler, kurumlar) oluşan bir alanı tanımlamaktadır. Eğitimde yapay zekâ kullanımının klasik yöntemlerle yapılan (bazen de yapılamayan) iş ve işlemlerin daha kısa sürede, daha az maliyetle yapılmasını sağladığı ve eğitimde kalitenin artırılmasında fırsatlar sunduğu görülmektedir. Eğitimde yapay zekâ kullanımı öğrencilere, öğretmenlere ve eğitim kurumlarına öğrenme analitikleri çerçevesinde öğretmene yardımcı olma, öğrenci profillerini belirleme, öğrenme ortamlarını bireyselleştirme, öğrenci başarısını öngörme ve artırma, riskli durumları öngörme ve önlem alma gibi konularda fırsatlar sunmaktadır. Anahtar kelimeler: Yapay Zekâ, Eğitimde Yapay Zekâ, Öğrenme Analitikleri Abstract Artificial intelligence can be defined as systems that simulate human intelligence. The concept of artificial intelligence was first formally introduced in 1956. Developments in information and communication technologies have paved the way for the use of artificial intelligence in a wide range. Artificial intelligence is used in many fields such as health and safety, retail, voice assistants, information and communication technologies, especially in research and development activities. One of the uses of artificial intelligence in education. The use of artificial intelligence in education is increasing day by day. Researches predict that artificial intelligence studies in education and investments related to artificial intelligence in education will increase. Countries around the world form artificial intelligence strategies in education and make plans accordingly. It would be useful to examine the use of artificial intelligence in education within the framework of learning analytics. Learning analytics describe an area of objectives (assessment, prediction), data (open, protected), methods (artificial intelligence, educational data mining, machine learning, statistical analysis), constraints (confidentiality and ethics), and stakeholders (students, teachers, institutions). It is seen that the use of artificial intelligence in education makes it possible to perform the works and transactions done by classical methods (sometimes not) in a shorter time, with less cost and offers opportunities for increasing the quality of education. The use of artificial intelligence in education provides opportunities for students, teachers and educational institutions to assist the teacher within the framework of learning analytics, identifying student profiles, individualizing learning environments, predicting and improving student achievement, predicting risk situations and taking measures. Keywords: Artificial Intelligence, Artificial Intelligence in Education, Learning Analytics
Thesis
Full-text available
Bu araştırmada Akdeniz Üniversitesi Eğitim Fakültesinden 2012-2017 yılları arasında mezun olan 3773 öğrencinin akademik verisi kullanılarak uygulamalı bir veri madenciliği çalışması yapılmıştır. Akdeniz Üniversitesi Eğitim Fakültesinde bulunan 7 bölümden mezun öğrencilerin aldıkları derslere ilişkin sınav puanları, dönem sonu ders notları, dönemlik not ortalamaları, mezuniyet notlarına ilişkin veri, farklı tablolardan alınarak bir araya getirilmiş, her bölüm için ayrı veri setleri elde edilmiştir. Veri ön işleme aşamasından sonra akademik performans kestirim modelleri geliştirilmiş ve test edilmiştir. Veri madenciliği teknikleri ve algoritmalar kullanılarak öğrencilerin akademik başarı durumlarını kestirmeye yönelik iki ana model geliştirilmiştir. Birinci Model, Öğrenci Mezuniyet Notu Kestirim Modelidir. Bu modelin altında 1. sınıf 1. dönem ara sınav puanları kullanılarak mezuniyet notu kestirimi için 1S1DV Modeli, 1. sınıf 1. dönem sonu dörtlük ders notlarıyla mezuniyet notu kestirimi için 1S1D4N Modeli ve 1. sınıf 1. dönem ve 2. dönem ağırlıklı not ortalaması kullanılarak mezuniyet notu kestirimi için 1S12DANO Modeli olmak üzere 3 alt model geliştirilmiştir. Alt modellerin her biri için yapay sinir ağları ve çoklu doğrusal regresyon analizi ile farklı modeller geliştirilmiş ve performansları karşılaştırılmıştır. Geliştirilen modellerin öğrencilerin mezuniyet notunu 1. sınıf 1. dönemden itibaren %94-97 doğrulukla kestirdiği görülmüştür. Araştırmada geliştirilen ikinci model Öğrenci Akademik Erken Uyarı (DANO2) Modelidir. DANO2 Modeli öğrencinin 1. sınıf 1. dönem derslerine ait dönem sonu notlarına göre, gelecekte dönemlik ağırlıklı not ortalamasının 2'nin altına düşüp düşmeyeceğini kestiren bir modeldir. Bu model altında lojistik regresyon ve karar ağaçları kullanılarak geliştirilen alt modellerin doğruluğunun %72-87 olduğu görülmüştür. Yapılan araştırma sonucunda öğrenci akademik performansının kestirilerek, gelecekte oluşabilecek akademik başarısızlık durumlarını önlemeye yönelik bir model önerilmiştir. Geliştirilen model önerisi ile eğitim kurumlarının, öğrenci başarısını artırmada daha etkili ve verimli çalışabileceği düşünülmektedir. Anahtar Kelimeler: Akademik Performans Kestirimi, Akademik Uyarı Sistemi, Eğitsel Veri Madenciliği, Yapay Sinir Ağları, Karar Ağaçları, Regresyon Analizi, Lojistik Regresyon, Eğitim Fakültesi In this study, an applied data mining study was conducted by using the academic data of 3773 students who graduated from Akdeniz University Faculty of Education between 2012-2017. Exam scores, semester grades of lessons, semester grade point averages and graduation grades data of the students from 7 departments of Akdeniz University Faculty of Education were gathered from different tables and separate data sets were obtained for each department. After the data pre-processing stage, academic performance prediction models were developed and tested. Two main aiming models to predict students' academic achievement were developed by using data mining techniques and algorithms. The first model was the Prediction Model of Student Graduation Grade. Under this model, three sub-models were developed as the 1S1DV Model for predicting the graduation grade by using midterm exam scores of the 1st semester, 1S1D4N Model for estimating the graduation grade through 1st-semester grade point averages and 1S12DANO Model for predicting graduation grades by using grade point averages of 1st and 2nd semesters. For each sub-model, different models were developed by using artificial neural networks and multiple linear regression analysis and their performances were compared. It was observed that the models, developed in this research, predicted the graduation grade of students with an accuracy of 94-97% since the first semester. The second model developed in this research was the Student Academic Early Warning (DANO2) Model. The DANO2 Model was a model that predicted whether the future grade point averages of the students would fall below 2 according to their 1st-semester grades. Under this model, the accuracy of the sub-models developed by using logistic regression and decision trees was 72-87%.
Thesis
Full-text available
The developments in computer technology render that a huge amount of data can conceal in magnetic mediums easily and cheaply by making data storage systems become widespread. However, the data being warehoused are worthless and mean nothing by themselves. In order to make the data being warehoused become meaningful, they ought to be transformed into knowledge purposefully. Discovering the pattern of data and making them meaningful, data mining methods are used. In this study, undergraduates are examined to discover the connection between their dynamism into Learning Management System (LMS) and their levels of achievement with using the data mining methods. In this regard, the study is descriptive and quantitative. Hence, it is appropriate for associative scanning from scanning models. The research includes 40 pupils who receive in Instructional Technologies and Material Design during spring semester and reside in Baskent University Institute of Education Sciences Pedagogical Formation Certification Program throughout 2012-2013 academic years. Students’ academic achievement grades and log registrations placing in LMS which shows related year’s access are used as data source. To determine the correlation between academic success level and access to the system, data mining techniques, which occur in interdisciplinary areas, are used. Clustering model which is one of the data mining models and is descriptive is used primarily. K-Means algorithm is parlayed to constitute the model. Pupils’ academic grades which are marked according to the success in Instructional Technologies and Material Design lessons are used in clustering model as data source during 2012-2013 spring semesters. After clustering process has done, students are separated into three groups which are called “low academic achievement”, “medium academic achievement” and “high academic achievement”. They are inserted into these groups according to their academic achivement level. Doing that, K-Means algorithm is used in order to be able to calculate average values. It can be said that the academic achievement groups which are formed with clustering process can contribute to get knowledge about pupils’ feature, to create decision trees which place in predictive models and to interpret the results handily. After clustering process, Moodle (Modular Object Oriented Dynamic Learning Environment) LMS datas are aimed to create decision trees as data source. The decision trees which are constituted by using C5.0, CART (Classification And Regression Trees), CHAID (Chi-squared Automatic Interaction Detector), QUEST (Quick, Unbiased, Efficient Statistical Tree) algorithms are examined to see their accuracy rate. As a result of that, CART algorithm has the highest accuracy rate among all the algorithms above-referred and it is %85,0. Correspondingly, decision trees are created by using CART algorihtm. Depending upon the findings which acquired at the end of the study, there is a meaningful connection between the activities on LMS and the academic achievement levels of students. It is quite obvious that pupils who are active on LMS place in high academic achievement group, who are intermediate user of LMS are found in the medium academic achievement group, who are inactive on LMS locate low academic achievement group. Bilgisayar teknolojisindeki gelişmeler veri depolama sistemlerinin yaygınlaşmasını sağlayarak büyük miktarlardaki verilerin manyetik ortamlarda saklanmasını kolay ve ucuz hale getirmiştir. Ancak depolanan bu veriler tek başlarına değersiz olup bir anlam ifade etmemektedir. Depolanan verilerin anlamlı hale getirilebilmesi için bilgisayar sistemleri kullanılarak belli bir amaca yönelik işlenerek bilgiye dönüştürülmesi gerekmektedir. Veriler arasındaki örüntülerin keşfedilerek anlamlı bilgi haline getirilmesi veri madenciliği yöntemleri ile sağlanabilmektedir. Bu çalışmada üniversite (lisans) düzeyindeki öğrencilerin Öğretim Yönetim Sistemi (ÖYS) üzerindeki hareketliliği ile akademik başarı düzeyleri arasındaki ilişki veri madenciliği yöntemleri kullanılarak incelenmiştir. Bu bağlamda bu çalışma, tarama modellerinden ilişkisel tarama modeline uygun olarak düzenlenmiş betimsel ve nicel bir çalışmadır. Çalışmanın örneklemini Başkent Üniversitesi Eğitim Bilimleri Enstitüsü Pedagojik Formasyon Sertifika Programı 2012-2013 eğitim öğretim yılı bahar dönemi Öğretim Teknolojileri ve Materyal Tasarımı dersini alan 40 öğrenci oluşturmaktadır. Çalışmada veri kaynağı olarak öğrencilerin ilgili eğitim öğretim yılına ait Moodle (Modular Object Oriented Dynamic Learning Environment) ÖYS üzerindeki hareketliliğini içeren log kayıtları ve yılsonu akademik başarı notları kullanılmıştır. Öğrencilerin ÖYS üzerindeki hareketliliği ile akademik başarı düzeyleri arasındaki ilişkinin belirlenmesinde disiplinler arası bir alan olan veri madenciliği teknikleri kullanılmıştır. İlk olarak veri madenciliği modellerinden tanımlayıcı model olan kümeleme modeli kullanılmış ve bu modelin oluşturulmasında K-Means algoritmasından yararlanılmıştır. Kümeleme modelinde veri kaynağı olarak 2012-2013 eğitim öğretim yılı bahar dönemi Öğretim Teknolojileri ve Materyal Tasarımı dersini alan öğrencilerin yılsonu akademik başarı notları kullanılmıştır. Kümeleme işleminin gerçekleştirilmesi sonucu öğrencilerin düşük, orta ve yüksek akademik başarı grubu olmak üzere 3 gruba ayrılmasına karar verilmiştir. K-Means algoritması tarafından akademik grupları için ortalama değerler hesaplanarak öğrenciler akademik başarı durumlarına göre bu akademik başarı gruplarına yerleştirilmiştir. Kümeleme işlemi sonucu oluşturulan akademik başarı gruplarının; öğrenci özellikleri hakkında bilgi sağlayabileceği, tahmin edici modeller içerisinde yer alan sınıflandırma modellerinden olan karar ağaçlarının oluşturulmasına ve elde edilen sonuçların daha kolay yorumlanabilmesine katkı sağlayacağı söylenebilir. Kümeleme işlemi gerçekleştirildikten sonra karar ağaçlarının oluşturulmasında veri kaynağı olarak öğrencilerin Moodle ÖYS üzerinde gerçekleştirdikleri eylemler kullanılmıştır. C5.0, CART (Classification And Regression Trees), CHAID (Chi-squared Automatic Interaction Detector), QUEST (Quick, Unbiased, Efficient Statistical Tree) algoritmaları kullanılarak oluşturulan karar ağaçlarının doğruluk oranları incelenmiş ve bu algoritmalar içerisinde en yüksek doğruluk oranını veren CART algoritmasının doğruluk oranı %85,0 olarak bulunmuştur. Karar ağaçları en yüksek doğruluk oranını veren CART algoritması kullanılarak oluşturulmuştur. Çalışma sonucunda elde edilen bulgulara bağlı olarak öğrencilerin ÖYS üzerindeki hareketliliği ve akademik başarı düzeyleri arasında anlamlı bir ilişkinin olduğu ortaya konulmuştur. ÖYS üzerinde yüksek düzeyde hareketlilik sergileyen öğrencilerin yüksek akademik başarı grubunda, orta düzeyde hareketlilik sergileyen öğrencilerin orta akademik başarı grubunda ve düşük düzeyde hareketlilik sergileyen öğrencilerin düşük akademik başarı grubunda yer aldıkları söylenebilir.
Data Mining with Sql Server
  • Z Tang
  • J Maclennan
Tang Z. and MacLennan J., Data Mining with Sql Server 2005. Wiley Publishing Inc, Indiana, 2005.
Türkiye'nin ÖSS Tercihleri, 1.Psikolojik Danışman ve Veli Bilgilendirme-Yönlendirme Sempozyumu
  • B Kılanç
Kılanç, B., Türkiye'nin ÖSS Tercihleri, 1.Psikolojik Danışman ve Veli Bilgilendirme-Yönlendirme Sempozyumu, 2008.
Üniversite Öğrencilerinin İnterneti Eğitimsel Amaçlar İçin Kullanmalarını Etkileyen Faktörlerin Veri Madenciliği Yöntemleriyle Tespiti
  • A S Bozkır
  • B Gök
  • E Sezer
Bozkır, A.S., Gök, B., Sezer, E. Üniversite Öğrencilerinin İnterneti Eğitimsel Amaçlar İçin Kullanmalarını Etkileyen Faktörlerin Veri Madenciliği Yöntemleriyle Tespiti, in BUMAT 2008: Bilimde Modern Yöntemler Sempozyumu, 2008.
  • Z Tang
  • J Maclennan
Tang Z. and MacLennan J., Data Mining with Sql Server 2005. Wiley Publishing Inc, Indiana, 2005.
Öğrenci Seçme Sınavında (ÖSS) Öğrencilerin Tercih Profillerinin Veri Madenciliği Yöntemleriyle Tespiti
  • M Ö Dolgun
  • T G Özdemir
  • S Deliloğlu
Dolgun, M. Ö., Özdemir, T.G., Deliloğlu, S., Öğrenci Seçme Sınavında (ÖSS) Öğrencilerin Tercih Profillerinin Veri Madenciliği Yöntemleriyle Tespiti, in Bilişim" 07 Kongresi, 2007.