ArticlePDF Available

MACHINE LEARNING TO CREATE DECISION TREE MODEL TO PREDICT OUTCOME OF ENTERPRENEURSHIP PSYCHOLOGICAL READINESS (EPR)

Authors:

Abstract

This study aims to create a decision tree model using machine learning to predict psychological readiness for entrepreneurship in college graduates. This research was conducted through several stages of research. In the early stages, a survey was conducted on 700 students from several universities in Riau aged between 17-25 years. The survey was conducted using the Entrepreneur Psychology Readiness (EPR) instrument. Furthermore, the survey data was validated and obtained 604 valid data to be used in forming machine learning models The urgency of this research is to find a number of decision rules from the best decision tree model to be used in building AI-based counseling applications in measuring entrepreneurial psychology readiness for college graduates. In this research, the decision tree model that is formed is divided into 2 models, namely: decision tree with pruning model and decision tree with unpruning. The pruning decision tree model produces 180 decision rules, while the unpruning model produces 121 decision rules. Good accuracy results are obtained in the pruned decision tree, which is above 99% in the use training set mode, and 82.87% in the percentage split mode. Meanwhile, the accuracy results on the unpruned decision tree are 90.18% with the use training set mode test, and 80.38% in the percentage split mode. The decision tree model with pruning technique has better performance than the unpruning decision tree model.
Jurnal Teknik Informatika (JUTIF) DOI: https://doi.org/10.52436/1.jutif.2023.4.2.590
Vol. 4, No. 2, April 2023, hlm. 381-390 p-ISSN: 2723-3863
e-ISSN: 2723-3871
381
MACHINE LEARNING TO CREATE DECISION TREE MODEL TO PREDICT
OUTCOME OF ENTERPRENEURSHIP PSYCHOLOGICAL READINESS (EPR)
Nesi Syafitri*1, Syarifah Farradinna2, Wella Jayanti3, Yudhi Arta4
1,4Teknik Informatika, Fakultas Teknik, Universitas Islam Riau, Indonesia
2,3Psikologi, Fakultas Psikologi, Universitas Islam Riau, Indonesia
Email: 1nesisyafitri@eng.uir.ac.id, 2syarifah.farradinna@psy.uir.ac.id, 3wellajayanti17@gmail.com,
4yudhiarta@eng.uir.ac.id
(Naskah masuk: 31 Agustus 2022, Revisi: 11 Oktober 2022, Diterbitkan: 23 Maret 2023)
Abstract
This study aims to create a decision tree model using machine learning to predict psychological readiness for
entrepreneurship in college graduates. This research was conducted through several stages of research. In the
early stages, a survey was conducted on 700 students from several universities in Riau aged between 17-25
years. The survey was conducted using the Entrepreneur Psychology Readiness (EPR) instrument. Furthermore,
the survey data was validated and obtained 604 valid data to be used in forming machine learning models The
urgency of this research is to find a number of decision rules from the best decision tree model to be used in
building AI-based counseling applications in measuring entrepreneurial psychology readiness for college
graduates. In this research, the decision tree model that is formed is divided into 2 models, namely: decision tree
with pruning model and decision tree with unpruning. The pruning decision tree model produces 180 decision
rules, while the unpruning model produces 121 decision rules. Good accuracy results are obtained in the pruned
decision tree, which is above 99% in the use training set mode, and 82.87% in the percentage split mode.
Meanwhile, the accuracy results on the unpruned decision tree are 90.18% with the use training set mode test,
and 80.38% in the percentage split mode. The decision tree model with pruning technique has better
performance than the unpruning decision tree model.
Keywords: Accuracy, Decision Tree, Enterprenuer Readiness, Machine Learning, Psychological assessment
MACHINE LEARNING UNTUK MEMBUAT MODEL DECISION TREE GUNA
MEMPREDIKSI KESIAPAN PSIKOLOGI BERWIRAUSAHA
Abstrak
Penelitian ini bertujuan untuk membuat sebuah model pohon keputusan (Decision Tree Model) dengan
menggunakan machine learning untuk memprediksi kesiapan psikologi untuk berwirausaha pada lulusan
perguruan tinggi. Penelitian ini dilakukan melalui beberapa tahap penelitian. Pada tahapan awal dilakukan
survey terhadap 700 orang mahasiswa dari beberapa perguruan tinggi di Riau yang berusia antara 17-25 tahun.
Survey dilakukan dengan menggunakan instrument Enterprenuer Psikology Readiness (EPR). Selanjutnya data
survey divalidasi dan diperoleh 604 data valid untuk digunakan dalam membentuk model machine learning.
Urgensi dari penelitian ini adalah menemukan sejumlah aturan keputusan (decision rules) dari model pohon
keputusan (decision tree) terbaik untuk digunakan dalam membangun aplikasi konseling berbasis AI dalam
mengukur kesiapan psikologi kewirausahaan bagi lulusan perguruan tinggi. Pada penelitian ini model decision
tree yang dibentuk, dibedakan dalam 2 model yaitu: decision tree dengan model pruning dan decision tree
dengan unpruning. Decision tree model pruning menghasilkan 180 aturan keputusan (decision rules), sedangkan
model unpruning menghasilkan 121 decision rules. Hasil akurasi yang baik diperoleh pada decision tree dengan
pruned yaitu diatas 99% pada mode use training set, dan 82.87% pada mode percentage split. Sementara hasil
akurasi pada decision tree unpruned yaitu 90.18% dengan pengujian mode use training set, dan 80.38% pada
mode percentage split. Model decision tree dengan teknik pruning memiliki kinerja lebih baik dibandingkan
dengan model decision tree unpruning.
Kata kunci: Akurasi, decision tree, machine learning, kesiapan berwirausaha, pengukuran psikologi.
1. PENDAHULUAN Kewirausahaan dipandang sebagai kekuatan
pendorong terpenting dalam pertumbuhan ekonomi,
382 Jurnal Teknik Informatika (JUTIF), Vol. 4, No. 2, April 2023, hlm. 381-390
karena kemampuannya untuk menciptakan
pekerjaan, meningkatkan pendapatan individu,
mempercepat pengentasan kemiskinan dan
mendukung inovasi kreatif[1].
Pendidikan kewirausahaan di Indonesia lebih
berfokus pada pengembangan wawasan kognitif,
pengetahuan manajemen, rencana bisnis, pemasaran,
keuangan, pengembangan inovasi dan kreatifitas.
Sementara, faktor psikologis juga memegang peran
yang sama pentingnya dalam pendidikan
kewirausahaan, hal ini terbukti bahwa ketahanan
kepribadian (personality hardiness) menawarkan
pengaruh yang tinggi terhadap intensi
kewirausahaan[2]. Faktor psikologis seperti
kebutuhan untuk berprestasi, kecenderungan untuk
mengambil risiko dan kemampuan memegang
kendali serta faktor sosial seperti latar belakang
keluarga, sistem pendidikan dan status social,
merupakan indicator yang cukup menonjol dan
signifikan untuk menjadi wirausaha[3].
Berbagai instrumen kesiapan psikologi
kewirausahaan terus dikembangkan para ahli dan
mulai berinovasi dengan teknologi terkini, salah
satunya dengan penerapan kecerdasan buatan /
artificial intelligence (AI). Sistem berbasis AI
diketahui sebagai system yang memberikan layanan
evaluasi yang akurat dan cerdas, mengurangi
pekerjaan berulang dalam konseling kesiapan
psikologis dan memberikan informasi perbandingan
dengan data yang tersedia[4].
AI ini telah banyak digunakan diberbagai
bidang seperti diagnosa di bidang medis, simulasi
dalam matematika dan fisika, klasifikasi gambar
dalam biologi dan kimia, dan banyak lagi. Beberapa
tahun terakhir bidang psikologi pun telah mulai
eksperimen dengan menggunakan AI untuk
memprediksi dan mengklasifikasikan di banyak
bidang studi: mulai dari mengukur tingkat rasa sakit
dari pemindaian otak[5], menerapkan teknik
pembelajaran mesin untuk lebih memahami
kepribadian [6], dan mendeteksi kebutuhan manusia
dalam peristiwa kritis[7], untuk memprediksi
penggunaan media sosial yang bermasalah, dan
penyalahgunaan alkohol di masa depan[8][11],
untuk membantu diagnosis dan prognosis penyakit
dan gangguan mental, mendeteksi tingkat depresi,
dan memprediksi risiko perilaku bunuh diri dan
melukai diri sendiri[12]. Para peneliti bahkan telah
menganalisis bagaimana membuat model AI ini
lebih baik khusus untuk bidang psikologi [13][15].
Salah satu disiplin ilmu dalam AI adalah
machine learning. Machine learning merupakan
teknik untuk meningkatkan kinerja sistem dengan
mempelajari pengalaman melalui metode komputasi
[16]. Tujuan utama dari machine learning adalah
untuk belajar dari sejumlah data yang besar[17].
Algoritma machine learning yang dapat digunakan
dalam menemukan pola data, salah satunya adalah
decision tree. Decision tree, jenis machine learning
tertentu, didasarkan pada kovariat untuk membuat
model dalam memprediksi hasil[18].
Tujuan dari penelitian ini untuk menemukan
sejumlah aturan keputusan (decision rules) dari
model pohon keputusan (decision tree) terbaik untuk
memprediksi kesiapan psikologi kewirausahaan
menggunakan 8 (delapan) parameter pengukuran
psikologi. Sehingga model pohon keputusan ini
nanti dapat digunakan dalam membangun aplikasi
konseling psikologi berbasis cerdas.
2. METODE PENELITIAN
2.1. Data Penelitian
Data primer yang digunakan dalam penelitian
ini bersumber dari data hasil kuisioner yang
disebarkan kepada sejumlah mahasiswa dari
perguruan tinggi yang ada di wilayah Riau
menggunakan alat ukur Kesiapan Psikologi
Kewirausahaan / Enterprenuership Psycological
Readiness (EPR) instrument. Alat ukur ini menilai
kesiapan individu secara psikologis dan sosiologis,
untuk menentukan apakah seorang individu
menunjukkan kesiapan menjadi seorang wirausaha
atau tidak. Instrumen EPR mengukur pada 8
parameter dengan 59 item pertanyaan yang dijawab
menggunakan skala Likert lima poin, yaitu: Sangat
Tidak Setuju (1), Tidak Setuju (2), Ragu-ragu (3),
Setuju (4), dan Sangat Setuju (5). Uraian 8(delapan)
parameter denagn jumlah item pertanyaan setiap
parameter pada EPR instrument terlihat pada Tabel
1. Tabel 1. Parameter pada Instrumen EPR
Parameter
Jumlah item pertanyaan
Personal Knowledge
10
Personal Adversity
13
Commited Certain Action
8
Willingness to learn
8
Personal Relationship to Others
8
Personal growth
6
Passion Achieved
3
Related Person Support
3
Total
59
Output prediksi kesiapan psikologis
berwirausaha ini menghasilkan 4 (empat) kategori
yaitu: tidak siap, diberi pelatihan, direkomendasikan,
dan siap berwirausaha.
2.2. Tahap Penelitian
Penelitian ini terdiri dari beberapa tahapan,
yaitu: pengumpulan data, pengolahan data,
pemrosesan model, evaluasi model. Gambar 1
menunjukkan bagan alir dari tahap penelitian.
Gambar 1. Bagan Alir Tahap Penelitian
Nesi Syafitri, dkk, Machine Learning Untuk Membuat Model Decision Tree 383
a. Pengumpulan Data
Pada tahap pengumpulan data dilakukan
dengan menyebarkan kuisioner kepada responden
mahasiswa yang berasal dari beberapa perguruan
tinggi di wilayah Riau. Karakteristik responden
berusia antara 17 sampai 25 tahun yang terdiri dari
laki-laki dan perempuan. Jumlah data yang diperoleh
sebanyak 604 data. Kuisioner digunakan untuk
menilai tingkat kesiapan psikologis dalam
berwirausaha setelah mahasiswa lulus dari
perguruan tinggi. Kuisioner berisikan 59 item
pertanyaan untuk mengukur setiap responden pada 8
parameter psikologi. Setiap pertanyaan dijawab
menggunakan skala Likert lima poin, yaitu: Sangat
Tidak Setuju (1), Tidak Setuju (2), Ragu-ragu (3),
Setuju (4), dan Sangat Setuju (5).
b. Pengolahan data
Langkah awal yang dilakukan dalam
pengolahan data adalah memverifikasi data untuk
memastikan tidak ada jawaban yang kosong atau
terlewati. selanjutnya menentukan skoring dari
setiap parameter berdasarkan nilai skor dari jawaban
responden. Setelah skor diperoleh dilakukan
penentuan kategorisasi setiap parameter. Norma
kategorisasi parameter yang digunakan berpedoman
pada norma kategorisasi yang disusun oleh
Azwar[16], dalam 5 (lima) kategori diagnosis, yaitu:
sangat rendah, rendah, sedang, tinggi dan sangat
tinggi. Skala norma kategorisasi ini mengacu pada
Tabel 2.
Tabel 2. Skala Norma Kategorisasi
Kategorisasi
Norma Kategorisasi
Sangat Rendah
X ≤ μ – 1.5σ
Rendah
μ 1.5σ < X ≤ μ – 0.5σ
Sedang
μ 0.5σ < X ≤ μ + 0.5σ
Tinggi
μ + 0.5σ < X ≤ μ + 1.5σ
Sangat Tinggi
X > μ + 1.5σ
dengan X adalah skor parameter, µ(means)
adalah nilai rata-rata teoritis dari skor maksimum
dan minimum dan σ(standar deviasi) adalah luas
jarak rentang yang dibagi dalam 6 satuan deviasi
sebaran.
Berdasarkan skala likert lima poin yang
digunakan untuk menjawab item pertanyaan, maka
skor minimum dan maksimum yang diperoleh dari
setiap parameter instrument EPR digunakan untuk
memperoleh nilai µ(means) dan nilai σ(standar
deviasi) seperti terlihat pada Tabel 3.
Tabel 3. Deskripsi Data Penelitian
Parameter
X
min
X
max
σ
(Sd)
Personal Knowledge
10
50
6.7
Personal Adversity
13
65
8.67
Commited Certain
Action
8
40
5.33
Willingness to learn
8
40
5.33
Personal Relationship
to Others
8
40
5.33
Personal growth
6
30
4
Passion Achieved
3
15
2
Related Person
Support
3
15
2
Pada parameter Personal knowledge terdapat
10 item pertanyaan, maka skor minimum (x min): 1
x 10 = 10; skor maksimum (x max): 5 x 10 = 50;
nilai mean teoritis (nilai µ) : (50+10)/2 = 30; dan
standar deviasi / sd) : (50-10)/6 = 6.7.
Perhitungan yang sama dilakukan pada parameter
yang lain.
Dengan mengacu pada Tabel 2 dan Tabel 3,
maka rentang skor untuk kategorisasi pada
parameter Personal Knowledge terlihat pada Tabel
4.
Tabel 4. Skor Kategorisasi pada Parameter Personal Knowledge
Kategorisasi
Norma Kategorisasi
Rentang Skor
Sangat Rendah
X ≤ μ – 1.5σ
X ≤ 20
Rendah
μ 1.5σ < X ≤ μ – 0.5σ
20 < X ≤ 26.67
Sedang
μ 0.5σ < X ≤ μ + 0.5σ
26.67 < X ≤ 33.33
Tinggi
μ + 0.5σ < X ≤ μ + 1.5σ
33.33 < X ≤ 40
Sangat Tinggi
X > μ + 1.5σ
X > 40
Tingkat kategori sangat rendah diperoleh jika
skor kecil sama 20, kategori “rendah” dengan skor
diantara 20 dan 26.67, kategori sedang berada antara
skor 26.67 dan 33.33, kategori tinggi dengan skor
antara 33.33 dan 40, dan kategori sangat tinggi
diatas skor 40.
Rentang skor untuk kategorisasi pada
parameter Personal Adversity dengan acuan nilai
mean = 26 dan standar deviasi =8.67 adalah seperti
yang terlihat pada Tabel 5.
Tabel 5. Skor Kategorisasi pada Parameter Personal Adversity
Kategorisasi
Norma Kategorisasi
Rentang Skor
Sangat Rendah
X ≤ μ – 1.5σ
X ≤ 26
Rendah
μ 1.5σ < X ≤ μ – 0.5σ
26 < X ≤ 34.67
Sedang
μ 0.5σ < X ≤ μ + 0.5σ
34.67 < X ≤ 43.33
Tinggi
μ + 0.5σ < X ≤ μ + 1.5σ
43.33 < X ≤ 52
Sangat Tinggi
X > μ + 1.5σ
X > 52
Tingkat kategori sangat rendah diperoleh jika
skor kecil sama 26, kategori “rendah” dengan skor
diantara 26 dan 34.67, kategori sedang berada antara
skor 34.67 dan 43.33, kategori tinggi dengan skor
antara 43.33 dan 52, dan kategori sangat tinggi
diatas skor 52.
Pada parameter Commited Certain rentang skor
kategorisasi yang diperoleh dengan acuan nilai mean
= 24 dan standar deviasi = 5.33 terlihat pada Tabel
6.
Tabel 6. Skor Kategorisasi pada Parameter Commited Certain
Action
Kategorisasi
Norma Kategorisasi
Rentang Skor
Sangat Rendah
X ≤ μ – 1.5σ
X ≤ 16
Rendah
μ 1.5σ < X ≤ μ – 0.5σ
16 < X ≤ 21.33
Sedang
μ 0.5σ < X ≤ μ + 0.5σ
21.33 < X ≤ 26.67
Tinggi
μ + 0.5σ < X ≤ μ + 1.5σ
26.67 < X ≤ 32
Sangat Tinggi
X > μ + 1.5σ
X > 32
Tingkat kategori sangat rendah diperoleh jika
skor kecil sama 16, kategori “rendah” dengan skor
diantara 16 dan 21.33, kategori sedang berada antara
skor 21.33 dan 26.67, kategori tinggi dengan skor
384 Jurnal Teknik Informatika (JUTIF), Vol. 4, No. 2, April 2023, hlm. 381-390
antara 26.67 dan 32, dan kategori sangat tinggi
diatas skor 32.
Selanjutnya pada parameter Willingness to
Learn rentang skor kategorisasi yang diperoleh
dengan acuan nilai mean = 24 dan standar deviasi =
5.33 terlihat pada Tabel 7.
Tabel 7. Skor Kategorisasi pada Parameter Willingness to Learn
Kategorisasi
Norma Kategorisasi
Rentang Skor
Sangat Rendah
X ≤ μ – 1.5σ
X ≤ 16
Rendah
μ 1.5σ < X ≤ μ – 0.5σ
16 < X ≤ 21.33
Sedang
μ 0.5σ < X ≤ μ + 0.5σ
21.33 < X ≤ 26.67
Tinggi
μ + 0.5σ < X ≤ μ + 1.5σ
26.67 < X ≤ 32
Sangat Tinggi
X > μ + 1.5σ
X > 32
Tingkat kategori sangat rendah diperoleh jika
skor kecil sama 16, kategori “rendah” dengan skor
diantara 16 dan 21.33, kategori sedang berada antara
skor 21.33 dan 26.67, kategori tinggi dengan skor
antara 26.67 dan 32, dan kategori sangat tinggi
diatas skor 32.
Berikut pada parameter Personal Relationship
to Others rentang skor kategorisasi yang diperoleh
dengan acuan nilai mean = 24 dan standar deviasi =
5.33 terlihat pada Tabel 8.
Tabel 8. Skor Kategorisasi pada Parameter Personal Relationship
to Others
Kategorisasi
Norma Kategorisasi
Rentang Skor
Sangat Rendah
X ≤ μ – 1.5σ
X ≤ 16
Rendah
μ 1.5σ < X ≤ μ – 0.5σ
16 < X ≤ 21.33
Sedang
μ 0.5σ < X ≤ μ + 0.5σ
21.33 < X ≤ 26.67
Tinggi
μ + 0.5σ < X ≤ μ + 1.5σ
26.67 < X ≤ 32
Sangat Tinggi
X > μ + 1.5σ
X > 32
Skor dibawah 16 berada pada tingkat kategori
sangat rendah, skor antara 16 dan 21.33 ditingkat
rendah, skor 21.33 sampai 26.67 berada ditingkat
sedang, antara 26.67 dan 32 berada ditingkat tinggi
dan diatas skor 32 berada ditingkat sangat tinggi.
Parameter Personal Grow dengan 6 (enam)
item pertanyaan maka diperoleh nilai mean = 18 dan
standar deviasi = 4. Rentang skor kategorisasi yang
diperoleh terlihat pada Tabel 9
Tabel 9. Skor Kategorisasi pada Parameter Personal Growth
Kategorisasi
Norma Kategorisasi
Rentang Skor
Sangat Rendah
X ≤ μ – 1.5σ
X ≤ 12
Rendah
μ 1.5σ < X ≤ μ – 0.5σ
12 < X ≤ 16
Sedang
μ 0.5σ < X ≤ μ + 0.5σ
16 < X ≤ 20
Tinggi
μ + 0.5σ < X ≤ μ + 1.5σ
20 < X ≤ 24
Sangat Tinggi
X > μ + 1.5σ
X > 24
Skor dibawah 12 berada pada tingkat kategori
sangat rendah, skor antara 12 dan 16 ditingkat
rendah, skor 16 sampai 20 berada ditingkat sedang,
antara 20 dan 24 berada ditingkat tinggi dan diatas
skor 24 berada ditingkat sangat tinggi.
Pada parameter Personal Achieve dan
parameter Related Person Support masing-masing
terdapat 3 (tiga) item pertanyaan dengan nilai mean
= 9 dan standar deviasi = 2. Rentang skor
kategorisasi yang diperoleh terlihat pada Tabel 10
dan Tabel 11
Tabel 10. Skor Kategorisasi pada Parameter Personal Achieve
Kategorisasi
Norma Kategorisasi
Rentang Skor
Sangat Rendah
X ≤ μ – 1.5σ
X ≤ 6
Rendah
μ 1.5σ < X ≤ μ – 0.5σ
6 < X ≤ 8
Sedang
μ 0.5σ < X ≤ μ + 0.5σ
8 < X ≤ 10
Tinggi
μ + 0.5σ < X ≤ μ + 1.5σ
10 < X ≤ 12
Sangat Tinggi
X > μ + 1.5σ
X > 12
Tabel 11. Skor Kategorisasi pada Parameter Related Person
Support
Kategorisasi
Norma Kategorisasi
Rentang Skor
Sangat Rendah
X ≤ μ – 1.5σ
X ≤ 6
Rendah
μ 1.5σ < X ≤ μ – 0.5σ
6 < X ≤ 8
Sedang
μ 0.5σ < X ≤ μ + 0.5σ
8 < X ≤ 10
Tinggi
μ + 0.5σ < X ≤ μ + 1.5σ
10 < X ≤ 12
Sangat Tinggi
X > μ + 1.5σ
X > 12
Skor dibawah 6 berada pada tingkat kategori
sangat rendah, skor antara 6 dan 8 ditingkat rendah,
skor 8 sampai 10 berada ditingkat sedang, antara 10
dan 12 berada ditingkat tinggi dan diatas skor 12
berada ditingkat sangat tinggi
Setelah skor dan kategorisasi setiap parameter
diperoleh, kemudian dilanjutkan untuk menghitung
total skor output prediksi dan menentukan
kategorisasi output menggunakan norma kategori 4
tingkat, terlihat pada Tabel 12.
Tabel 12. Skor Kategorisasi pada Output Prediksi
Kategorisasi
Norma Kategorisasi
Rentang Skor
Tidak Siap
X ≤ μ –
X ≤ 138
Diberi Pelatihan
μ 1σ < X ≤ μ
138 < X ≤ 177
Direkomendasikan
μ < X ≤ μ + 1σ
177 < X ≤ 216
Siap berwirausaha
X > μ + 1σ
X > 216
Data yang diperoleh sebanyak 604 data
ditentukan kategorisasi setiap parameter dan output
prediksinya sesuai rentang skor yang diperoleh.
c. Pemrosesan Model
Model machine learning yang dapat digunakan
dalam menemukan pola data, salah satunya adalah
decision tree. Decision tree adalah algoritma yang
umum digunakan untuk mengambil sebuah
keputusan [19]. Decision tree merupakan algoritma
yang baik digunakan untuk klasifikasi atau prediksi
[20]. Decision tree adalah metode klasifikasi yang
melibatkan konstruksi pohon keputusan yang terdiri
dari node keputusan yang dihubungkan dengan
cabang-cabang dari simpul akar (root node) sampai
ke node daun (leaf node)[21]. Algoritma decision
tree yang digunakan pada penelitian ini adalah
algoritma ID3.
Konsep entropi digunakan untuk menentukan
atribut mana yang menjadi root node dan branch
node pada pohon keputusan, Atribut dengan nilai
information gian tertinggi akan terpilih sebagai node
pada decision tree yang dibentuk. Kemudian
menentukan atribut yang akan menjadi internal node
untuk setiap cabang dari parent node, dan membuat
leaf node (simpul keputusan) ketika pemilihan
atribut tidak dapat digunakan lagi.
Dari model decision tree yang terbentuk akan
dilakukan proses pembentukan decision rules model.
Nesi Syafitri, dkk, Machine Learning Untuk Membuat Model Decision Tree 385
Pembentukan rules dilakukan dengan menelusuri
root node melaui branch node hingga mencapai leaf
node. Gambar 4 menunjukkan alur kalkulasi pada
algoritma ID3.
Gambar 4. Alur Kalkulasi ID3
Persamaan yang digunakan dalam algoritma
ID3 ini meliputi:
1) Perhitungan Nilai Entropy
Entropi digunakan sebagai parameter untuk
mengukur heterogenitas (keragaman) suatu sampel
data. Semakin kecil nilai Entropy, semakin baik
digunakan dalam mengekstraksi kelas. Nilai entropi
ditentukan dengan persamaan:
󰇛󰇜 󰇛󰇜
 (1)
dengan Pi menyatakan proposi kelas ke-i pada
output.
2) Perhitungan Nilai Information Gian
Nilai yang diperoleh dari perhitungan entropi
masih belum asli tetapi pengukuran efektivitas
atribut dalam mengklasifikasikan data latih dapat
ditentukan oleh informasi yang telah diperoleh,
Information gian diperoleh dengan persamaan:
󰇛 󰇜 󰇛󰇜
󰇛󰇜

(2)
dimana S adalah kumpulan data pelatihan, A adalah
atribut, n adalah jumlah partisi dalam atribut A, dan
Si adalah jumlah partisi ke-i.
d. Validasi Model
Validitas model untuk mengetahui kinerja dari
model machine learning yang dihasilkan. Untuk
evaluasi model dari decision tree, digunakan
4(empat) jenis evaluasi, yaitu: precision, recall, dan
accuracy. Pengukuran menggunakan Confusion
Matrix dengan tabel yang ditampilkan pada Tabel
13.
abel 13. Confusion Matrix
Kelas
Terklasifikasi
Positif
Terklasifikasi
Negatif
Positif
TP
FN
Negatif
FP
TN
Untuk menghitung precision, recall, dan
accuracy menggunakan persamaan (3), (4), (5).
 
 (3)
 
 (4)
  
 (5)
Confusion matrix sangat berguna untuk
menganalisis kualitas model klasifikasi dalam
mengenali tuple-tuple dari kelas yang ada. TP (True
Positive) dan TN (True Negative) menyatakan
model klasifikasi mengenali tuple dengan benar,
dimana TP adalah data positif yang diprediksi benar,
TN adalah data negative yang diprediksi benar.
Sebaliknya FP (False Positive) dan FN (False
Negative) menyatakan model klasifikasi salah dalam
mengenali tuple. FP adalah data negative namun
diprediksi sebagai data positif, FN adalah data
positif namun diprediksi sebagai data negative.
Accuracy atau tingkat pengenalan menyatakan
persentasse dari jumlah tuple dalam data uji yang
diklasifikasikan dengan benar oleh model
klasifikasi. Precision adalah ukuran kepastian, yaitu
berapa persentase tuple dilabeli sebagai positif
adalah benar pada kenyataanya. Recall adalah
ukuran kelengkapan, yaitu berapa persentase tuple
positif yang dilabeli sebagai positif.
3. HASIL DAN PEMBAHASAN
Penelitian ini menerapkan pendekatan machine
learning dengan menggunakan algoritma decision
tree ID3, dimana data yang digunakan adalah data
yang didapatkan dari hasil kuisioner yang
disebarkan kepada mahasiswa yang berasal dari
perguruan tinggi di wilayah Riau dan mendapatkan
604 data valid. Alat bantu yang dipilih penulis
dalam membentuk decision tree menggunakan
RapidMiner.
3.1. Proses Pengolahan Data
Data kuisioner yang sudah terkumpul sebanyak
604 data, selanjutnya diolah untuk diskoring
berdasarkan nilai skala dari jawaban responden.
Data skoring kuisioner terlihat pada Gambar 2:
Gambar 2. Data Skoring Kuisioner
Data skoring kuisioner kemudian akan
dilakukan kategorisasi setiap parameter dengan
mengacu pada skala norma kategorisasi di Tabel 2.
Hasil kategorisasi setiap parameter dapat dilihat
pada Gambar 3. Data inilah selanjutnya digunakan
pada tahap pembentukan model machine learning.
386 Jurnal Teknik Informatika (JUTIF), Vol. 4, No. 2, April 2023, hlm. 381-390
Gambar 3. Data Hasil Kategorisasi
3.2. Proses Pemodelan Decision Tree
Pembentukan decision tree menggunakan
algoritma ID3 dengan melibatkan 2 teknik yang
berbeda. Pada penelitian ini diuji 2 teknik sebagai
perbandingan, khususnya dari sisi akurasi. Model
pertama dibuat sebuah decision tree dengan teknik
unpruning, model kedua menggunakan teknik
pruning.
Dengan menggunakan data training sebanyak
604, decision tree model pruning yang terbentuk
menghasilkan 180 decision rules dengan node akar
yang terpilih pada parameter “Willingness to Learn”.
Susunan decision rules yang dihasilkan dari decision
tree pruning dapat dilihat pada Gambar 5.
Gambar 5. Decision Rule dari Decision Tree Prunning
Gambar 6. Decision Rule dari Decision Tree Unprunning
Berdasarkan Gambar 6, decision tree model
unpruning menghasilkan 121 rules dengan node akar
yang terpilih juga sama pada parameter “Willingness
to Learn”.
3.3. Proses Validasi Model Decision Tree
Bagian ini menjelaskan pengujian decision tree
dengan teknik unpruning dan teknik pruning. Setiap
model dilakukan pengujian dengan skenario: 1) Use
Training Test yaitu mengevaluasi seberapa baik
algoritma mampu memprediksi kelas dari instance
setelah dilakukan pelatihan, dimana data uji yang
digunakan sama dengan data pelatihan, 2)
Percentage Split yaitu mengevaluasi seberapa baik
algoritma mampu memprediksi data, dimana
jumlah data pelatihan dan data uji dibagi sesuai
persentase yang digunakan.
1. Perbandingan Decision Tree Pruned dan
Unpruned pada Mode Use Training Test
Pada mode ini dilakukan pengujian dengan
data set sejumlah 404, 504 dan 604 data akan
dijadikan data training dan data testing. Hasil dari
mode pengujian diharapkan akan mencapai nilai
tingkat akurasi yang besar hingga mencapai 100%,
dikarenakan data pelatihan dan data uji yang
digunakan adalah data yang sama. Hasil dari mode
pengujian ini dapat dilihat pada Tabel 14.
Tabel 14. Hasil Perbandingan Pruned dan Unpruned Tree pada
Mode Use Training Test
Tree
Jml
Sampel
Akurasi
(%)
Recall
(%)
Precis
io (%)
Pruned
604
99.50
99.69
99.72
504
99.50
99.69
99.72
404
99.26
99.56
99.55
Unpruned
604
89.11
81.56
88.57
504
91.09
85.41
88.35
404
90.35
85.51
87.28
Pada Tabel 14 memperlihatkan bahwa model
decision tree yang telah mengalami pemangkasan
(pruning) menghasilkan nilai akurasi, recall dan
precision yang lebih baik. Dimana hampir semua
data terprediksi secara tepat dengan nilai akurasi
diatas 99%. Begitu juga halnya dengan nilai recall
dan precision.
2. Perbandingan Decision Tree Pruned dan
Unpruned pada pengujian Mode Percentage
Split
Pada mode ini dilakukan pengujian dengan
data set sebanyak 404, 504 dan 604 dengan split
data training sebesar 90% dan 80% dari data set.
Hasil dari pengujian mode ini seperti terlihat pada
Tabel 15.
Dari Tabel 15 menunjukkan pada model
decision tree yang mengalami pruned, tingkat
akurasi, recall dan precision lebih tinggi pada
kondisi split data 90% dibandingkan menggunakan
split data 80%. Dari pengujian diperoleh rata-rata
tingkat akurasi pada decision tree pruned adalah
82.87% sedangkan pada decision tree unpruned
adalah 80.38%.
Nesi Syafitri, dkk, Machine Learning Untuk Membuat Model Decision Tree 387
Tabel 15. Hasil Perbandingan Pruned dan Unpruned Tree pada
Mode Percentage Split
Tree
Jml
Sam
ple
Split
Data
Training
(%)
Akurasi
(%)
Precisi
on (%)
Pruned
604
90
83.61
71.61
80
79.17
54.92
504
90
88.24
86.02
80
87.00
64.73
404
90
80.49
82.99
80
78.75
59.00
Unpruned
604
90
80.33
78.27
80
81.67
59.38
504
90
82.35
81.60
80
80.00
58.37
404
90
82.93
84.55
80
75.00
54.22
4. DISKUSI
Penelitian ini dibuat berdasarkan pengalaman
peneliti sebelumnya yang sudah pernah melakukan
penelitian yang menghasilkan beberapa sumber teori
hasil atau analisis.
Pada penelitian terdahulu oleh Mohammad
Naufala Bairat, Roswan Latuconsina, Casi
Setianingsih dengan judul ”Perancangan dan
Implementasi Tes Psikologi Myers-Briggs type
Indicator (MBTI) Berbasis Komputer Dengan
Metode Decision Tree”. Tes psikologi Myers-Briggs
Type Indicator (MBTI) yang berfungsi untuk
mengetahui kecerdasan individu dan tipe
kepribadian seseorang melalui beberapa aspek pada
Myers-Briggs Type Indicator (MBTI). Penelitian ini
membahas tentang perancangan dan implementasi
tes psikologi berbasis komputer yang berdasarkan
pada teori kepribadian Myers-Briggs Type Indicator
(MBTI) dengan menggunakan metode Decision Tree
sebagai pengambilan keputusan penilaian tes. Hasil
pengujian akhir yang dilakukan nilai akurasi yang
didapat dari metode decision tree sesuai dataset
adalah 50%. Aplikasi tersebut mendapatkan 100%
dari total 6 pengujian alpha dan 58,6% dari
pengujian usability[22].
Suryadi Syamsu, Muhajirin dan Nyoman Suta
Wijaya dengan judul Rules Generation untuk
Klasifikasi Data Bakat dan Minat Berdasarkan
Rumpun Ilmu Dengan Decision Tree”, Penelitian ini
bertujuan untuk merancang aplikasi dan
mengimplementasikan Rules Generation untuk
klasifikasi data bakat dan minat berdasarkan rumpun
ilmu dengan decision tree. Data ini diperoleh
melalui penelitian dalam bentuk kuesioner pada
objek penelitian dan pustaka. Data dianalisa dengan
data bakat dan minat yang berasal dari ilmu
psikologi ialah Tes IST (Intelligenz Struktur Test)
merupakan salah satu tes psikologi untuk mengukur
tingkat intelegensi seseorang. Hasil penelitian ini
menunjukkan bahwa Implementasi Rules Generation
terhadap Decision Tree (RGFDT) penelitian tentang
penentuan jurusan seseorang yang menggunakan
algoritma C4.5 dapat mengatasi cabang-cabang
pohon keputusan yang tidak relevan menjadi
relevan, sehingga dalam mengimplementasi ke
dalam bahasa pemrograman dapat lebih mudah
diterjemahkan., dan aplikasi tes bakat dan minat
dapat berjalan dengan baik dan memudahkan
responden dalam melakukan tes bakat dan minat
dengan mudah[23].
M A Abdillah, Arief Setyanto, Sudarmawan
dengan judul Implementasi Decision Tree
Algoritma C4.5 Untuk Memprediksi Kesuksesan
Pendidikan Karakter”. Perancanangan kurikulum
Pendidikan Karakter dalam sistem pendidikan di
Indonesia, adalah sesuatu hal yang baru dan belum
banyak dikaji dalam penelitian Educational Data
Mining (EDM). Sebagian besar penelitian dalam
ranah EDM masih menggunakan faktor kognitif
dalam penilaiannya, berbeda dengan pendidikan
karakter yang lebih berorientasi kepada pengajaran
nilai-nilai karakter, serta mempertimbangkan latar
belakang peserta didik. Oleh karena itu, diperlukan
cara atau metode untuk mengidentifikasi calon
peserta didik, serta memprediksi kesuksesannya
dalam sistem pendidikan karakter. Algoritma C4.5
dapat digunakan untuk melakukan prediksi dan
klasifikasi terhadap calon siswa dengan cara
membuat pohon keputusan berdasarkan data-data
yang sudah ada dan melakukan prediksi terhadap
calon siswa baru, dalam penelitian ini peneliti
menggunakan data mahasiswa Unires Yogyakarta
sebagai objek penelitian. Dengan penelitian ini, juga
diharapkan dapat diketahui tingkat akurasi Decision
Tree Algoritma C.45 dalam mengukur pengaruh
atribut-atribut latar belakang siswa tersebut terhadap
kesuksesan pendidikan karakter, sehingga akan
diketahui apakah Decision Tree Algoritma C.45
memenuhi aspek reliabilitas dan validitas sebagai
alat ukur kesuksesan pendidikan karakter. Dari hasil
pengukuran, diketahui bahwa kombinasi atribut
Bidang Bahasa dan Sosial, Latar belakang
pendidikan agama dan orang tua yang menjadi
seorang pendidik/guru, serta kemampuan untuk
membaca Al-Qur’an berkorelasi positif terhadap
kesuksesan pendidikan karakter. Nilai accuracy
sebesar 60,91%, menunjukkan bahwa algoritma
decision tree C4.5 layak digunakan untuk melakukan
prediksi tingkat kesuksesan pada pendidikan
karakter[24].
5. KESIMPULAN
Tujuan dilakukan penelitian ini untuk
menemukan decision rule terbaik dari decision tree
model yang memiliki tingkat akurasi lebih baik.
Hasil yang didapatkan dari penelitian ini
menunjukan decision tree model prunning memiliki
tingkat akurasi 99.5%, nilai recall 99.69% dan nilai
precision 99.72%. Sedangkan decision tree model
unprunning memiliki tingkat akurasi 89.11%, nilai
recall 81.56% dan nilai precision 88.57%. Dari hasil
penelitian dapat disimpulkan bahwa decision tree
model prunning menghasilkan nilai akurasi yang
lebih tinggi dari pada decision tree model
388 Jurnal Teknik Informatika (JUTIF), Vol. 4, No. 2, April 2023, hlm. 381-390
unprunning. Dari decision tree model prunning
diperoleh 180 decision rules, sedangkan decision
tree model unprunning menghasilkan 121 rules. Dari
hasil kesimpulan yang didapat, maka decision rule
model yang terbentuk dapat digunakan untuk
pengembangan Alat/aplikasi konseling berbasis AI
nantinya.
UCAPAN TERIMA KASIH
Penulis mengucapkan terima kasih banyak
kepada Universitas Islam Riau yang telah mendanai
penelitian dan publikasi ini, serta terima kasih atas
Kerjasama dan bantuan tim peneliti yang terlibat
dalam penyelesaian penelitian ini.
DAFTAR PUSTAKA
[1] S. Farradinna and T. N. Fadhlia,
“Entrepreneurial personality in predicting
self-regulation on small and medium business
entrepreneurs in pekanbaru, riau, indonesia,”
J. Mgt. Mkt. Rev., vol. 3, no. 1, pp. 3439,
2018.
[2] S. Farradinna, T. N. Fadhlia, and D.
Azmansyah, “Psychological resilience
predicted by personality traits, locus of
control and self-regulation of young
entrepreneurs in Pekanbaru,” Glob. J. Bus.
Soc. Sci. Rev., vol. 7, no. 1, p. 1, 2019.
[3] W. Rokhman and F. Ahamed, “The role of
social and psychological factors on
entrepreneurial intention among Islamic
college students in Indonesia,” Entrep. Bus.
Econ. Rev., vol. 3, no. 1, p. 30, 2015.
[4] C. Xu and Z. Zhang, “The Effect of Law
Students in Entrepreneurial Psychology
Under the Artificial Intelligence
Technology,” Front. Psychol., vol. 12, p.
731713, 2021.
[5] T. Goto, C. A. Camargo, M. K. Faridi, R. J.
Freishtat, and K. Hasegawa, “Machine
learningbased prediction of clinical
outcomes for children during emergency
department triage,” JAMA Netw. open, vol. 2,
no. 1, pp. e186937e186937, 2019.
[6] W. Bleidorn and C. J. Hopwood, “Using
machine learning to advance personality
assessment and theory,” Personal. Soc.
Psychol. Rev., vol. 23, no. 2, pp. 190203,
2019.
[7] R. Alharthi, B. Guthier, and A. El Saddik,
“Recognizing human needs during critical
events using machine learning powered
psychology-based framework,” IEEE Access,
vol. 6, pp. 5873758753, 2018.
[8] M. Savci, A. Tekin, and J. D. Elhai,
“Prediction of problematic social media use
(PSU) using machine learning approaches,”
Curr. Psychol., pp. 110, 2020.
[9] J. D. Elhai and C. Montag, “The
compatibility of theoretical frameworks with
machine learning analyses in psychological
research,” Curr. Opin. Psychol., vol. 36, pp.
8388, 2020.
[10] J. D. Elhai, H. Yang, D. Rozgonjuk, and C.
Montag, “Using machine learning to model
problematic smartphone use severity: The
significant role of fear of missing out,”
Addict. Behav., vol. 103, p. 106261, 2020.
[11] M. H. Afzali et al., “Machine‐learning
prediction of adolescent alcohol use: A
cross‐study, cross‐cultural validation,”
Addiction, vol. 114, no. 4, pp. 662671, 2019.
[12] R. Dave, K. Sargeant, M. Vanamala, and N.
Seliya, “Review on Psychology Research
Based on Artificial Intelligence
Methodologies,” J. Comput. Commun., vol.
10, no. 5, pp. 113130, 2022.
[13] R. Jacobucci, A. K. Littlefield, A. J. Millner,
E. Kleiman, and D. Steinley, “Pairing
machine learning and clinical psychology:
how you evaluate predictive performance
matters,” 2020.
[14] D. B. Dwyer, P. Falkai, and N. Koutsouleris,
“Machine learning approaches for clinical
psychology and psychiatry,” Annu. Rev. Clin.
Psychol., vol. 14, pp. 91118, 2018.
[15] A. Lavecchia, “Machine-learning approaches
in drug discovery: methods and applications,”
Drug Discov. Today, vol. 20, no. 3, pp. 318
331, 2015.
[16] Z.-H. Zhou, Machine learning. Springer
Nature, 2021.
[17] B. Mahesh, “Machine learning algorithms-a
review,” Int. J. Sci. Res. (IJSR).[Internet],
vol. 9, pp. 381386, 2020.
[18] A. Venkatasubramaniam, J. Wolfson, N.
Mitchell, T. Barnes, M. JaKa, and S. French,
“Decision trees in epidemiological research,”
Emerg. Themes Epidemiol., vol. 14, no. 1, pp.
112, 2017.
[19] F. Y. Pamuji and V. P. Ramadhan,
“Komparasi Algoritma Random Forest dan
Decision Tree untuk Memprediksi
Keberhasilan Immunotheraphy,” J. Teknol.
dan Manaj. Inform., vol. 7, no. 1, pp. 4650,
2021.
[20] U. I. Lestari, A. Y. Nadhiroh, and C. Novia,
“Penerapan Metode K-Nearest Neighbor
Untuk Sistem Pendukung Keputusan
Identifikasi Penyakit Diabetes Melitus,”
JATISI (Jurnal Tek. Inform. dan Sist.
Informasi), vol. 8, no. 4, pp. 20712082,
2021.
[21] E. Muningsih, Kombinasi Metode K-Means
Dan Decision Tree Dengan Perbandingan
Kriteria Dan Split Data,” J. Teknoinfo, vol.
16, no. 1, pp. 113118, 2022.
Nesi Syafitri, dkk, Machine Learning Untuk Membuat Model Decision Tree 389
[22] A. R. Rabbani, M. Nasrun, and C.
Setianingsih, “Perancangan Dan
Implementasi Tes Psikologi Myers-briggs
Type Indicator Berbasis Komputer Dengan
Metode Naï ve Bayes Sebagai
Pengambilan Keputusan,” eProceedings
Eng., vol. 7, no. 1, 2020.
[23] S. Syamsu, M. Muhajirin, and N. S. Wijaya,
“Rules Generation Untuk Klasifikasi Data
Bakat dan Minat Berdasarkan Rumpun Ilmu
Dengan Decision Tree,” Inspir. J. Teknol. Inf.
dan Komun., vol. 9, no. 1, pp. 4051, 2019.
[24] M. A. Abdillah, A. Setyanto, and S.
Sudarmawan, “Implementasi Decision Tree
Algoritma C4. 5 Untuk Memprediksi
Kesuksesan Pendidikan Karakter,” Respati,
vol. 15, no. 2, pp. 5969, 2020.
390 Jurnal Teknik Informatika (JUTIF), Vol. 4, No. 2, April 2023, hlm. 381-390
... In recent years, psychology has increasingly explored the use of AI to predict and classify various phenomena. For example, AI has been employed to assess pain levels from brain scans [2], analyze personality traits using machine learning techniques [3], predict harmful social media use [4], [5], and support the diagnosis and prognosis of mental illnesses and disorders [6]. It is also used to detect depression levels, evaluate the risk of suicidal and selfharming behaviors [6], and aid in suicide prevention efforts [7]. ...
... Experts are continuously working on developing various tools to measure psychological readiness and are beginning to innovate using advanced technologies. One notable advancement is the application of artificial intelligence (AI), including machine learning models, to assess entrepreneurial readiness among college graduates [5]. AI technology not only aids in predicting social and psychological readiness to start a business, but it also delivers a level of assurance in the forecasts made. ...
... The EPR-33 is designed to assess an individual's psychological and social readiness to determine their preparedness for entrepreneurship. It evaluates eight parameters, with responses to the 33 question items recorded on a five-point Likert scale: Strongly Disagree (1), Disagree (2), Undecided (3), Agree (4), and Strongly Agree (5). A detailed description of the eight parameters and their corresponding question items is provided in Table 1. ...
Article
Full-text available
Machine learning has become an exciting topic in psychology-related research, one of which is counseling psychological readiness for entrepreneurship. An intelligent application developed using a machine learning model to assist the counseling process in measuring a person's psychological readiness for entrepreneurship. This application was generated using the Entrepreneurship Psychological Readiness (EPR) instrument. In this study, to get the most suitable machine learning model, a comparison of 2 (two) machine learning models, namely, Naïve Bayesian (NB) and k-Nearest Neighbor (k-NN), involving 1095 training data. There are 4 (four) prediction classes recommended from the results of counseling: categories not ready for entrepreneurship, given training, guided, and prepared for entrepreneurship. The EPR instrument consists of 33 question items to measure 8 (eight) parameters used as inputs for the prediction process. The data has been randomized, and the experiment has been repeated 5 (five) times to check the consistency of performance of all techniques. 80% of the data was used as training data, and the other 20% was used as testing data. The results of the five (5) trials show that the Naïve Bayesian model provides the most consistent results in predicting a person's psychological readiness for entrepreneurship, with 89.58% accuracy, in testing. Therefore, the Naïve Bayesian model is recommended to be used in psychological counseling to predict a person's readiness for entrepreneurship
... Nilai Entropi mengacu pada ukuran seberapa acak atau tidak terduga suatu pesan atau informasi [34] [35]. Semakin tinggi nilai entropi, semakin tidak terduga atau acak pesan tersebut, sedangkan nilai entropi yang rendah menunjukkan bahwa pesan tersebut lebih dapat diprediksi [36]. ...
Article
Maintaining the confidentiality and integrity of electronic documents is essential in the modern digital age. In the contemporary digital world, digital signatures are essential for safeguarding and legalizing electronic documents. The current issue, however, goes beyond digital signatures and instead centers on enhancing security and data integrity. Therefore, RSA and AES-128 super-encryption is required in QR-code-based digital signature techniques for document legalization. This research stage entails constructing a super encryption algorithm, testing it experimentally for security and performance, and designing a digital signature system using RSA and AES-128 super encryption. The results of this research show that the use of RSA and AES super encryption has been proven to have better performance in data security, where the encryption and decryption process time is relatively close to the RSA encryption time, and the comparison of entropy values is better than RSA and AES-128. So, the combination of Super RSA and AES-128 encryption can increase the security level of electronic documents and reduce the risk of hacking. Moreover, the proposed QR-code-based digital signature scheme is also very efficient regarding file size and processing time.
... The accuracy value is the proportion to the number of correct predictions [7]. The following is the accuracy formula: Accuracy = "#$"% "#$"%$&%$&# (6) Information: TP : True Positive; the amount of data is correct and predicted correctly. ...
Article
Full-text available
INTISARIPencanangan kurikulum Pendidikan Karakter dalam sistem pendidikan di Indonesia, adalah sesuatu hal yang baru dan belum banyak dikaji dalam penelitian Educational Data Mining (EDM). Sebagian besar penelitian dalam ranah EDM masih menggunakan faktor kognitif dalam penilaiannya, berbeda dengan pendidikan karakter yang lebih berorientasi kepada pengajaran nilai-nilai karakter, serta mempertimbangkan latar belakang peserta didik. Oleh karena itu, diperlukan cara atau metode untuk mengidentifikasi calon peserta didik, serta memprediksi kesuksesannya dalam sistem pendidikan karakter. Algoritma C4.5 dapat digunakan untuk melakukan prediksi dan klasifikasi terhadap calon siswa dengan cara membuat pohon keputusan berdasarkan data-data yang sudah ada dan melakukan prediksi terhadap calon siswa baru, dalam penelitian ini peneliti menggunakan data mahasiswa Unires Yogyakarta sebagai objek penelitian. Dengan penelitian ini, juga diharapkan dapat diketahui tingkat akurasi Decision Tree Algoritma C.45 dalam mengukur pengaruh atribut-atribut latar belakang siswa tersebut terhadap kesuksesan pendidikan karakter, sehingga akan diketahui apakah Decision Tree Algoritma C.45 memenuhi aspek reliabilitas dan validitas sebagai alat ukur kesuksesan pendidikan karakter. Dari hasil pengukuran, diketahui bahwa kombinasi atribut Bidang Bahasa dan Sosial, Latar belakang pendidikan agama dan orang tua yang menjadi seorang pendidik/guru, serta kemampuan untuk membaca Al-Qur’an berkorelasi positif terhadap kesuksesan pendidikan karakter. Nilai accuracy sebesar 60,91%, menunjukkan bahwa algoritma decision tree C4.5 layak digunakan untuk melakukan prediksi tingkat kesuksesan pada pendidikan karakter. Namun masih butuh banyak kajian mendalam terutama dalam menentukan atribut-atribut yang memang benar-benar mempengaruhi kesuksesan pendidikan karakter sehingga diharapkan akan didapat accuracy yang lebih baik, serta terjadi efisiensi dalam pengelompokan atribut. Kata kunci— data mining, klasifikasi, Decision Tree ,Algoritma C4.5, prediksi kelulusan, pendidikan karakter. ABSTRACTThe launching of the Character Education curriculum in the education system in Indonesia, is something new and has not been much studied in Educational Data Mining (EDM) research. Most of the research in the realm of EDM still uses cognitive factors in its assessment, in contrast to character education which is more oriented towards teaching character values, and taking into account the background of students. Therefore, we need a way or method to identify potential students, and predict their success in the character education system. C4.5 algorithm can be used to make predictions and classifications of prospective students by making a decision tree based on existing data and predicting new prospective students, in this study the researchers used the data of Yogyakarta Unires students as research objects. With this research, it is also expected to know the accuracy of the Decision Tree Algorithm C.45 in measuring the influence of the background attributes of these students on the success of character education, so it will be known whether the Decision Tree C.45 algorithm meets the aspects of reliability and validity as a measure of success character building. From the measurement results, it is known that the combination of attributes of Language and Social Affairs, the background of religious education and parents who become educators/teachers, and the ability to read Al-Qur'an are positively correlated to the success of character education. Accuracy value of 60.91%, shows that the decision tree C4.5 algorithm is feasible to uses to predict success rates in character education. But it still needs a lot of in-depth study, especially in determining the attributes that really affect the success of character education so that it is expected to get better accuracy, and efficiency in the grouping of attributes.Keywords - data mining, classification, Decision Tree, C4.5 algorithm5, graduation prediction, character education.
Article
Full-text available
Data mining merupakan suatu proses mencari pola atau menarik informasi data besar dan terpilih menggunakan teknik atau metode tertentu. Metode K-Means dan Decision Tree merupakan bagian dari teknik Data Mining . Penelitian ini akan mengkombinasikan metode K-Means untuk melakukan clustering data menjadi 3 cluster kemudian hasil dari clustering akan di klasifikasi menggunakan Metode Decision Tree dengan perbandingan kriteria Gain Ratio, Information Gain dan Gini Index. Data yang diolah di bagi (split) menjadi 2 yaitu data training dan data testing dengan prosentase 70:30, 80:20 dan 90:10. Hasil dari penelitian untuk menemukan kriteria mana yang menghasilkan pohon keputusan dan performa terbaik berdasarkan nilai akurasi tertinggi dari masing-masing kelompok data. Data diambil dari Repository UCI dengan jumlah 811 record dan 52 atribut . Dari pengolahan data yang dilakukan diketahui Untuk split data 70:30, nilai akurasi dengan kriteria Gain Ratio, Information Gain dan Gini Index mendapatkan nilai sama yaitu 97,53. Kriteria Gain Ratio dan Gini Index menghasilkan nilai akurasi tertinggi yaitu 98,15% untuk split data 80:20. Sedangkan Information Gain mendapat nilai akurasi tertinggi 98,77% untuk split data 90:10.
Article
Full-text available
Diabetes melitus merupakan penyakit tidak menular (PTM) yang telah menyebar ke seluruh dunia. Faktor yang dapat menyebabkan seseorang menderita diabetes melitus diantaranya tekanan darah tinggi, obesitas, riwayat penyakit diabetes melitus dalam keluarga, usia, serta pola hidup dan diet tidak sehat. Faktor lain yang menjadi pemicu tingginya tingkat kematian akibat diabetes melitus adalah lambatnya diagnosa karena jumlah tenaga medis yang sedikit terutama di kota kecil. Beberapa uji klinis harus dilakukan untuk mengetahui seseorang terjangkit penyakit diabetes melitus atau tidak, proses uji klinis tersebut memakan waktu yang tidak sebentar. Berdasarkan permasalahan tersebut, maka dibuat sebuah sistem pendukung keputusan untuk identifikasi penyakit diabetes melitus dengan menggunakan metode klasifikasi K-Nearest Neighbor (KNN) dengan 8 variabel yaitu jumlah kehamilan, kadar glukosa, tekanan darah, ketebalan lipatan kulit trisep, insulin, index masa tubuh (IMT), riwayat penyakit diabetes mellitus dalam keluarga, serta usia. Berdasarkan implementasi dan pengujian, dengan nilai k=23 didapatkan tingkat akurasi sebesar 0.96 atau 96%, tingkat akurasi tersebut dinilai cukup tinggi sehingga penelitian ini dinilai telah berhasil menerapkan metode KNN untuk sistem pendukung keputusan identifikasi penyakit diabetes melitus sejak dini.
Article
Full-text available
With the increasingly serious employment situation in China, the government and schools encourage college students to start businesses to alleviate employment pressure. College student's successful entrepreneurship depends on national preferential policies, social support, and, most importantly, their healthy and solid psychological quality and entrepreneurial psychological quality. The purpose is to understand the entrepreneurial psychology of college students and study the entrepreneurial psychological effect. Firstly, the four aspects of entrepreneurial psychology are summarized, including entrepreneurial awareness, entrepreneurial volition, entrepreneurial ability, and entrepreneurial personality. Secondly, the research status of college students' entrepreneurial psychology is reviewed, and the existing problems are pointed out. Thirdly, the combined model of wavelet transform and Neural Network (NN) is proposed, and the feasibility of the proposed model is evaluated through the analysis of college students' entrepreneurial psychology. The wavelet NN is used in experimental design to predict college students' entrepreneurial psychology, and the predicted results are compared with the actual value. From the perspective of the prediction results of entrepreneurial psychology, the combination of wavelet algorithm and neural network is more accurate for entrepreneurial psychology prediction and evaluation results of law students. Overall, the difference between the predicted value and the actual value is within 0.3 points, which is relatively stable. According to the analysis of single-factor results, the scores of students of different majors in the four dimensions of entrepreneurial psychology are all higher than 3.5, but there is no significant difference among the four dimensions (P > 0.05), indicating that the major has no significant impact on entrepreneurial psychology; law students with different educational backgrounds have significant differences in entrepreneurial psychology (P < 0.05), among which students with a master's degree have the strongest entrepreneurial will, while doctoral students have the lowest entrepreneurial will; in terms of entrepreneurial psychological capital, men's self-efficacy is higher than women's, and the difference is significant (P < 0.05). The difference between males and females in the scores of entrepreneurial psychological factors' four aspects is not very obvious. In terms of entrepreneurial psychological capital, males' self-efficacy is significantly higher than females' (P < 0.05). Artificial Intelligence (AI) technology has great application prospects in the prediction and evaluation of college students' entrepreneurial psychology, and college students' entrepreneurial psychology is highly correlated with gender and education.
Article
Full-text available
Menjaga kesehatan merupakan tugas pada diri kita sendiri sebagai manusia, dengan tubuh yang sehat kita dapat melakukan aktifitas dan produktifitas kita sehari-hari. Kesehatan adalah keadaan seimbang yang dinamis, dipengaruhi faktor genetik, lingkungan dan pola hidup sehari-hari seperti makan, minum, kerja, dan istirahat. Immunotherapy merupakan metode pengobatan untuk mengobati penyakit kanker kulit yang dimana metode ini meningkatkan sistem kekebalan tubuh untuk mengatasi penyakit kutil. Immunotherapy merupakan pengobatan efektif untuk penyakit kutil. Metode ini memiliki respon yang lebih baik membutuhkan lebih sedikit sesi, dan mampu mengobati kutil yang sudah lama. Berdasarkan hasil pengujian metode Random Forest dan Decision Tree terhadap prediksi keberhasilan pengobatan imunoterapi untuk penyakit kutil menggunakan bahasa Python, maka dapat diambil kesimpulan bahwa hasil pengujian metode Decision Tree masih terdapat prediksi yang tidak tepat dengan tingkat akurasi 84,4 % kemudian metode Random Forest prediksinya tepat dengan tingkat akurasi 85,5 %. Hasil pengujian tersebut menunjukkan bahwa metode Random Forest merupakan metode yang lebih unggul dibandingkan dengan metode Decision Tree.
Article
Full-text available
Objective - The present study was conducted to describe the psychological state of the entrepreneur in the utilization of resource potential and business development, and to identify the personality factors that most influence self-regulation in SMEs entrepreneurs. Methodology/Technique - This study was performed using a measurement scale in order to test the response of the personality factors and self-regulation of entrepreneurs of SMEs in Pekanbaru, Riau. The sample included 152 entrepreneurs of SMEs. Regression analysis was been applied to test the influence of the personality factors contributing towards self-regulation. In addition, descriptive response analysis is used to describe the response shown by the participants regarding the variables measured. Findings – The analysis shows that personality factors (openness to experience, conscientiousness, extraversion, agreeableness) have a significant effect on self-regulation in entrepreneurs in Pekanbaru City. The results also show that the personality factor neuroticism does not have a significant effect on self-regulation in entrepreneurs of SMEs in Pekanbaru, Riau. Novelty - SMEs in Indonesia hold the potential for increasing economic growth. Despite this, the Central Bureau of Statistics has recorded a decrease in the number of new SMEs from 2011 to 2014. Type of Paper - Empirical. Keywords: Entrepreneurial Personality; Self-Regulation; Small and Medium Business Entrepreneurs. JEL Classification: L20, L26; L29.
Article
Full-text available
In this study, problematic social media use (PSU) was modeled using machine learning with artificial neural networks (ANN) and support vector machines (SVM). Fifteen predictor variables were examined in predicting PSU, including social media usage habits (frequency of daily social media use, history of social media usage, frequency of checking social media accounts, number of shares on social media, and number of social media accounts), desire for being liked, envy of the life of others, narcissistic personality traits (exhibitionism, grandiose fantasies, manipulativeness, thrill-seeking, narcissistic admiration and narcissistic rivalry), fear of missing out (FOMO), and online socialization. The present study comprised 309 (208 females and 101 males) university students. Using ANN and SVM, estimation was performed using k-folds (k = 5) cross validation. Results demonstrated a large relationship between predictors and PSU scores. Estimation rates with ANN and SVM were each .61. Then we used forward selection procedures to determine variable importance. We found that frequency of daily social media use, frequency of checking social media accounts, desire for being liked, exhibitionism and FOMO were the five most important variables in association with PSU severity. Finally, we analyzed the extent to which these five variables predicted PSU, finding that the estimate with five variables had a higher coefficient of estimation than with the fifteen variables. Prediction rates for the five variables were .62 using ANN and .63 using SVM. Results demonstrate that several psychological and social media-related variables were important in modeling PSU severity.
Article
Full-text available
Objective - Entrepreneurs are one of the important contributors to increasing non-agricultural economic income and developing micro, small and medium enterprises. In Indonesia, entrepreneurial orientation has empirically proven that psychological factors affect individuals in improving the economy of society. The concept of psychological resilience as the development of models to predict the events and situations of failure. In certain circumstances difficulties cannot be avoided, a person with psychological resilience is able to reduce the problem by creating a new situation. Individuals who have strong personality characteristics thought to be one important factor in the process of creation and development of enterprises. Methodology/Technique - The scale used in this study consisted of a scale big five personality (Openness) McCrae & Costa (2004), The Self-Regulation Questionnaire (SRQ) by Brown et al (1999), The Work Locus of Control Scale (WLCS) by Spector (1988) as modified by Spector (2004), and Connor-Davidson Resilience Scale (CD-RISC) compiled by Connor & Davidson (2003) as modified by Manzano and Ayala (2013). A total of 238 micro businesses have voluntarily participated. Findings - The results of path analysis showed that the openness personality directly (β = 0.131) was significantly associated with resilience. Similarly, the personality trait through self-regulation shows indirect influence on resilience (p1 p3 0.027 x 0.175 = 0.0047) significantly. Novelty - The contributions of personality openness and self-regulation of the resilience of 0.136 or 13.6%. It can be concluded that indirectly associated the entrepreneur's psychological resilience of the personality trait through self-regulation significantly. Type of Paper - Empirical. Keywords: Personality Traits; Locus of Control; Self-regulation; Entrepreneurs; Psychological Resilience. JEL Classification: M50, M59.
Article
Supervised machine learning has been increasingly used in psychology and psychiatry research. Machine learning offers an important advantage over traditional statistical analyses: statistical model training in example data to enhance predictions in external test data. Additional advantages include advanced, improved statistical algorithms, and empirical methods to select a smaller set of predictor variables. Yet machine learning researchers often use large numbers of predictor variables, without using theory to guide variable selection. Such approach leads to Type I error, spurious findings, and decreased generalizability. We discuss the importance of theory to the psychology field. We offer suggestions for using theory to drive variable selection and data analyses using machine learning in psychological research, including an example from the cyberpsychology field.