Conference PaperPDF Available

PEMILIHAN MODEL REGRESI BERNOULLI TERBAIK

Authors:

Abstract

Regresi Bernoulli merupakan model regresi yang dapat menjelaskan hubungan antara variabel dependen kategorik dan satu atau lebih variabel independen. Penelitian ini bertujuan mengkaji pemilihan model regresi Bernoulli terbaik menggunakan metode Akaike’s Information Criterion (AIC), Corrected AIC (AICc), Bayesian Information Criterion (BIC). Ketiga metode ini berhubungan dengan metode Maximum Likelihood Estimation (MLE) yang digunakan untuk estimasi parameter model regresi Bernoulli. Berdasarkan hasil kajian empiris pada data Indeks Pembangunan Kesehatan Masyarakat (IPKM) kabupaten/kota di Pulau Kalimantan, metode AIC menghasilkan nilai terkecil dibanding metode AICc dan BIC untuk semua model yang dibandingkan. Model regresi Bernoulli terbaik untuk data IPKM berdasarkan nilai AIC, AICc, dan BIC terkecil adalah model dengan variabel independennya adalah produk domestik regional bruto per kapita.
Prosiding Seminar Nasional Matematika, Statistika, dan Aplikasinya
Terbitan II, Mei 2022, Samarinda, Indonesia e-ISSN: 2657-232X
1
COVER
Prosiding Seminar Nasional Matematika, Statistika, dan Aplikasinya
Terbitan II, Mei 2022, Samarinda, Indonesia e-ISSN: 2657-232X
i
PROSIDING
SEMINAR NASIONAL MATEMATIKA, STATISTIKA,
DAN APLIKASINYA
Jurusan Matematika
Fakultas Matematika dan Ilmu Pengetahuan Alam,
Universitas Mulawarman, Samarinda, Kalimantan Timur
Ruang lingkup:
Matematika
Statistika
Pendidikan Matematika
Statistika Terapan
Matematika Terapan
Penerbit:
Jurusan Matematika
Fakultas Matematika dan Ilmu Pengetahuan Alam
Universitas Mulawarman
Jalan Barong Tongkok No. 4 Kampus Gunung Kelua
Samarinda Kalimantan Timur 75123
Prosiding Seminar Nasional Matematika, Statistika, dan Aplikasinya
Terbitan II, Mei 2022, Samarinda, Indonesia e-ISSN: 2657-232X
ii
PROSIDING
SEMINAR NASIONAL MATEMATIKA, STATISTIKA,
DAN APLIKASINYA
Terbitan II, Mei 2022
Fakultas Matematika dan Ilmu Pengetahuan Alam,
Universitas Mulawarman, Samarinda, Kalimantan Timur
Reviewer:
Dr. Sri Wahyuningsih, M.Si.
Dr. Suyitno, S.Pd., M.Sc
Dr. Syaripuddin, S.Si., M.Si
Dr. Darnah Andi Nohe, M.Si
Dr. Sifriyani, M.Si
Dr. Fathurahman, M.Si
Rito Goejantoro, S.Si. M.Si
Yuki Novia Nasution, S.Si., M.Si
Wasono, S.Si., M.Si
Ika Purnamasari, S.Si., M.Si
Memi Nor Hayati, S.Si, M.Si
Meiliyani Siringoringo, S.Si., M.Si
Ketua:
Dr. Darnah Andi Nohe, S.Si., M.Si
Editor:
Qonita Qurrota A’yun. S.Si., M.Sc
Fidia Deny Tisna Amijaya, M.Si
Surya Prangga, M.Si
Desain Cover:
Moh. Nurul Huda, M.Si
Prosiding Seminar Nasional Matematika, Statistika, dan Aplikasinya
Terbitan II, Mei 2022, Samarinda, Indonesia e-ISSN: 2657-232X
ii
SUSUNAN PANITIA
Dewan Kehormatan
Prof. Dr. H. Masjaya, M.Si
Pengarah
Dr. Eng. Idris Mandang, M.Si
Penanggung Jawab
Wakil Dekan Bidang Akademik,
Kemahasiswaaan, dan Alumni
Dr. Yanti Puspitasari, M.Si
Ketua
Dr. Darnah Andi Nohe. M.Si
Wakil Ketua
Dr. M. Fathurahman, M.Si
Dr. Syaripuddin, M.Si
Seksi Kesekretariatan
Meiliyani Siringoringo, S.Si., M.Si
Ika Purnamasari, S.Si., M.Si
Nurul Huda,SE
Vika Kurnia Lestari, S.Si
Kurniawati, S.Si
Fedy Harlanto, S.Si
Seksi Acara
Wasono, S.Si. M.Si
Dr. Sri Wahyuningsih, M.Si
Dr. Sifriyani, M.Si
Memi Nor Hayati, S.Si., M.Si
Ruli Yuniarto, S.Si
Muhammad Rasyid Rahman, S.Stat
Seksi Publikasi
Dr. Suyitno, S.Pd., M.Sc
Rito Goejantoro, S.Si., M.Si
Fidia Deny Tisna Amijaya, M.Si
Yuki Novia Nasution, S.Si., M.Sc
Surya Prangga, S.Si., M.Si
Moh. Nurul Huda, S.Si, M.Si
Qonita Qurrota A’yun, S.Si., M.Sc
Ryan Rahmad Ramadhan, S.Si
Prosiding Seminar Nasional Matematika, Statistika, dan Aplikasinya
Terbitan II, Mei 2022, Samarinda, Indonesia e-ISSN: 2657-232X
i
KATA PENGANTAR
Segala puji bagi Allah SWT karena atas rahmat-Nya sehingga Prosiding
Seminar Nasional Matematika, Statistika, dan Aplikasinya dapat diterbitkan.
Seminar Nasional Matematika, Statistika, dan Aplikasinya diselenggarakan oleh
Jurusan Matematika, Fakultas Matematika dan Ilmu Pengetahuan Alam (FMIPA),
Universitas Mulawarman Kalimantan Timur pada masa pandemi Coronavirus
Disease 2019 (COVID-19) sehingga dilaksanakan dalam jaringan (daring)
menggunakan aplikasi Zoom Meeting. Adapun tema kegiatan seminar ini adalah
Mathematics and Statistics for Supporting Research in the New Normal Era”.
Munculnya COVID-19 di Indonesia pada tanggal 2 Maret 2020 menyebabkan
pemerintah Indonesia mengambil kebijakan penerapan social distancing pada
tanggal 15 Maret 2020 untuk menekan penyebaran virus mematikan tersebut. Pada
bulan Juni 2020, pemerintah Indonesia menerapkan new normal, yaitu melakukan
aktivitas seperti kehidupan pada umumnya namun tetap memperhatikan protokal
kesehatan. Meskipun berada pada era new normal, antusias peneliti untuk
melaksanakan kegiatan penelitian tetap tinggi.
Berbagai penelitian di bidang Matematika dan Statistika terus dilakukan,
Pada bidang Matematika, dilakukan pemodelan penyebaran COVID-19 pada
daerah tertentu, membantu memahami dan mengidentifikasi hubungan penyebaran
COVID-19 dengan berbagai parameter epidemiologi, membantu dalam
perencanaan masa depan dan mempertimbangkan langkah-langkah pengendalian
yang tepat. Berbagai penelitian lain telah menjadikan matematika sebagai basic of
science untuk menemukan hal-hal baru dalam pengembangan ilmu pengetahuan
dan teknologi. Pada bidang Statistika, kasus COVID-19 dapat dideskripsikan
dengan baik, mengetahu fluktuasi kasus yang terjadi, mengidentifikasi faktor-faktor
yang berpengaruh terhadap penyebaran COVID-19, dan memprediksi kasus
COVID-19 beberapa periode yang akan datang.
Kegiatan seminar ini menjadi sarana bertukar informasi dan diskusi mengenai
penelitian-penelitian terkini dan ilmu pengetahuan yang sedang berkembang baik
berkaitan dengan pandemi COVID-19 maupun hal lainnya. Selain itu, kegiatan
seminar ini memberikan motivasi dan gagasan baru kepada peserta untuk
Prosiding Seminar Nasional Matematika, Statistika, dan Aplikasinya
Terbitan II, Mei 2022, Samarinda, Indonesia e-ISSN: 2657-232X
ii
melakukan penelitian lain terkait matematika, statistika, dan aplikasinya serta
menghasilkan prosiding. Prosiding yang telah tersusun ini berisi tentang penelitian-
penelitian terbaru terkait dengan bidang matematika dan statistika, serta aplikasinya
dan telah disajikan oleh pemateri, baik praktisi dari berbagai instansi, mahasiswa,
maupun dosen dari perguruan tinggi diseluruh Indonesia. Prosiding yang telah
tersusun ini dapat diselesaikan dengan baik atas dukungan dari berbagai pihak
sehingga kami mengucapkan terima kasih dan apresiasi yang setinggi-tingginya
kepada:
1. Rektor Universitas Mulawarman.
2. Dekan Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas
Mulawarman beserta jajarannya.
3. Ketua Jurusan Matematika Fakultas Matematika dan Ilmu Pengetahuan Alam
Universitas Mulawarman.
4. Editor dan Reviewer yang telah memberikan penilaian dan seleksi terhadap
makalah-makalah prosiding.
5. Panitia Pelaksana Seminar Nasional Matematika, Statistika, dan Aplikasinya
tahun 2021.
6. Seluruh peserta seminar, baik praktisi dari berbagai instansi maupun civitas
akademika dari berbagai perguruan tinggi di seluruh Indonesia yang telah
berkontribusi dalam pelaksanaan kegiatan ini.
Perbaikan dan peningkatan kualitas Prosiding Seminar Nasional Matematika,
Statistika, dan Aplikasinya menjadi upaya yang terus dilakukan sehingga kritik
yang konstruktif menjadi input yang sangat kami harapkan. Akhir kata, semoga
Prosiding Seminar Nasional Matematika, Statistika, dan Aplikasinya dapat
memberikan manfaat yang sebesar-besarnya bagi kita semua.
Samarinda, Mei 2022
Penyusun
Prosiding Seminar Nasional Matematika, Statistika, dan Aplikasinya
Terbitan II, Mei 2022, Samarinda, Indonesia e-ISSN: 2657-232X
iii
DAFTAR ISI
Halaman Judul ..................................................................................................... i
Reviewer dan Editor ............................................................................................ ii
Panitia .................................................................................................................. iii
Kata Pengantar .................................................................................................... v
Daftar Isi.............................................................................................................. vii
Makalah
Optimalisasi Waktu Penjadwalan Dengan Program Evaluation and Review
Technique (PERT) Untuk Pembangunan Rumah Tipe 36 Pada PT. Arisko Di
Sambutan Samarinda
Indah Fatikawati, Langgeng Prassadewo S.A.W.B., Safiah ............................... 1
Implementasi Game Theory Pada Strategi Pemasaran Ban Roda Dua di
Kecamatan Sambutan Samarinda
Benny Maryam Halim, Lisnawati , dan Nuryatma……………………………. 9
Analisis Faktor-Faktor yang Memengaruhi Jumlah Penderita Tuberkulosis
Menggunakan Geographically Weighted Regression di Provinsi Jawa Timur
Angeliya Milla Khariyani, Kismiantini, Ezra Putranda Setiawan……………. 16
Identifikasi Faktor-Faktor yang Memengaruhi Indeks Pembangunan Manusia
(IPM) di Kalimantan Barat Tahun 2020 Menggunakan Geographically
Weighted Regression
Andriati Langiran, Kismiantini, Ezra Putranda Setiawan……………………. 27
Pemodelan Prevalensi Gizi Buruk Pada Balita di Kalimantan Tengah
Menggunakan Geographically Weighted Regression
Ryan Sidiq Permana, Kismiantini, Ezra Putranda Setiawan…………………… 36
Model Geographically Weighted Weibull Regression dengan Kriteria
Penentuan Bandwidth Optimum Akaike Information Criterion (Studi Kasus:
Indikator Pencemaran Air Biochemical Oxygen Demand di Daerah Hutan
Tropis Lembab Das Mahakam Tahun 2019)
Novianti, Suyitno, Meiliyani Siringoringo……………………………………. 43
Peramalan Indeks Harga Konsumen Provinsi Kalimantan Timur dengan
Metode Grey Double Exponential Smoothing Holt
Prosiding Seminar Nasional Matematika, Statistika, dan Aplikasinya
Terbitan II, Mei 2022, Samarinda, Indonesia e-ISSN: 2657-232X
iv
Galuh Batul Nabilah, Yuki Novia Nasution, Ika Purnamasari………………… 69
Perbandingan Model Chen dan Model Lee Pada Metode Fuzzy Time Series
Untuk Peramalan Produksi Kelapa Sawit Provinsi Kalimantan Timur
Ipan, Syaripuddin, Darnah Andi Nohe………………………………………. 81
Peramalan Data Ekspor Kalimantan Barat dengan Metode Autoregressive
Integrated Moving Average (ARIMA)
Ahmad Aliful Abidin, Paulus Felippe Buiney, Darnah Andi Nohe…………… 96
Regresi Data Panel untuk Memodelkan Persentase Kemiskinan di Kalimantan
Timur
Muhammad Taufik Nur, Deva Khoirotunnisa, Wiwit Widyaningsih, Darnah Andi
Nohe …………………………………………………………………………. 108
Analisis Faktor yang Berpengaruh Terhadap Tingkat Kemiskinan di Provinsi
Kalimantan Timur Menggunakan Regresi Data Panel
Edy Widodo, Dhea Laksmita Arsya Primananda, Diannita Eka Putri, Falah
Novayanda Adlin, Shafa Bunga Faradilla………………………………….... 122
Pemilihan Model Regresi Bernoulli Terbaik
M. Fathurahman…………………………………………………………….. 138
Pemodelan Regresi Data Panel Pada Faktor yang Mempengaruhi Tingkat
Pengangguran Terbuka di Jawa Barat
Muhammad Irfan Rizki, Farhat Gumelar, Jessica Jesslyn Cerelia, Teguh Ammar,
Adhiyatma Nugraha………………………………………………................. 147
Analisa Ketepatan Waktu Lulus Mahasiswa FKIP Universitas Islam Malang
Berdasarkan Penguasaan Kompetensi Menggunakan Klasifikasi CHAID
Siti Nurul Hasana, Nuse Aliyah Rahmati…………………………………….. 162
Analisis Faktor-Faktor yang Memengaruhi Produk Domestik Regional Bruto
(PDRB) di Kalimantan Timur dengan Regresi Data Panel
Anisa Yuliana, Muhammad S. Basri, Siti N. Rahmah, Darnah A. Nohe…….. 177
Pemodelan Tingkat Pengangguran Terbuka Di Pulau Kalimantan Dengan
Regresi Data Panel
Nuning Kusumaningrum, Jordan Nata Permana, Khairunnisa,
Darnah Andi Nohe…….……………………………………………………… 196
Prosiding Seminar Nasional Matematika, Statistika, dan Aplikasinya
Terbitan II, Mei 2022, Samarinda, Indonesia e-ISSN: 2657-232X
v
Analisis Regresi Data Panel Pada Faktor yang Memengaruhi Persentase
Kemiskinan di Kalimantan Timur
Rina Aprilianti, Gerald C. Messakh, Sinta Nur Asiah, Darnah A. Nohe……… 211
Pemodelan Indeks Kedalaman Kemiskinan di Provinsi Kalimantan Timur
dengan Regresi Data Panel
Ni Made Shantia A., Anggi J. Utami, Rani Mirnawati, Darnah Andi Nohe…. 224
Regresi Data Panel Pada Ketimpangan Pendapatan Daerah di Provinsi
Kalimantan Timur
Nur Afifah Salsabila, Handy K. Juliarto, Al Fitri Syawal, Darnah A. Nohe241
Regresi Data Panel Untuk Mengetahui Faktor yang Memengaruhi Jumlah
Penduduk Miskin di Kalimantan Timur
Iqbal Firman Alamsyah, Rut Esra, Salwa Awalia, Darnah Andi Nohe……… 254
Hubungan Jumlah Penduduk Miskin dengan Berat Badan Lahir Rendah di
Kalimantan Timur Menggunakan Korelasi Pearson dan Spearman
Andrean Sergio, Muhammad A. Zen, Risa K. Wahyuni, Darnah A. Nohe……. 267
Studi Simulasi dan Aplikasi: Estimator Deret Fourier Pada Pemodelan Regresi
Nonparametrik
Andrea Tri Rian Dani, Ardiana Fatma Dewi, Ludia Ni’matuzzahroh………. 279
Pemodelan Rata-Rata Lama Sekolah di Provinsi Nusa Tenggara Timur (NTT)
Menggunakan Pendekatan Regresi Nonparametrik Spline Truncated
Ludia Ni’matuzzahroh, Andrea Tri Rian Dani……………………………… 289
Pemodelan Gizi Buruk Pada Balita di Provinsi Jawa Timur Menggunakan
Geographically Weighted Regression (GWR)
Qatrunnada Azkia, Kismiantini, Ezra Putranda Setiawan…………………. 302
Pemodelan Spatial Autoregressive Quantile Regression dalam Faktor yang
Mempengaruhi Tingkat Incident Rate Demam Berdarah Dengue di Jawa Barat
Muhammad Irfan Rizki, Teguh Ammar……………………………………… 312
Perbandingan Tingkat Konsistensi Uji Distribusi Normalitas Pada Data
Tingkat Pengangguran di Jawa
Ineu Sintia, Muhammad Danil Pasarella, Darnah Andi Nohe…………….. 322
Prosiding Seminar Nasional Matematika, Statistika, dan Aplikasinya
Terbitan II, Mei 2022, Samarinda, Indonesia e-ISSN: 2657-232X
vi
Penentuan Ketepatan Klasifikasi Indeks Kedalaman Kemiskinan di Indonesia
dengan Model Logit
Deviyana Nurmin, Lisa D. N. Khasanah, Sitti Anggraeni, Darnah A. Nohe... 334
Pengaruh Tingkat Partisipasi Angkatan Kerja dan Indeks Pembangunan
Manusia Terhadap Tingkat Pengangguran Terbuka dengan Regresi Probit dan
Logit
Nabila Abda Salsabila, Sindi Andriani, Mirisda, Darnah Andi Nohe……….. 344
Pemodelan Persentase Penduduk Miskin Di Indonesia Menggunakan Regresi
Probit Dan Regresi Logistik
Grace Wulandari, Nur A. Febriyanti, Khoiril Anwar, Darnah A. Nohe…….. 354
Model Regresi Weibull Pada Data Waktu Rawat Inap Pasien Penderita
Penyakit Jantung Koroner Dengan Event Kematian di RSUD Abdul Wahab
Sjahranie Samarinda
Hasmiati, Suyitno, Yuki Novia Nasution……………………………………... 369
Analisis Faktor-Faktor Yang Memengaruhi Indeks Pembangunan Manusia Di
Jawa Barat Menggunakan Regresi Logistik Biner
Siti F. Khairunnisa, Suharni, Nurul Fatmi’aturro’isah, Darnah A. Nohe. 377
Perbandingan Keakuratan Model Logit Dan Probit dalam Mengidentifikasi
Faktor-Faktor yang Memengaruhi Persentase Penduduk Miskin di Kalimantan
Adelia Ramadhani, Dhita Reginna Putri, Risti Raihani, Darnah Andi Nohe387
Prosiding Seminar Nasional Matematika, Statistika, dan Aplikasinya
Terbitan II, Mei 2022, Samarinda, Indonesia e-ISSN: 2657-232X
138
PEMILIHAN MODEL REGRESI BERNOULLI TERBAIK
M. Fathurahman1*
1Jurusan Matematika, Fakultas Matematika dan Ilmu Pengetahuan Alam,
Universitas Mulawarman, Indonesia
Corresponding author: fathur@fmipa.unmul.ac.id
Abstrak. Regresi Bernoulli merupakan model regresi yang dapat menjelaskan hubungan
antara variabel dependen kategorik dan satu atau lebih variabel independen. Penelitian ini
bertujuan mengkaji pemilihan model regresi Bernoulli terbaik menggunakan metode
Akaike’s Information Criterion (AIC), Corrected AIC (AICc), Bayesian Information
Criterion (BIC). Ketiga metode ini berhubungan dengan metode Maximum Likelihood
Estimation (MLE) yang digunakan untuk estimasi parameter model regresi Bernoulli.
Berdasarkan hasil kajian empiris pada data Indeks Pembangunan Kesehatan Masyarakat
(IPKM) kabupaten/kota di Pulau Kalimantan, metode AIC menghasilkan nilai terkecil
dibanding metode AICc dan BIC untuk semua model yang dibandingkan. Model regresi
Bernoulli terbaik untuk data IPKM berdasarkan nilai AIC, AICc, dan BIC terkecil adalah
model dengan variabel independennya adalah produk domestik regional bruto per kapita.
Kata Kunci: regresi Bernoulli, MLE, AIC, AICc, BIC, IPKM.
Prosiding Seminar Nasional Matematika, Statistika, dan Aplikasinya
Terbitan II, Mei 2022, Samarinda, Indonesia e-ISSN: 2657-232X
139
1 PENDAHULUAN
Regresi Bernoulli merupakan salah satu pendekatan alternatif yang dapat
digunakan untuk memodelkan hubungan antara respon kategorik dan satu atau
lebih prediktor kategorik, kuantitatif, atau gabungan antara keduanya. Model
regresi Bernoulli adalah model marginal dari model regresi Bernoulli bivariat yang
dikembangkan oleh [1]. Variabel respon model regresi Bernoulli mempunyai dua
kategori dan berdistribusi Bernoulli univariat. Distribusi ini merupakan distribusi
marginal dari distribusi Bernoulli bivariat yang ditemukan oleh Marshall dan Olkin
pada tahun 1985 dalam [2] dan [3]. Penelitian ini difokuskan untuk model regresi
Bernoulli yang mempunyai satu variabel dependen (univariat), khususnya untuk
pemilihan model terbaik.
Model regresi terbaik akan memberikan hasil yang optimal dalam estimasi,
inferensi, maupun prediksi. Beberapa penelitian yang mengkaji pemilihan model
regresi terbaik diantaranya adalah pemilihan model regresi terbaik dan
penerapannya pada bidang pendidikan menggunakan metode Akaike Information
Criterion (AIC) dan Schwarz Information Criterion (SIC) [4]. [5] mengkaji dan
menerapkan metode AIC dan Bayesian Information Criterion (BIC) pada
pemilihan model terbaik dengan menggunakan data psikologi. [6]
mengembangkan metode Corrected AIC (AICc).
Berdasarkan penelitian sebelumnya, penelitian yang mengkaji pemilihan
model regresi Bernoulli terbaik menggunakan metode AIC, AICc, dan BIC masih
sangat sedikit. Oleh karena itu, penelitian ini bertujuan mengkaji pemilihan model
regresi Bernoulli terbaik menggunakan ketiga metode tersebut dan penerapannya
pada data Indeks Pembangunan Kesehatan Masyarakat (IPKM) kabupaten/kota di
Pulau Kalimantan tahun 2018.
2 TINJAUAN PUSTAKA
2.1 Distribusi Bernoulli
Distribusi Bernoulli merupakan distribusi khusus dari distribusi binomial [7].
Jika adalah variabel random berdistribusi Bernoulli, maka fungsi masa peluang
dari dinyatakan sebagai berikut:
(1)
Rata-rata dan varians dari berdasarkan Persamaan (1) adalah berturut-turut
󰇛󰇜 dan 󰇛󰇜󰇛󰇜, dimana 󰇛󰇜 disebut peluang
kejadian sukses untuk dan 󰇛󰇜󰇛󰇜 disebut peluang kejadian gagal
untuk .
2.2 Regresi Bernoulli
Regresi Bernoulli merupakan model marginal dari model regresi Bernoulli
bivariat [1-3]. Jika diberikan sampel random berdistribusi Bernoulli
dengan parameter , maka model regresi Bernoulli dapat ditulis sebagai berikut [1-
3]:
(2)
dimana 󰇟   󰇠 adalah vektor variabel independen untuk
pengamatan ke- , .󰇟 󰇠 adalah vektor
Prosiding Seminar Nasional Matematika, Statistika, dan Aplikasinya
Terbitan II, Mei 2022, Samarinda, Indonesia e-ISSN: 2657-232X
140
parameter. 󰇛󰇜 adalah peluang variabel dependen yang mempunyai kategori
bernilai 1 untuk pengamatan ke- dan bergantung pada variabel independen pada
pengamatan ke-, yaitu:
(3)
Untuk mendapatkan model regresi Bernoulli, dilakukan estimasi terhadap
parameter modelnya menggunakan metode MLE [1-3]. Estimasi parameter diawali
dengan mengambil sampel random yang saling independen untuk variabel
random berdistribusi Bernoulli dengan parameter 󰇛󰇜 Berdasarkan
Persamaan (1), diperoleh fungsi likelihood sebagai berikut:
󰇛󰇜󰇛󰇜

󰇛󰇜󰇟󰇛󰇜󰇠

󰇟󰇛󰇜󰇠󰇟󰇛󰇜󰇠

(4)
Selanjutnya, dilakukan transformasi terhadap Persamaan (4) menggunakan fungsi
natural logarithm, sehingga didapatkan fungsi log-likelihood
(5)
Estimator untuk parameter model regresi Bernoulli dapat diperoleh dengan
memaksimumkan fungsi log-likelihood pada Persamaan (5) dengan cara
menentukan derivatif parsial pertama fungsi log-likelihood terhadap kemudian
disamakan dengan nol, yaitu:
(6)
dimana 󰇛󰇜 seperti pada Persamaan (3).
Berdasarkan Persamaan (6), diperoleh sistem persamaan yang implisit. Hal ini
menunjukkan bahwa estimator parameter model regresi Bernoulli yang diperoleh
dengan metode MLE tidak menghasilkan penyelesaian secara analitik. Oleh karena
itu, untuk mendapatkan estimator parameter digunakan pendekatan secara numerik
menggunakan metode Fisher scoring [8,9] dengan formula sebagai berikut:
󰇛󰇜
󰇛󰇜
󰇛󰇜
󰇛󰇜
(7)
dimana
adalah estimator parameter; 
adalah invers dari matriks informasi
Fisher, dengan elemen-elemen dari matriks informasi Fisher adalah derivatif
parsial kedua fungsi log-likelihood terhadap parameter yang diestimasi; dan 
adalah vektor gradien dengan elemen-elemennya adalah derivatif parsial pertama
fungsi log-likelihood terhadap parameter yang diestimasi, seperti pada Persamaan
(6).
Prosiding Seminar Nasional Matematika, Statistika, dan Aplikasinya
Terbitan II, Mei 2022, Samarinda, Indonesia e-ISSN: 2657-232X
141
Vektor gradien dan matriks informasi Fisher berturut-turut dinyatakan sebagai
berikut [8]:
(8)
(9)
dengan 󰇣󰇛󰇜
󰇤 adalah harga harapan dari derivatif parsial kedua fungsi log-
likelihood terhadap parameter yang ditaksir.
Berdasarkan Persamaan (7), estimator parameter model regresi Bernoulli
dapat diperoleh pada saat proses iterasi Fisher scoring memenuhi kondisi
konvergen, yaitu 
󰇛󰇜
󰇛󰇜, dengan adalah bilangan positif yang
sangat kecil [8]. Estimator parameter yang didapat adalah estimator pada saat
iterasi terakhir, yaitu
󰇛󰇜.
2.3 Pemilihan Model Terbaik
Pemilihan model regresi Bernoulli terbaik dapat dilakukan dengan
menggunakan metode AIC, AICc, dan BIC. Metode AIC ditemukan oleh Akaike
pada tahun 1974 dan metode BIC ditemukan oleh Schwarz pada tahun 1978 [5].
Sedangkan, metode AICc ditemukan oleh Hurvich dan Tsai pada tahun 1989 [6].
Formula yang digunakan untuk menghitung nilai AIC, AICc, dan BIC adalah
sebagai berikut [5,6,10]:

󰇛󰇜
(10)

󰇛󰇜

󰇛󰇜󰇛󰇜
dimana 
adalah nilai fungsi log-likelihood untuk estimator parameter,
adalah banyaknya parameter yang diestimasi, dan adalah banyaknya sampel.
Berdasarkan Persamaan (10), model regresi Bernoulli terbaik adalah model yang
mempunyai nilai AIC, AICc, dan BIC terkecil.
3 DATA
Data yang digunakan pada penelitian ini adalah data sekunder yang diperoleh
dari Badan Penelitian dan Pengembangan Kesehatan (Balitbangkes) Kementerian
Kesehatan dan Badan Pusat Statistik. Data yang diambil dari Balitbangkes
Kementerian Kesehatan adalah data hasil publikasi IPKM kabupaten/kota tahun
2018. Data yang diambil dari Badan Pusat Statistik adalah data hasil publikasi dan
hasil survei. Data hasil publikasi meliputi data dan informasi kemiskinan tahun
2018, provinsi dalam angka, dan laporan pembangunan manusia tahun 2018,
sedangkan data hasil survei meliputi hasil Survei Sosial Ekonomi Nasional
(Susenas) tahun 2018.
Variabel yang digunakan dalam penelitian ini meliputi variabel dependen
dan variabel independen. Variabel dependen 󰇛󰇜 adalah status IPKM
kabupaten/kota di Pulau Kalimantan tahun 2018. Sedangkan variabel independen
 adalah faktor-faktor yang diduga berpengaruh terhadap status IPM
kabupaten/kota di Pulau Kalimantan tahun 2018. Variabel independen yang
Prosiding Seminar Nasional Matematika, Statistika, dan Aplikasinya
Terbitan II, Mei 2022, Samarinda, Indonesia e-ISSN: 2657-232X
142
digunakan dalam penelitian ini mengacu pada penelitian-penelitian sebelumnya
mengenai beberapa faktor yang berpengaruh signifikan terhadap status IPKM
[8,11,12]. Variabel-variabel yang digunakan dalam penelitian ini disajikan pada
Tabel 1.
Tabel 1: Variabel Penelitian
Variabel
Nama Variabel
Skala Pengukuran
Status IPKM, dengan kategori [13]:
0 = IPKM DBK (IPKM < rata-rata)
1 = IPKM B-DBK (IPKM ≥ rata-rata)
DBK = Daerah Bermasalah Kesehatan
B-DBK = Bukan Daerah Bermasalah Kesehatan.
Nominal
Status IPM, dengan kategori [14]:
0 = IPM sedang (60 ≤ IPM < 70)
1 = IPM tinggi (70 ≤ IPM < 80)
Nominal
Persentase penduduk miskin
Rasio
PDRB per kapita
Rasio
Persentase penduduk yang berpendidikan
minimal SMP
Rasio
Tahapan-tahapan analisis data dalam penelitian ini adalah sebagai berikut:
1) Melakukan analisis statistika deskriptif terhadap variabel dependen dan
variabel independen.
2) Melakukan pendeteksian multikolinieritas pada variabel independen
menggunakan nilai VIF.
3) Melakukan estimasi parameter model regresi Bernoulli menggunakan metode
MLE dan Fisher scoring.
4) Melakukan pemilihan model terbaik.
5) Melakukan interpretasi terhadap model terbaik.
6) Menarik kesimpulan.
4 HASIL DAN PEMBAHASAN
Pembahasan pada penelitian ini diawali dengan analisis statistik deskriptif
terhadap variabel penelitian. Deskripsi dari variabel dependen disajikan pada Tabel
2. Sedangkan deskripsi dari variabel independen disajikan pada Tabel 3 dan Tabel
4.
Tabel 2. Deskripsi Variabel Dependen
Status IPKM
Frekuensi
Persentase
IPKM DBK
30
53,57
IPKM B-DBK
26
46,43
Jumlah
56
100
Berdasarkan Tabel 2, terlihat bahwa status IPKM 󰇛󰇜 kabupaten/kota di Pulau
Kalimantan tahun 2018 terbanyak adalah IPKM DBK, yaitu sebanyak 30
kabupaten/kota (53,57%).
Prosiding Seminar Nasional Matematika, Statistika, dan Aplikasinya
Terbitan II, Mei 2022, Samarinda, Indonesia e-ISSN: 2657-232X
143
Tabel 3. Deskripsi Variabel Independen Kategorik
Status IPM
Frekuensi
Persentase
IPM Sedang
33
58,93
IPM Tinggi
23
41,07
Jumlah
56
100
Pada Tabel 3, tampak bahwa status IPM 󰇛󰇜 kabupaten/kota di Pulau
Kalimantan tahun 2018 terbanyak adalah IPM sedang, yaitu sebanyak 33
kabupaten/kota (58,93%).
Tabel 4. Deskriptif Variabel Independen Kuantitatif
Variabel
Min
Max
Mean
SD
2,64
12,83
6,27
2,43
23,13
353,30
67,20
76,86
35,58
81,37
54,25
11,05
Berdasarkan Tabel 4, dapat diketahui bahwa rata-rata persentase penduduk
miskin 󰇛󰇜 di Pulau Kalimantan tahun 2018 sebesar 6,27%. Persentase penduduk
miskin terendah di Kota Balikpapan, Kalimantan Timur sebesar 2,64% dan
persentase tertinggi di Kabupaten Melawi, Kalimantan Barat sebesar 12,83%.
Rata-rata PDRB per kapita 󰇛󰇜 kabupaten/kota di Pulau Kalimantan tahun 2018
sebesar 67,2 juta rupiah, dengan PDRB per kapita terendah di Kabupaten Melawi,
Kalimantan Barat sebesar 23,13 juta rupiah dan PDRB per kapita tertinggi di
Kabupaten Kutai Timur, Kalimantan Timur sebesar 353,3 juta rupiah. Rata-rata
persentase penduduk yang berpendidikan minimal SMP 󰇛󰇜 di Pulau Kalimantan
tahun 2018 sebesar 54,25%. Persentase terendah di Kabupaten Sambas,
Kalimantan Barat sebesar 35,58%. Sedangkan, persentase tertinggi di Kota
Palangkaraya, Kalimantan Tengah sebesar 81,37%.
Pembahasan selanjutnya adalah melakukan pendeteksian multikolinieritas
terhadap variabel independen sebagai prasyarat analisis data pada model regresi
Bernoulli. Pendekatan yang digunakan untuk mendeteksi adanya multikolinieritas
adalah Variance Inflation Factor (VIF). Model regresi Bernoulli bebas masalah
multikolinieritas jika semua variabel independennya mempunyai nilai VIF kurang
dari 10 [15]. Berdasarkan hasil perhitungan dengan software R, diperoleh nilai VIF
untuk setiap variabel independen yang disajikan pada Tabel 5.
Tabel 5. Nilai VIF Variabel Independen
Variabel Independen
Nilai VIF
1,25
1,37
1,62
Pada Tabel 5, tampak bahwa variabel , , dan mempunyai nilai VIF
kurang dari 10. Hasil ini menunjukkan bahwa tidak terdapat multikolinieritas. Oleh
karena itu, variabel independen , , dan dapat digunakan untuk model
regresi Bernoulli.
Pemilihan model regresi Bernoulli terbaik untuk data IPKM kabupaten/kota di
Pulau Kalimantan tahun 2018, diawali dengan melakukan estimasi terhadap
Prosiding Seminar Nasional Matematika, Statistika, dan Aplikasinya
Terbitan II, Mei 2022, Samarinda, Indonesia e-ISSN: 2657-232X
144
parameter model regresi Bernoulli menggunakan metode MLE dan iterasi Fisher
scoring seperti pada Persamaan (7). Selanjutnya, menghitung nilai AIC, AICc, dan
BIC berdasarkan Persamaan (10). Setelah dilakukan perhitungan dengan software
R, diperoleh hasil yang disajikan pada Tabel 6.
Tabel 6. Nilai AIC, AICc, dan BIC Model Regresi Bernoulli Data IPKM
Model
Variabel Independen
AIC
AICc
BIC
1
70,94
71,17
83,04
2
80,30
80,52
92,40
3
60,23*
60,45*
72,33*
4
75,96
76,18
88,06
5
72,62
73,08
90,77
6
60,51
60,97
78,66
7
72,86
73,33
91,02
8
61,37
61,84
79,53
9
77,96
78,42
96,11
10
62,22
62,69
80,38
11
61,87
62,65
86,07
12
74,22
75,00
98,42
13
60,91
61,70
85,12
14
63,27
64,06
87,48
15
60,59
61,79
90,85
*) Model terbaik
Berdasarkan Tabel 6, terlihat bahwa model regresi Bernoulli dengan variabel
independen PDRB per kapita (Model 3) adalah model terbaik untuk data IPKM.
Hal ini ditunjukkan oleh nilai AIC, AICc, dan BIC untuk Model 3 terkecil
dibanding model-model lainnya. Hasil ini juga disajikan pada Gambar 1.
Gambar 1. Nilai AIC, AICc, dan BIC Model Regresi Bernoulli Data IPKM
Model regresi Bernoulli terbaik yang diperoleh dari Tabel 5 dapat ditulis
sebagai berikut:
Prosiding Seminar Nasional Matematika, Statistika, dan Aplikasinya
Terbitan II, Mei 2022, Samarinda, Indonesia e-ISSN: 2657-232X
145
󰇛󰇜
(11)
Interpretasi dari model pada Persamaan (11) adalah setiap penambahan PDRB per
kapita sebesar 1 juta rupiah, maka kabupaten/kota memiliki kecenderungan sebesar
1,03 kali mempunyai status IPKM B-DBK daripada IPKM DBK.
5 KESIMPULAN
Pemilihan model regresi Bernoulli terbaik dapat dilakukan dengan
menggunakan metode AIC, AICc, dan BIC karena ketiga metode ini bergantung
pada fungsi log-likelihood dari metode MLE yang digunakan untuk estimasi
parameter model regresi Bernoulli. Performa dari metode AIC, AICc, dan BIC
dievaluasi dengan menerapkannya pada data IPKM kabupaten/kota di Pulau
Kalimantan tahun 2018. Berdasarkan hasil penerapan pada data IPKM, metode
AIC memberikan nilai terkecil dibanding metode AICc dan BIC. Model regresi
Bernoulli terbaik untuk data IPKM kabupaten/kota di Pulau Kalimantan tahun
2018 adalah model regresi Bernoulli dengan variabel independennya adalah PDRB
per kapita.
DAFTAR PUSTAKA
[1] Bhuyan, M. B., Islam, M. A., & Rahman, M. S. (2018). A Bivariate Bernoulli
Model for Analyzing Malnutrition Data. Health Services and Outcomes
Research Methodology, 18, 109-127.
[2] Islam, M. A., Chowdhury, R. I., & Briollais, L. (2012). A Bivariate Binary
Model for Testing Dependence in Outcomes. Bulletin of the Malaysian
Mathematical Sciences Society, 35(4), 845-858.
[3] El-Sayed, A. M., Islam, M. A., & Alzaid, A. A. (2013). Estimation and Test
of Measures of Association for Correlated Binary Data. Bulletin of the
Malaysian Mathematical Sciences Society, 36(4), 985-1008.
[4] Fathurahman, M. (2009). Pemilihan Model Regresi Terbaik Menggunakan
Metode Akaike's Information Criterion dan Schwarz Information Criterion.
Jurnal Informatika Mulawarman, 4(3), 37-41.
[5] Vrieze, S. I. (2012). Model Selection and Psychological Theory: A
discussion of the differences between the Akaike Information Criterion
(AIC) and the Bayesian Information Criterion (BIC). Psychol Methods,
17(2), 228-243.
[6] Delsole, T., & Tippett, M. K. (2021). Correcting the Corrected AIC. Statistics
and Probability Letters, 173, 109064.
[7] Johnson, N. L., Kemp, A. W., & Kotz, S. (2005). Univariate Discrete
Distributions (3rd ed.). New Jersey: John Wiley & Sons.
[8] Fathurahman, M. (2019). Pemodelan Indeks Pembangunan Kesehatan
Masyarakat Kabupaten/Kota di Pulau Kalimantan Menggunakan Pendekatan
Regresi Probit. Jurnal Varian, 2(2), 47-54.
[9] Fathurahman, M., Siringoringo, M., Satriya, A. M., & Sari, N. W. (2019).
Pemodelan Regresi Logistik dan Regresi Probit pada Indeks Pembangunan
Manusia Kabupaten/Kota di Pulau Kalimantan. Prosiding SNMSA (pp. 172-
182). Samarinda: Jurusan Matematika FMIPA Universitas Mulawarman.
[10] Bilder, C. R., & Loughin, T. M. (2015). Analysis of Categorical Data with
R. Boca Raton: CRC Press.
Prosiding Seminar Nasional Matematika, Statistika, dan Aplikasinya
Terbitan II, Mei 2022, Samarinda, Indonesia e-ISSN: 2657-232X
146
[11] Fibriyani, V., Latra, I. N., & Purhadi. (2015). Geographically Weighted
Multinomial Logistic Regression Model (Case Study: Human Development
Index Value and Healths Status Areas of Districts/Cities 2013 in Sumatera).
Proceedings of the IConSSE (pp. 13-19). Salatiga, Indonesia: FSM SWCU.
[12] Fathurahman, M., Hayati, M. N., & Rizki, N. A. (2019). Pemodelan Indeks
Pembangunan Kesehatan Masyarakat Kabupaten/Kota di Pulau Kalimantan
dengan Regresi Spasial. Prosiding SNMSA (pp. 183-191). Samarinda:
Jurusan Matematika FMIPA Universitas Mulawarman.
[13] Kementerian Kesehatan. (2010). Pedoman Umum Penanggulangan Daerah
Bermasalah Kesehatan Kabupaten/Kota. Jakarta: Kementerian Kesehatan.
[14] Badan Pusat Statistik. (2019). Indeks Pembangunan Manusia 2018. Jakarta:
BPS.
[15] Kutner, M. H., Nachtsheim, C. J., & Neter, J. (2004). Applied Linear
Regression Models. New York: McGraw-Hill/Irwin.
Prosiding Seminar Nasional Matematika, Statistika, dan Aplikasinya 2019
5 Oktober 2019, Samarinda, Indonesia ISSN: 2657-1382
2
... • Pengujian stasioner menggunakan ADF Test (Augmented Dickey-Fuller Test), yang memiliki fungsi untuk mengecek akar unit (unit root) pada time series [18] [19]. • Perhitungan p, d (bila ada) dan q menggunakan masing-masing kriteria informasi (AIC, BIC dan AICc) memakai library pmdarima [20], ketiga kriteria informasi tersebut merupakan cara untuk menentukan pemilihan model regresi terbaik [21] ...
Article
Full-text available
Penjualan merupakan komponen terpenting dalam suatu perusahaan bidang industri. Hal ini dikarenakan, bila terjadi penjualan berarti terdapat pendapatan ke dalam perusahaan, oleh karena itu penting untuk dilakukan analisis terhadap produk-produk yang terjual agar perusahaan dapat mempersiapkan lebih dini sebelum permintaan terhadap produk tersebut datang, guna dapat menghasilkan pendapatan yang lebih baik. Penelitian ini menggunakan ARIMA, SVR, FFT dan Prophet sebagai metode-metode untuk peramalan dan menggunakan MAPE dan RMSPE untuk mengukur tingkat akurasinya, juga untuk melihat apakah terjadinya seasonality terhadap produk-produk yang di analisis, digunakan seasonal_decompose. Hasil analisis didapatkan bahwa ARIMA dan Prophet merupakan metode peramalan terbaik, hal ini karena kedua metode tersebut memiliki nilai MAPE dan RMSPE yang terendah. Dan setelah di analisis menggunakan seasonal_decompose, didapatkan bahwa semua produk yang diteliti memiliki pola yang berulang di waktu tertentu setiap kuartalnya. Untuk analisis lebih lanjut, dilakukan komparasi head-to-head, dimana digunakan 20 sampel produk untuk setiap kategorinya, Maka dihasilkan dari analisis ini bahwa produk pada Kategori 1 lebih baik menggunakan ARIMA dan produk pada Kategori 2 lebih baik menggunakan Prophet.
Conference Paper
Full-text available
Abstrak. Indeks Pembangunan Manusia (IPM) merupakan indikator penting untuk mengukur keberhasilan dalam upaya membangun kualitas hidup manusia (masyarakat/penduduk). IPM dapat menentukan peringkat atau level pembangunan suatu wilayah/negara. Selain itu, IPM dapat juga digunakan untuk mengukur kinerja pemerintah baik di tingkat pusat maupun daerah. Berdasarkan publikasi peringkat IPM oleh Badan Pusat Statistik tahun 2017 menunjukkan bahwa peringkat IPM untuk 56 kabupaten/kota di Pulau Kalimantan sangat bervariasi. Penelitian ini bertujuan melakukan pemodelan IPM kabupaten/kota di Pulau Kalimantan tahun 2017 dengan regresi logistic dan regresi probit, dan mendapatkan faktor-faktor yang signifikan berpengaruh terhadap IPM kabupaten/kota di Pulau Kalimantan tahun 2017. Hasil penelitian menunjukkan bahwa model regresi terbaik untuk memodelkan IPM kabupaten/kota di Pulau Kalimantan tahun 2017 adalah model regresi logistik. Faktor-faktor yang signifikan adalah jumlah tenaga kesehatan dan tingkat pengangguran terbuka. Kata Kunci: IPM, regresi logistik, regresi probit, data kategorik.
Conference Paper
Full-text available
Abstrak. Indeks Pembangunan Kesehatan Masyarakat (IPKM) merupakan indikator komposit yang menggambarkan kemajuan pembangunan kesehatan dan bermanfaat untuk menentukan peringkat provinsi dan kabupaten/kota dalam mencapai keberhasilan pembangunan kesehatan masyarakat. Berdasarkan publikasi peringkat IPKM dari Badan Penelitian dan Pengembangan Kesehatan (Balitbangkes) Kementerian Kesehatan untuk peringkat IPKM 55 kabupaten/kota di Pulau Kalimantan tahun 2013 sangat beragam. Oleh karena itu, perlu dikaji faktor-faktor yang mempengaruhi keragamannya. Tujuan dari penelitian ini adalah mengkaji pemodelan faktor-faktor yang berpengaruh terhadap IPKM kabupaten/kota di Pulau Kalimantan tahun 2013 menggunakan regresi spasial, khususnya Spatial Error Model (SEM) dengan pembobot spasial rook contiguity. Hasil penelitian menunjukkan bahwa faktor-faktor yang berpengaruh signifikan terhadap IPKM kabupaten/kota di Pulau Kalimantan tahun 2013 adalah Indeks Pembangunan Manusia (IPM) dan persentase penduduk miskin. Kata Kunci: IPKM, data spasial, pembobot spasial, SEM.
Article
Full-text available
The standard correction to Akaike’s Information Criterion, AICc, assumes the same predictors for training and verification and therefore underestimates prediction error for random predictors. A corrected AIC for regression models containing a mix of random and fixed predictors is derived.
Article
Full-text available
Multivariate binary responses from the same subject are usually correlated. For example, malnutrition of children are usually measured using ‘stunting’ (low height-for-age) and ‘wasting’ (low weight-for-age) calculated from their height, weight and age, and hence the status of being stunted may depend on the status of being wasted and vice-versa. For analyzing such malnutrition data, one needs special statistical models allowing for dependence between the responses to avoid misleading inference. The problem of dependence in multivariate binary responses is generally addressed by using marginal models with generalized estimating equation. However, using the marginal models alone, it is difficult to specify the measures of dependence between the responses precisely. Islam et al. (J Appl Stat 40(5):1064–1075, 2013) proposed a joint modeling approach for bivariate binary responses using both the conditional and marginal models where the dependence between the responses can be measured and tested using a link function of the models. However, the author didn’t examine the properties of the regression coefficient except for the dependence parameter. This paper has given further insight into the joint model and investigated the properties of regression coefficients using an extensive simulation study. The simulation results showed that the maximum likelihood estimators (MLEs) of the regression coefficients of the joint model showed well performance in terms of bias, mean squared error and coverage probability particularly when sample size large. Generally speaking, the MLEs of the parameters associated with joint models possessed the same asymptotic properties as the MLEs of those associated with standard generalized linear models, except for the interpretations. Further the paper provided an application of joint model for analyzing malnutrition data from Bangladesh demographic and health survey 2011. The results revealed that the estimates of the both marginal and condition regression coefficients of the joint model have meaningful interpretation and explanation, which will in turn help the policy makers for designing appropriate policies for improving nutrition status.
Article
Full-text available
http://www.emis.de/journals/BMMSS/pdf/v35n4/v35n4p2.pdf Abstract. The problem of dependence in the outcome variables has become an increasingly important issue of concern during the past two decades attributable mainly to the increase in the demand for techniques in analyzing repeated measures data. In the past, most of the longitudinal models developed are based on marginal approaches and relatively few are based on conditional models. The joint models are examined mainly to focus on the characterization problems but not much has been employed to focus the covariate dependent models with dependence in the outcomes. This paper develops a new simple procedure to take account of the bivariate binary model with covariate dependence. The model is based on the integration of conditional and marginal models. Test procedures are suggested for testing the dependence in binary outcomes. Simulations are employed to demonstrate the utility of the proposed test procedures in different dependence settings. Finally, an application to the depression data has been shown. All the results confirm that the proposed model for testing the dependence in outcomes can be applied very successfully for a wide variety of situations. 2010 Mathematics Subject Classification: 62H20, 62F03, 62F10, 62N03 Keywords and phrases: Conditional model, marginal model, joint model, correlated outcomes, test for dependence, bivariate Bernoulli.
Article
Full-text available
This article reviews the Akaike information criterion (AIC) and the Bayesian information criterion (BIC) in model selection and the appraisal of psychological theory. The focus is on latent variable models, given their growing use in theory testing and construction. Theoretical statistical results in regression are discussed, and more important issues are illustrated with novel simulations involving latent variable models including factor analysis, latent profile analysis, and factor mixture models. Asymptotically, the BIC is consistent, in that it will select the true model if, among other assumptions, the true model is among the candidate models considered. The AIC is not consistent under these circumstances. When the true model is not in the candidate model set the AIC is efficient, in that it will asymptotically choose whichever model minimizes the mean squared error of prediction/estimation. The BIC is not efficient under these circumstances. Unlike the BIC, the AIC also has a minimax property, in that it can minimize the maximum possible risk in finite sample sizes. In sum, the AIC and BIC have quite different properties that require different assumptions, and applied researchers and methodologists alike will benefit from improved understanding of the asymptotic and finite-sample behavior of these criteria. The ultimate decision to use the AIC or BIC depends on many factors, including the loss function employed, the study's methodological design, the substantive research question, and the notion of a true model and its applicability to the study at hand.
Article
This paper provides the estimation and test procedures for measures of association in the correlated binary data. Several measures of association are proposed for bivari-ate Bernoulli data during the past decades but the estimation and test procedures for most of these measures are not developed yet. In this paper, the inferential procedures for the measures of association are demonstrated. The generalized linear model approach (GLM) is employed for bivariate Bernoulli variables and the measures of association are estimated and appropriate test procedures are suggested. An alternative to the quadratic exponential form (QEF) is proposed to improve the normalization process. In this paper, different methods of measuring association between bivariate Bernoulli variables are compared. For comparison , we use a simulation procedure which indicates that all the measures of association and their test procedures provide almost similar results. However, the GLM and the proposed alternative quadratic exponential form (AQEF) models display slightly better performance.
Pemilihan Model Regresi Terbaik Menggunakan Metode Akaike's Information Criterion dan Schwarz Information Criterion
  • M Fathurahman
Fathurahman, M. (2009). Pemilihan Model Regresi Terbaik Menggunakan Metode Akaike's Information Criterion dan Schwarz Information Criterion. Jurnal Informatika Mulawarman, 4(3), 37-41.