Content uploaded by Tommy Gunawan
Author content
All content in this area was uploaded by Tommy Gunawan on Jun 30, 2024
Content may be subject to copyright.
Etika Teknologi Informasi
Semester Genap 2023/2024
1
ANALISIS SENTIMEN PEMBACAAN PUTUSAN MK TERKAIT PILPRES 2024 PADA
APLIKASI X DENGAN METODE NAÏVE BAYES CLASSIFIER
ALIF FATURROHMAN
Departemen Sistem Informasi, Institut Teknologi Sepuluh Nopember, Surabaya, Indonesia, 5026221040@student.its.ac.id
TOMMY GUNAWAN
Departemen Sistem Informasi, Institut Teknologi Sepuluh Nopember, Surabaya, Indonesia, 5026221037@student.its.ac.id
ARYATAMA ATTARIQ H PUTRA
Departemen Sistem Informasi, Institut Teknologi Sepuluh Nopember, Surabaya, Indonesia, 5026211151@student.its.ac.id
NUR AINI RAKHMAWATI
Departemen Sistem Informasi, Institut Teknologi Sepuluh Nopember, Surabaya, Indonesia, nur.aini@its.ac.id
ABSTRAK
Pemilihan umum presiden Indonesia pada tanggal 14 Februari 2024, diikuti oleh tiga pasangan calon, yaitu
Anies-Muhaimin (nomor urut 1), Prabowo-Gibran (nomor urut 2), dan Ganjar-Mahfud (nomor urut 3). Komisi
Pemilihan Umum (KPU) menetapkan Prabowo-Gibran sebagai pemenang, namun keputusan ini ditolak oleh
kedua pasangan lainnya yang mengajukan permohonan sengketa ke Mahkamah Konstitusi (MK). Penelitian ini
bertujuan untuk menganalisis sentimen masyarakat terhadap keputusan MK tersebut, menggunakan data dari
media sosial Twitter (sekarang dikenal sebagai X). Metode yang digunakan adalah Naive Bayes, dengan tahapan
meliputi pengumpulan data melalui scraping, pembersihan data, serta pemrosesan dan pemodelan data. Hasil
analisis menunjukkan distribusi sentimen masyarakat dalam periode waktu yang terbatas, memberikan wawasan
mengenai reaksi publik terhadap keputusan hukum yang krusial ini.
Hasil dari penelitian ini menunjukkan bahwa reaksi publik terhadap keputusan MK sangat beragam,
mencerminkan ketidakpuasan dan penerimaan di kalangan masyarakat. Media sosial berperan penting sebagai
platform untuk mengekspresikan opini publik, dan penggunaan metode Naive Bayes terbukti efektif untuk
mengkategorikan dan memahami opini dari data yang tidak terstruktur, dengan akurasi model mencapai 87%.
Pada klasifikasi kategori "Negative", model mencapai presisi sebesar 80%, recall sebesar 85%, dan F1-score
sebesar 82%, menunjukkan keseimbangan yang baik dalam performa klasifikasi. Untuk kategori "Positive",
model menunjukkan presisi sebesar 88%, recall sebesar 84%, dan F1-score sebesar 86%, mengindikasikan
akurasi dan konsistensi tinggi dalam identifikasi data berlabel positif. Studi ini menyoroti pentingnya
transparansi dan kredibilitas dalam proses pemilu serta penanganan sengketa oleh lembaga hukum, yang
mempengaruhi kepercayaan publik terhadap sistem demokrasi.
Kata Kunci: Pemilihan umum 2024, mahkamah konstitusi, twitter/x, naive bayes, analisis sentimen
1. PENDAHULUAN
Pembacaan putusan mahkamah konstitusi pada sengketa hasil pemilihan presiden Indonesia 2024 menjadi titik
sentimental bagi seluruh warga Indonesia(Hidayat & Wijiningsih, 2024). Pemilihan presiden sebagai bentuk
demokratis tertinggi bangsa menjadi bergejolak dengan adanya keputusan untuk dilakukan gugatan terhadap
pasangan calon presiden yang telah dinyatakan menang yaitu Prabowo Subianto dengan calon wakil presiden
Gibran Rakabuming Raka oleh pasangan calon presiden lainnya. Pemilihan presiden yang dilaksanakan pada
tanggal 14 Februari 2024 memiliki tiga pasangan calon presiden, yaitu: pasangan no urut 1 anies Baswedan
dengan Muhaimin Iskandar, no urut 2 Prabowo Subianto dengan Gibran Rakabuming Raka, dan yang terakhir
no urut 3 Ganjar Pranowo dengan Mohammad Mahfud Mahmodin. Pada tanggal 20 Maret 2024, Komisi
Pemilihan Umum (KPU) mengumumkan bahwa presiden terpilih yang akan memimpin indonesia pada periode
2024-2029 adalah pasangan nomor urut dua, yaitu Prabowo Subianto dan Gibran Rakabuming Raka.
Kemenangan diperoleh dengan mendapatkan 96.214.691 suara dengan persentase 58,6% dengan perbedaan
hasil pada pasangan nomor urut 1 sebanyak 40.971.906 atau 24,9% dan 27.040.878 suara atau 16,5% pada
pasangan nomor urut 03.
Sengketa yang dilakukan oleh pihak yang kalah pada 22 April 2024, Mahkamah Konstitusi menetapkan
keputusan akhir untuk menolak seluruh permohonan yang diajukan oleh pemohon dari pasangan nomor urut 1
2
Anies-Muhaimin dan juga nomor urut 3 Ganjar-Mahfud (Rasji et al., 2024). Penolakan merujuk pada dua
gugatan yang telah terdaftar yaitu 1/PHPU.PRES-XXII/2024 dari pasangan Anies-Muhaimin dan
2/PHPU.PRES-XXII/2024 dari pasangan Ganjar-Mahfud. Penolakan dijadikan keputusan akhir dengan
beberapa alasan, berupa dissenting opinion dari tiga hakim konstitusi yaitu Saldi Isra dengan pendapat yaitu
“seharusnya dilakukan pemungutan suara ulang di beberapa daerah”, Enny Nurbaningsih dengan pendapat yaitu
“pemberian bansos dari presiden diduga untuk kepentingan pilpres”, dan Arief Hidayat dengan pendapat yaitu
“presiden seolah suburkan dinasti politik yang berbungkus virus nepotisme”. Poin yang disorot pada perbedaan
pendapat tersebut antara kesentaraan hak antarwarga negara, pemberian bantuan sosial untuk kepenting
pemilihan presiden 2024, serta keterlibatan Joko Widodo yang dianggap membentuk suatu dinasti politik.
Bantuan sosial yang dilakukan pemerintah dinilai sebagai alat yang dijadikan agenda politik dari salah satu
pasangan dengan adanya keterlibatan aparat, pejabat, serta penyelenggara negara pada eksekusinya. Nepotisme
dan dinasti politik dinilai tidak beralasan menurut hukum walaupun sudah terkoordinasi pada bagan-bagan
negara. Hal terakhir yaitu pandangan bahwa pemilu yang jujur dan adil harus mencakup aspek kesetaraan hak
antarwarga negara serta persaingan yang dimulai pada titik awal pada level yang sama. Kuasa hukum, Yusril
Izha, juga menambahkan pandangannya yang menyatakan bahwa kedua kubu gagal untuk memberikan bukti
konkrit pada dalil-dalil yang diajukan. Keputusan Mahkamah Konstitusi pada akhirnya mengukuhkan
kemenangan kepada pasangan nomor urut 2 yaitu Prabowo Subianto sebagai Presiden dan Gibran Rakabuming
Raka sebagai Wakil Presiden Negara Kesatuan Republik Indonesia dari yang sebelumnya telah dinyatakan oleh
KPU.
Ghulam Asrofi Buntoro telah melakukan penelitian berjudul "Analisis Sentimen Calon Gubernur DKI
Jakarta 2017 Di Twitter" menggunakan metode Naive Bayes Classifier, yang menunjukkan akurasi 95%
dibandingkan Support Vector Machine (SVM) (Buntoro, 2017). Penelitian ini melibatkan tahapan pengumpulan
data tweet, preprocessing data, tokenisasi, part of speech tagging, penentuan class attribute, load dictionary,
determine sentiment, klasifikasi, dan evaluasi hasil, yang kemudian menghasilkan nilai klasifikasi yang
diinginkan. Hal ini deicerminkan pada Keputusan Mahkamah Konstitusi terkait sengketa pemilihan presiden
2024 akan mempengaruhi kepercayaan masyarakat terhadap sistem pemilihan dan integritas demokrasi di
Indonesia. Mengikuti jejak penelitian Buntoro, jurnal ini akan menganalisis sengketa pemilihan presiden 2024
berdasarkan opini dan sentimen publik di aplikasi X, dari awal pemilihan hingga keputusan Mahkamah
Konstitusi pada 22 April 2024 (Ramadhan et al., 2024). Aspek yang dianalisis mencakup bukti, argumen pihak
pemohon dan tertuju, serta potensi dampak (Padri, 2023). Dengan memahami kompleksitas dan nuansa dari
pendapat yang ada dari sengketa pemilihan presiden 2024, artikel ini diharapkan dapat memberikan perspektif
objektif mengenai bagaimana sentimen dari masyarakat terhadap keputusan Mahkamah Konstitusi bagi para
pembacara serta terlibat menjadi bagian pada literatur teknologi Informasi serta demokrasi di Indonesia
(Syahrohim et al., 2024).
Melihat keberhasilan dari penelitian sebelumnya pada tahun 2017, artikel ini akan memiliki tujuan yang
searah dengan fokus pada penggunaan metode Naive Bayes. Artikel ini akan melakukan penanganan terhadap
ketidakeseimbangan kelas dimana masalah yang sering terjadi pada penelitian ini adalah jumlah kategori yang
tidak seimbang. Penelitian ini juga akan sangat memungkinkan untuk menggunakan data-data jenis lain selain
teks yang juga dapat memberikan data tambahan, seperti: gambar, emoji, dan metadata. Keputusan Mahkamah
Konstitusi akan menjadi titik awal penelitian ini akan mengambil data dan informasi dan melihat bagaimana
respon dan dampak dari keputusan tersebut dengan seiring berjalannya waktu.
Untuk menganalisis sentimen publik terhadap hasil pemilu, data preprocessing adalah langkah awal yang
sangat penting. Tahap ini melibatkan persiapan data dengan menghilangkan informasi yang kurang relevan dan
tidak konsisten melalui data cleaning dan text preprocessing. Data cleaning meningkatkan kualitas data dengan
menghapus atau mengoreksi informasi yang salah, tidak lengkap, atau tidak relevan, sementara text
preprocessing mencakup case folding, penghapusan data berisik, penghapusan stopwords, normalisasi teks,
tokenisasi, dan stemming. Setelah data diproses, visualisasi dengan wordcloud dapat membantu peneliti
memahami tema utama dan inti dari teks dengan cepat, memudahkan identifikasi kata-kata kunci dan pola
bahasa yang dominan dalam konteks analisis sentimen.
Feature extraction adalah metode untuk mengidentifikasi karakteristik unik dalam data teks, bertujuan untuk
menghitung dan membandingkan atribut teks berdasarkan histogram kata atau fitur lainnya. Tahap akhir dalam
analisis sentimen adalah data mining menggunakan Naive Bayes Classifier, yang merupakan metode klasifikasi
berbasis teorema Bayes dengan asumsi independensi antar fitur. Naive Bayes sering digunakan dalam klasifikasi
teks karena akurasinya yang tinggi dan komputasinya yang efisien, mampu mengklasifikasikan teks menjadi
sentimen positif, negatif, atau netral dengan efektif.
2. TINJAUAN LITERATUR
Pemilihan Presiden Indonesia tahun 2024 yang telah selesai memberikan hasil yang kontroversial dan Setelah
diumumkannya hasil Pilpres 2024 oleh Komisi Pemilihan Umum (KPU), Paslon 01 dan 03 kemudian membuat
3
permohonan sengketa dengan alasan tidak setuju dengan hasil perhitungan suara. Mahkamah Konstitusi (MK)
kemudian melaksanakan sengketa dimana dalam permohonannya, Paslon 01 dan 03 meminta MK untuk
membatalkan keputusan Komisi Pemilihan Umum (KPU) terkait hasil pemilu dan meminta dilakukannya
pemilu ulang, yang kemudian menghasilkan perdebatan di media sosial. Masyarakat banyak menggunakan
media sosial untuk mengekspresikan opini, pengalaman maupun hal lain yang menjadi perhatian mereka
(Troussas et al., 2013) dan pada aplikasi X tidak sedikit masyarakat yang mengekspresikan opini mereka di
aplikasi tersebut. Dan lebih tidak sedikit lagi masyarakat yang menggunakannya untuk mengekspresikan
opininya mengenai sengketa Pilpres.
Analisis sentimen merupakan teknik yang digunakan untuk mengidentifikasi dan menganalisis pandangan,
sikap, atau pendapat terhadap suatu subjek tertentu, seperti individu, organisasi, atau produk, dalam suatu
kumpulan data (Nasukawa & Yi, 2003). Menurut Cutlip dan Center dalam Resphati (Resphati, 2010), opini
adalah ekspresi dari sikap terhadap isu yang memuat elemen pertentangan, yang dapat ditemukan dalam
berbagai bentuk seperti komentar di platform media sosial, artikel di situs berita, atau tulisan dalam blog pribadi.
2.1 Analisis Sentimen
Analisis sentimen adalah suatu teknik yang digunakan untuk mengenali bagaimana opini atau perasaan tertentu
tercermin dalam teks, serta bagaimana opini tersebut dapat dikelompokkan ke dalam kategori sentimen positif
atau negatif (Nasukawa & Yi, 2003). Kemudian menurut pendapat yang dikemukakan oleh Cvijikj &
Michahelles, di mana analisis sentimen digunakan untuk memahami komentar yang diciptakan oleh pengguna
(internet) dan menjelaskan bagaimana sebuah produk maupun brand diterima oleh mereka (Cvijikj &
Michahelles, 2011). Sedangkan menurut pendapat lain, analisis sentimen adalah proses yang digunakan untuk
menentukan opini, emosi dan sikap yang dicerminkan melalui teks, dan biasanya diklasifikasikan menjadi opini
negatif dan positif (Coletta et al., 2014).
Berdasarkan ketiga pandangan tersebut, dapat disimpulkan bahwa analisis sentimen merupakan suatu proses
yang bertujuan untuk mengidentifikasi dan memahami opini atau perasaan yang dinyatakan oleh individu
melalui teks, dengan kemampuan untuk mengklasifikasikan sentimen tersebut sebagai positif atau negatif.
2.2 Rekomendasi Lain
Naïve Bayes Classifier merupakan algoritma yang sering digunakan dalam data mining karena kemudahannya
dalam penggunaan (Hall, 2007) dan waktu pemrosesan yang cepat. Algoritma ini mudah diimplementasikan
berkat strukturnya yang sederhana namun efektif (Taheri & Mammadov, 2013). Dengan bahasa yang lebih
sederhana, Naive Bayes Classifier mengasumsikan bahwa keberadaan maupun ketidakberadaan sebuah fitur
dalam sebuah kelas tidak memiliki keterkaitan dengan keberadaan maupun ketidakberadaan fitur lainnya.
Sebagai contoh, sesuatu yang berwarna merah, bulat dan memiliki diameter sekitar 10 cm bisa dikategorikan
sebagai buah apel. Walaupun fitur ini bergantung antara satu dengan yang lainnya, Naive Bayes Classifier akan
tetap menganggap bahwa fitur-fitur tersebut independen dan tidak memiliki pengaruh satu sama lainnya (Sujadi,
2022).
Tergantung pada struktur model probabilitasnya, Naive Bayes Classifier dapat dilatih dengan efektif dalam
melakukan pembelajaran terawasi. Dalam berbagai situasi aplikasinya, penaksiran parameter untuk model
Naive Bayes sering menggunakan metode maximum likelihood. Hal ini berarti pengguna dapat menggunakan
model Naive Bayes tanpa harus bergantung pada probabilitas Bayesian atau metode Bayesian.
Persamaan Naïve Bayes Classifier dirumuskan seperti berikut:
𝑃(𝐴|𝐵)=𝑃(𝐵|𝐴)× 𝑃(𝐴)
𝑃(𝐵)
(1)
2.3 Aplikasi X
Aplikasi X atau sebelumnya dinamakan Twitter adalah platform media sosial dan layanan microblogging yang
memungkinkan pengguna untuk mengirim pesan secara real-time. Pesan ini lebih dikenal dengan sebutan
"tweet". Tweet merupakan pesan singkat yang dibatasi oleh panjang karakter, yang umumnya tidak melebihi
140 karakter. Karena keterbatasan karakter, tweet seringkali menggunakan singkatan, bahasa slang, atau
kesalahan pengejaan (Agarwal et al., 2011). Sejak awal, Twitter dirancang sebagai layanan berbasis mobile
yang mengikuti batasan panjang pesan teks pada pesan singkat (SMS), dan hingga kini, Twitter tetap dapat
diakses melalui berbagai perangkat seluler yang mendukung pengiriman dan penerimaan pesan teks (Aukamp
et al., 2014).
X atau Twitter dibuat dengan tujuan untuk menjadi platform yang memungkinkan pengguna saling berbagi
pengalaman tanpa hambatan. Melalui Twitter, pengguna dapat dengan mudah mengikuti tren, cerita, informasi,
dan berita dari berbagai belahan dunia. Selain itu, X juga memfasilitasi penggunanya untuk tetap terhubung
dengan teman-teman dan keluarga mereka. Setiap kali pengguna mengirimkan tweet, pesan tersebut menjadi
publik dan dapat diakses oleh siapa pun, di mana pun, dan kapan pun. Terlebih lagi, bagi orang yang mengikuti
akun Twitter tersebut, tweet-tweet tersebut akan otomatis muncul di lini masa mereka.
4
2.4 Pilpres 2024
Pemilihan Presiden Republik Indonesia, yang juga dikenal sebagai Pemilihan Umum (Pemilu), merupakan salah
satu agenda krusial dalam sistem politik Negara Kesatuan Republik Indonesia (NKRI), yang diadakan setelah
pemilihan lembaga legislatif. Seiring berjalannya waktu, pilpres menjadi salah satu elemen paling signifikan
dalam dinamika politik (Farha et al., 2024).
Pada Pilpres 2024 terdapat 3 Paslon yaitu Paslon Nomor 1 Anies Baswedan-Muhaimin Iskandar, Paslon
Nomor 2 Prabowo Subianto-Gibran Rakabuming, dan Paslon Nomor 3 Ganjar Pranowo-Mahfud MD. Pasangan
Nomor Urut 1 Anies Baswedan-Muhaimin Iskandar dan Pasangan Nomor Urut 3 Ganjar Pranowo-Mahfud MD
mengajukan permohonan sengketa Pilpres 2024 ke MK. Dalam tuntutannya, kedua paslon meminta MK untuk
membatalkan keputusan Komisi Pemilihan Umum (KPU) terkait hasil pemilu dan meminta dilakukannya
pemilu ulang (Heriani, 2024).
2.5 Pembacaan Putusan MK
Proses pembacaan putusan Mahkamah Konstitusi (MK) adalah tahap akhir dalam proses persidangan di MK.
Sidang Pengucapan Putusan dilaksanakan dalam Sidang Pleno terbuka untuk umum yang dihadiri paling sedikit
7 orang Hakim dan para pihak. Putusan MK mempunyai kekuatan hukum mengikat sejak diucapkan dalam
Sidang Pleno terbuka. Setelah diucapkan, putusan tersebut diunggah pada laman resmi MK dan dapat diakses
oleh masyarakat (Sekretariat Jenderal dan Kepaniteraan Mahkamah Konstitusi, 2010).
3. METODOLOGI
Metode yang digunakan dalam penelitian ini adalah metode Naïve Bayes Classifier. Berikut tahapan-tahapan
yang ditunjukkan untuk melakukan penelitian pada Gambar 1.
Gambar 1. Tahapan metodologi menggunakan Naïve Bayes Classifier
3.1 Pengumpulan Data menggunakan Web Scrapping
Pengumpulan data adalah tahap pertama dalam penelitian ini. Web scraping adalah teknik otomatisasi
pengambilan data dari website, yang memfasilitasi ekstraksi konten dalam berbagai format, termasuk namun
tidak terbatas pada teks, hyperlink, gambar, video, audio, dan dokumen (Flores et al., 2020). Metode ini telah
diadopsi secara ekstensif di lintas sektor, mulai dari penelitian hingga analisis pasar dan pengumpulan data
komersial.
3.2 Data Selection
Data selection atau pemilihan data adalah tahap kedua dalam penelitian ini. Proses ini mencakup pemilihan data
yang relevan dari suatu dataset untuk dianalisis lebih lanjut. Pada tahap ini, peneliti harus memastikan bahwa
data yang dipilih sesuai dengan tujuan penelitian dan cukup representatif untuk menghasilkan hasil yang valid.
Pemilihan data yang tepat sangat penting untuk meningkatkan akurasi analisis dan mengurangi bias yang
mungkin dihasilkan dari data yang tidak relevan atau tidak memadai (Gharatkar et al., 2017).
3.3 Data Preprocessing
Data preprocessing merupakan langkah awal yang sangat krusial dalam pengolahan data. Pada tahap ini, data
dipersiapkan untuk analisis dengan tujuan menghilangkan data yang kurang relevan dan tidak konsisten
(Gharatkar et al., 2017).
3.3.1 Data Cleaning
Data cleaning adalah langkah data preprocessing untuk meningkatkan kualitas data dengan menghapus atau
mengoreksi informasi yang salah, tidak lengkap, atau tidak relevan. Tahapan ini mencakup pendeteksian dan
perbaikan masalah data, menghapus kolom yang tidak diinginkan, dan menyelesaikan ketidaksesuaian untuk
memastikan data yang lebih bersih dan akurat (Gharatkar et al., 2017).
3.3.2 Text Preprocessing
Text preprocessing merupakan tahapan standar dalam melakukan analisis sentimen, tahapan-tahapan pada text
preprocessing adalah sebagai berikut :
1. Case Folding : Mengubah huruf kapital pada setiap kata menjadi huruf kecil
2. Remove Noisy Data : Menghapus karakter khusus, tagar, URL, dan hyperlink yang tidak diperlukan dalam
analisis.
3. Remove Stopwords : Menghapus kata-kata yang tidak memiliki makna yang signifikan dalam analisis
sentimen. Contoh penggunaan dari remove stopwords adalah penghapusan kata "aku", "dan", "atau",
"adalah", dan lain sebagainya.
5
4. Text Normalization : Memeriksa dan memperbaiki kesalahan ejaan, serta menghapus kata-kata yang tidak
signifikan untuk analisis seperti "yg", "gak", "sdh", "tp" dll.
5. Tokenization : Memecah teks menjadi kata atau frasa menjadi unit terkecil
6. Stemming : Mengubah kata menjadi kata dasar. Contoh penggunaan dari stemming adalah "menghormati"
menjadi "hormat".
3.4 Visualisasi dengan WordCloud
Wordcloud adalah sistem yang menghasilkan visualisasi kata-kata, menyoroti frekuensi kemunculan kata-kata
tertentu dalam teks. Penggunaan wordcloud dalam analisis wacana membantu peneliti dengan cepat memahami
tema utama dan inti dari teks. Selain itu, wordcloud memudahkan dalam mengidentifikasi kata-kata kunci dan
pola bahasa yang dominan, sehingga mempercepat proses analisis dan interpretasi data secara keseluruhan
(Qeis, 2015).
3.5 Feature Extraction
Feature extraction merupakan metode untuk mengidentifikasi objek dengan memanfaatkan histogram unik yang
ada pada objek tersebut. Tujuan dari Feature extraction adalah untuk menghitung dan membandingkan
karakteristik, yang kemudian digunakan untuk mengklasifikasikan teks berdasarkan atribut histogram yang data
miliki (Religia et al., 2019).
3.6 Data Mining dengan Naïve Bayes Classifier
Naive Bayes adalah salah satu metode klasifikasi yang didasarkan pada penerapan teorema Bayes dengan
asumsi kesederhanaan (naive) bahwa setiap fitur bersifat independen satu sama lain. Metode ini sering
digunakan dalam klasifikasi teks karena memiliki akurasi yang cukup tinggi dan komputasi yang efisien
(Handayani & Pribadi, 2015).
4. HASIL DAN PEMBAHASAN
4.1 Pengumpulan Data Menggunakan Web Scrapping
Penelitian ini menerapkan metode web scrapping untuk mengumpulkan data dari platform X (Twitter), dengan
menggunakan frasa pencarian “MK Hasil Pemilu” selama periode 22-29 Maret 2024, menghasilkan data terkini
yang ditampilkan pada Gambar 2. Dari proses ini, berhasil dikumpulkan sejumlah 305 cuitan yang belum
diproses untuk analisis lebih mendalam (Faturrohman et al., 2024).
Gambar 2. Tahapan metodologi menggunakan Naïve Bayes Classifier
Setelah dilakukan web scrapping, tahap penambahan label (labeling) dilakukan dengan pembuatan kolom baru
di dataset yang ditambahkan secara manual oleh peneliti untuk mengklasifikasikan kategori atau sentimen data
yang termasuk kedalam “Negative”, “Neutral”, atau “Positive”.
4.2 Data Selection
Dalam penelitian ini, analisis sentimen akan difokuskan hanya pada penggunaan dua kolom data, yaitu
"full_text" dan "label". Kolom "full_text" berisi teks lengkap dari setiap cuitan, sementara kolom "label"
mengindikasikan kategori atau sentimen yang terkait dengan teks tersebut yang nantinya akan digunakan untuk
data pelatihan. Kolom-kolom lainnya seperti "conversation_id_str", "created_at", "favorite_count",
"image_url", "lang", "location", "quote_count", "reply_count", dan "retweed_count" tidak akan digunakan
dalam analisis ini.
4.3 Data Preprocessing
6
Pada tahap ini , data yang dianggap kurang relevan, yang salah, tidak lengkap. Tahap data preprocessing ini
dilakukan pada data dari kolom "conversation_id_str", "created_at", "favorite_count", "image_url", "lang",
"location", "quote_count", "reply_count", dan "retweed_count".
4.3.1 Data Cleaning
Pada penelitian ini data cleaning digunakan untuk memfilter data untuk mendapatkan data yang
nantinya dapat dilakukan analisis sentimen dengan menggunakan data pada kolom “full_text” yang
berisi cuitan pengguna X, dan kolom “label” yang berisi nilai “Negative”, “Neutral”, dan “Positive”.
Pada tahap ini 305 data cuitan yang terkumpul dibersihkan hingga menjadi tersisa 152 baris data yang
siap dianalisis lebih lanjut.
4.3.2 Text Preprocessing
Data pada kolom “full_text” akan diolah lebih lanjut dengan menggunakan text preprocessing untuk
mendapatkan baris data yang layak dan siap untuk analisis sentimen menggunakan model Naïve Bayes
Classifier. Tahap text preprocessing dilakukan secara bertahap dengan case folding, remove noisy data, remove
stopwords, text normalization, tokenization, dan stemming. Gambar 3 menjelaskan bagaimana data akan
diproses lebih lanjut dengan text preprocessing.
Gambar 3. Data Web Scrapping setelah dilakukan Text Preprocessing
4.4 Visualisasi dengan WordCloud
Visualisasi menggunakan WordCloud memudahkan peneliti dalam menganalisis kata-kata yang berpengaruh
signifikan dalam menentukan hasil analisis sentimen dengan membantu mengidentifikasi tren dan pola dalam
opini atau sentimen yang diungkapkan. Dalam WordCloud, kata dengan ukuran lebih besar menunjukkan
frekuensi kemunculan yang lebih tinggi, yang berarti kata tersebut lebih dominan dalam korpus teks yang
dianalisis. Hal ini sering kali mencerminkan pentingnya kata tersebut dalam konteks subjek yang dibahas,
memberikan wawasan tentang tema dan konsep kunci yang sering muncul dalam data teks. Hasil analisis ini,
yang mengungkap kata-kata berdampak pada sentimen, ditampilkan dalam Gambar 4 dan 5.
Gambar 4. Kumpulan kata hasil WordCloud dengan sentimen positif
7
Gambar 5. Kumpulan kata hasil WordCloud dengan sentimen negatif
4.5 Feature Extraction
Dalam penelitian ini, peneliti menggunakan CountVectorizer untuk mengubah representasi teks hasil data
preprocessing menjadi sebuah matriks yang berisi hitungan token. Setiap dokumen teks direpresentasikan
sebagai vektor dengan panjang yang sebanding dengan jumlah kata unik dalam seluruh kumpulan teks. Nilai
pada setiap elemen vektor menunjukkan frekuensi kemunculan kata tertentu dalam dokumen (Scikit-Learn,
2024). Hasil akhirnya adalah matriks yang menunjukkan jumlah token (kata) dalam setiap dokumen.
4.6 Data Mining dengan Model Naive Bayes Classifier
Pada proses data mining menggunakan algoritma Naive Bayes, model yang dibangun berhasil menunjukkan
performa yang cukup baik dengan tingkat akurasi keseluruhan sebesar 84%. Tingkat akurasi ini menunjukkan
bahwa model mampu mengklasifikasikan data dengan benar pada sebagian besar kasus yang diuji.
Gambar 6. Laporan evaluasi performa model Naïve Bayes Classifier
Pada klasifikasi kategori "Negative", model berhasil mencapai presisi sebesar 80%, yang berarti 80% dari
data yang diklasifikasikan sebagai "Negative" oleh model memang benar-benar termasuk dalam kategori
tersebut. Recall untuk kategori ini sebesar 85%, menunjukkan bahwa model mampu mengidentifikasi 85% dari
seluruh data yang sebenarnya berlabel "Negative". F1-score untuk kategori ini tercatat sebesar 82%, yang
merupakan harmonic mean dari presisi dan recall, menunjukkan keseimbangan antara kedua metrik tersebut
dalam performa klasifikasi. Dari hasil ini, dapat disimpulkan bahwa model mampu mengklasifikasikan data
dalam kategori "Negative" dengan baik dan cukup andal.
Untuk klasifikasi kategori "Positive", model menunjukkan performa yang lebih tinggi dengan presisi
sebesar 88%. Ini berarti 88% dari data yang diklasifikasikan sebagai "Positive" oleh model benar-benar berlabel
"Positive". Recall untuk kategori ini sebesar 84%, menunjukkan kemampuan model dalam mengidentifikasi
84% dari seluruh data yang sebenarnya berlabel "Positive". F1-score untuk kategori "Positive" tercatat sebesar
86%, yang mengindikasikan keseimbangan yang baik antara presisi dan recall pada kategori ini. Hal ini
menunjukkan bahwa model tidak hanya mampu mengidentifikasi data dengan label "Positive" dengan akurat,
tetapi juga secara konsisten dalam berbagai situasi pengujian.
5. KESIMPULAN
Berdasarkan hasil evaluasi performa model yang telah peneliti lakukan, dapat disimpulkan bahwa model Naive
Bayes yang digunakan dalam proses data mining ini mampu mengklasifikasikan data dengan baik, baik pada
kategori "Negative" maupun "Positive". Tingkat akurasi yang tinggi dan keseimbangan yang baik antara presisi,
recall, dan f1-score menunjukkan bahwa model ini dapat diandalkan untuk tugas-tugas klasifikasi yang serupa.
Dengan demikian, model ini layak untuk digunakan dalam aplikasi praktis yang membutuhkan analisis dan
klasifikasi data secara akurat.
8
DAFTAR PUSTAKA
Agarwal, A., Xie, B., Vovsha, I., Rambow, O., & Passonneau, R. J. (2011). Sentiment Analysis of Twitter Data.
Proceedings of the Workshop on Language in Social Media (LSM 2011), pp. 30–38.
Aukamp, B., Coyne, B., Evins, S., Golden, J., Greenberger, P., Lapin, L., Neaman, L., Niestzche, J., Reigle, S., & Sharp,
A. (2014). The Twitter Government and Elections Handbook (U.S. Edition). Twitter, Inc.
Buntoro, G. A. (2017). Analisis Sentimen Calon Gubernur DKI Jakarta 2017 Di Twitter. INTEGER: Journal of
Information Technology, 2(1). https://doi.org/10.31284/j.integer.2017.v2i1.95
Coletta, L. F. S., Silva, N. F. F. da, Hruschka, E. R., & Hruschka, E. R. (2014). Combining Classification and Clustering
for Tweet Sentiment Analysis. 2014 Brazilian Conference on Intelligent Systems, pp. 210–215.
https://doi.org/10.1109/BRACIS.2014.46
Cvijikj, I. P., & Michahelles, F. (2011). Understanding social media marketing. Proceedings of the 15th International
Academic MindTrek Conference: Envisioning Future Media Environments, pp. 175–182.
https://doi.org/10.1145/2181037.2181066
Farha, S. W. A., Pratiwi, A. E., Prasasti, F. E., Maulita, S. A., & Aina, N. N. (2024). Partisipasi Mahasiswa UPGRIS
dalam Pilpres 2024. Pena Edukasia, 2(2), pp. 54–59.
Faturrohman, A., Gunawan, T., & Putra, A. A. H. (2024). Dataset X MK Hasil Pemilu.
https://doi.org/https://doi.org/10.5281/zenodo.11314620
Flores, V. A., Permatasari, P. A., & Jasa, L. (2020). Penerapan Web Scraping Sebagai Media Pencarian dan Menyimpan
Artikel Ilmiah Secara Otomatis Berdasarkan Keyword. Majalah Ilmiah Teknologi Elektro, 19(2), pp. 157.
https://doi.org/10.24843/MITE.2020.v19i02.P06
Gharatkar, S., Ingle, A., Naik, T., & Save, A. (2017). Review preprocessing using data cleaning and stemming technique.
2017 International Conference on Innovations in Information, Embedded and Communication Systems (ICIIECS),
pp. 1–4. https://doi.org/10.1109/ICIIECS.2017.8276011
Hall, M. (2007). A decision tree-based attribute weighting filter for naive Bayes. Knowledge-Based Systems, 20(2), pp.
120–126. https://doi.org/10.1016/j.knosys.2006.11.008
Handayani, F., & Pribadi, F. S. (2015). Implementasi Algoritma Naive Bayes Classifier dalam Pengklasifikasian Teks
Otomatis Pengaduan dan Pelaporan Masyarakat melalui Layanan Call Center 110. JURNAL TEKNIK ELEKTRO,
7(1), pp. 19–24.
Heriani, F. N. (2024). Mengenal Ragam Putusan MK Terkait Sengketa Hasil Pemilu.
https://www.hukumonline.com/berita/a/mengenal-ragam-putusan-mk-terkait-sengketa-hasil-pemilu-
lt661e63abe2d24/?utm_source=copy&utm_medium=berita&utm_campaign=shared_sosmed.
Hidayat, B. H. R., & Wijiningsih, N. (2024). PERBANDINGAN PENYELESAIAN SENGKETA PEMILIHAN UMUM
PRESIDEN DI INDONESIA DAN BRASIL. Reformasi Hukum Trisakti, 6(1), pp. 186–196.
https://doi.org/10.25105/refor.v6i1.19193
Nasukawa, T., & Yi, J. (2003). Sentiment analysis. Proceedings of the 2nd International Conference on Knowledge
Capture, pp. 70–77. https://doi.org/10.1145/945645.945658
Padri, A. R. (2023). KLASIFIKASI KEMANCETAN LALU LINTAS DI INDONESIA MENGGUNAKAN METODE
NAIVE BAYES CLASSIFICATION. Simetris: Jurnal Teknik Mesin, Elektro Dan Ilmu Komputer, 14(2), pp. 297–
310. https://doi.org/10.24176/simet.v14i2.10102
Qeis, M. I. (2015). APLIKASI WORDCLOUD SEBAGAI ALAT BANTU ANALISIS WACANA. International
Conference on Language, Culture, and Society - ICLCS LIPI.
Ramadhan, A., Rasya, H. S., Joe, C. P., & Triadi, I. (2024). Pengaruh Teknologi Dan Media Sosial Dalam Tata Negara
Dan Proses Pemilihan Presiden: Tinjauan Pada Pemilihan Presiden 2024. INNOVATIVE: Journal Of Social Science
Research, 4(2), pp. 7662–7674.
Rasji, R., Simbolon, E. Z., & Kasslim, V. (2024). Penyelesaian Sengketa Hasil Pemilihan Presiden dan Wakil Presiden
Tahun 2024 di Mahkamah Konstitusi. Jurnal Pendidikan Sejarah Dan Riset Sosial Humaniora, 4(2), pp. 48–54.
Religia, Y., Rusdi, A., Romli, I., & Mazid, A. (2019). Feature Extraction untuk Klasifikasi Pengenalan Wajah
Menggunakan Support Vector Machine Dan K-Nearest Neighbor. Pelita Teknologi, 14(2), pp. 85–92.
Resphati, A. (2010). Opini masyarakat tentang pemberitaan demo 100 hari pemerintahan SBY - Boediono di Surat
Kabar Jawa Pos Edisi 27-29 januari 2010. UPN Veteran Jawa Timur.
Scikit-Learn. (2024). CountVectorizer. Scikit-Learn.Org.
Sekretariat Jenderal dan Kepaniteraan Mahkamah Konstitusi. (2010). Hukum Acara Mahkamah Konstitusi. Mahkamah
Konstitusi.
Sujadi, H. (2022). ANALISIS SENTIMEN PENGGUNA MEDIA SOSIAL TWITTER TERHADAP WABAH COVID-
19 DENGAN METODE NAIVE BAYES CLASSIFIER DAN SUPPORT VECTOR MACHINE. INFOTECH
Journal, 8(1), pp. 22–27. https://doi.org/10.31949/infotech.v8i1.1883
Syahrohim, I., Saputra, S. D., Saputra, R. W., Pranatawijaya, V. H., & Priskila, R. (2024). PERBANDINGAN
ANALISIS SENTIMEN SETELAH PILPRES 2024 DI TWITTER MENGGUNAKAN ALGORITMA MACHINE
LEARNING. Jurnal Informatika Dan Teknik Elektro Terapan, 12(2), pp. 1388–1395.
https://doi.org/10.23960/jitet.v12i2.4249
Taheri, S., & Mammadov, M. (2013). Learning the naive Bayes classifier with optimization models. International
Journal of Applied Mathematics and Computer Science, 23(4), pp. 787–795. https://doi.org/10.2478/amcs-2013-0059
Troussas, C., Virvou, M., Espinosa, K. J., Llaguno, K., & Caro, J. (2013). Sentiment analysis of Facebook statuses using
Naive Bayes classifier for language learning. IISA 2013, pp. 1–6. https://doi.org/10.1109/IISA.2013.6623713