ArticlePDF Available
Etika Teknologi Informasi
Semester Genap 2023/2024
1
ANALISIS SENTIMEN PEMBACAAN PUTUSAN MK TERKAIT PILPRES 2024 PADA
APLIKASI X DENGAN METODE NAÏVE BAYES CLASSIFIER
ALIF FATURROHMAN
Departemen Sistem Informasi, Institut Teknologi Sepuluh Nopember, Surabaya, Indonesia, 5026221040@student.its.ac.id
TOMMY GUNAWAN
Departemen Sistem Informasi, Institut Teknologi Sepuluh Nopember, Surabaya, Indonesia, 5026221037@student.its.ac.id
ARYATAMA ATTARIQ H PUTRA
Departemen Sistem Informasi, Institut Teknologi Sepuluh Nopember, Surabaya, Indonesia, 5026211151@student.its.ac.id
NUR AINI RAKHMAWATI
Departemen Sistem Informasi, Institut Teknologi Sepuluh Nopember, Surabaya, Indonesia, nur.aini@its.ac.id
ABSTRAK
Pemilihan umum presiden Indonesia pada tanggal 14 Februari 2024, diikuti oleh tiga pasangan calon, yaitu
Anies-Muhaimin (nomor urut 1), Prabowo-Gibran (nomor urut 2), dan Ganjar-Mahfud (nomor urut 3). Komisi
Pemilihan Umum (KPU) menetapkan Prabowo-Gibran sebagai pemenang, namun keputusan ini ditolak oleh
kedua pasangan lainnya yang mengajukan permohonan sengketa ke Mahkamah Konstitusi (MK). Penelitian ini
bertujuan untuk menganalisis sentimen masyarakat terhadap keputusan MK tersebut, menggunakan data dari
media sosial Twitter (sekarang dikenal sebagai X). Metode yang digunakan adalah Naive Bayes, dengan tahapan
meliputi pengumpulan data melalui scraping, pembersihan data, serta pemrosesan dan pemodelan data. Hasil
analisis menunjukkan distribusi sentimen masyarakat dalam periode waktu yang terbatas, memberikan wawasan
mengenai reaksi publik terhadap keputusan hukum yang krusial ini.
Hasil dari penelitian ini menunjukkan bahwa reaksi publik terhadap keputusan MK sangat beragam,
mencerminkan ketidakpuasan dan penerimaan di kalangan masyarakat. Media sosial berperan penting sebagai
platform untuk mengekspresikan opini publik, dan penggunaan metode Naive Bayes terbukti efektif untuk
mengkategorikan dan memahami opini dari data yang tidak terstruktur, dengan akurasi model mencapai 87%.
Pada klasifikasi kategori "Negative", model mencapai presisi sebesar 80%, recall sebesar 85%, dan F1-score
sebesar 82%, menunjukkan keseimbangan yang baik dalam performa klasifikasi. Untuk kategori "Positive",
model menunjukkan presisi sebesar 88%, recall sebesar 84%, dan F1-score sebesar 86%, mengindikasikan
akurasi dan konsistensi tinggi dalam identifikasi data berlabel positif. Studi ini menyoroti pentingnya
transparansi dan kredibilitas dalam proses pemilu serta penanganan sengketa oleh lembaga hukum, yang
mempengaruhi kepercayaan publik terhadap sistem demokrasi.
Kata Kunci: Pemilihan umum 2024, mahkamah konstitusi, twitter/x, naive bayes, analisis sentimen
1. PENDAHULUAN
Pembacaan putusan mahkamah konstitusi pada sengketa hasil pemilihan presiden Indonesia 2024 menjadi titik
sentimental bagi seluruh warga Indonesia(Hidayat & Wijiningsih, 2024). Pemilihan presiden sebagai bentuk
demokratis tertinggi bangsa menjadi bergejolak dengan adanya keputusan untuk dilakukan gugatan terhadap
pasangan calon presiden yang telah dinyatakan menang yaitu Prabowo Subianto dengan calon wakil presiden
Gibran Rakabuming Raka oleh pasangan calon presiden lainnya. Pemilihan presiden yang dilaksanakan pada
tanggal 14 Februari 2024 memiliki tiga pasangan calon presiden, yaitu: pasangan no urut 1 anies Baswedan
dengan Muhaimin Iskandar, no urut 2 Prabowo Subianto dengan Gibran Rakabuming Raka, dan yang terakhir
no urut 3 Ganjar Pranowo dengan Mohammad Mahfud Mahmodin. Pada tanggal 20 Maret 2024, Komisi
Pemilihan Umum (KPU) mengumumkan bahwa presiden terpilih yang akan memimpin indonesia pada periode
2024-2029 adalah pasangan nomor urut dua, yaitu Prabowo Subianto dan Gibran Rakabuming Raka.
Kemenangan diperoleh dengan mendapatkan 96.214.691 suara dengan persentase 58,6% dengan perbedaan
hasil pada pasangan nomor urut 1 sebanyak 40.971.906 atau 24,9% dan 27.040.878 suara atau 16,5% pada
pasangan nomor urut 03.
Sengketa yang dilakukan oleh pihak yang kalah pada 22 April 2024, Mahkamah Konstitusi menetapkan
keputusan akhir untuk menolak seluruh permohonan yang diajukan oleh pemohon dari pasangan nomor urut 1
2
Anies-Muhaimin dan juga nomor urut 3 Ganjar-Mahfud (Rasji et al., 2024). Penolakan merujuk pada dua
gugatan yang telah terdaftar yaitu 1/PHPU.PRES-XXII/2024 dari pasangan Anies-Muhaimin dan
2/PHPU.PRES-XXII/2024 dari pasangan Ganjar-Mahfud. Penolakan dijadikan keputusan akhir dengan
beberapa alasan, berupa dissenting opinion dari tiga hakim konstitusi yaitu Saldi Isra dengan pendapat yaitu
“seharusnya dilakukan pemungutan suara ulang di beberapa daerah”, Enny Nurbaningsih dengan pendapat yaitu
“pemberian bansos dari presiden diduga untuk kepentingan pilpres”, dan Arief Hidayat dengan pendapat yaitu
“presiden seolah suburkan dinasti politik yang berbungkus virus nepotisme”. Poin yang disorot pada perbedaan
pendapat tersebut antara kesentaraan hak antarwarga negara, pemberian bantuan sosial untuk kepenting
pemilihan presiden 2024, serta keterlibatan Joko Widodo yang dianggap membentuk suatu dinasti politik.
Bantuan sosial yang dilakukan pemerintah dinilai sebagai alat yang dijadikan agenda politik dari salah satu
pasangan dengan adanya keterlibatan aparat, pejabat, serta penyelenggara negara pada eksekusinya. Nepotisme
dan dinasti politik dinilai tidak beralasan menurut hukum walaupun sudah terkoordinasi pada bagan-bagan
negara. Hal terakhir yaitu pandangan bahwa pemilu yang jujur dan adil harus mencakup aspek kesetaraan hak
antarwarga negara serta persaingan yang dimulai pada titik awal pada level yang sama. Kuasa hukum, Yusril
Izha, juga menambahkan pandangannya yang menyatakan bahwa kedua kubu gagal untuk memberikan bukti
konkrit pada dalil-dalil yang diajukan. Keputusan Mahkamah Konstitusi pada akhirnya mengukuhkan
kemenangan kepada pasangan nomor urut 2 yaitu Prabowo Subianto sebagai Presiden dan Gibran Rakabuming
Raka sebagai Wakil Presiden Negara Kesatuan Republik Indonesia dari yang sebelumnya telah dinyatakan oleh
KPU.
Ghulam Asrofi Buntoro telah melakukan penelitian berjudul "Analisis Sentimen Calon Gubernur DKI
Jakarta 2017 Di Twitter" menggunakan metode Naive Bayes Classifier, yang menunjukkan akurasi 95%
dibandingkan Support Vector Machine (SVM) (Buntoro, 2017). Penelitian ini melibatkan tahapan pengumpulan
data tweet, preprocessing data, tokenisasi, part of speech tagging, penentuan class attribute, load dictionary,
determine sentiment, klasifikasi, dan evaluasi hasil, yang kemudian menghasilkan nilai klasifikasi yang
diinginkan. Hal ini deicerminkan pada Keputusan Mahkamah Konstitusi terkait sengketa pemilihan presiden
2024 akan mempengaruhi kepercayaan masyarakat terhadap sistem pemilihan dan integritas demokrasi di
Indonesia. Mengikuti jejak penelitian Buntoro, jurnal ini akan menganalisis sengketa pemilihan presiden 2024
berdasarkan opini dan sentimen publik di aplikasi X, dari awal pemilihan hingga keputusan Mahkamah
Konstitusi pada 22 April 2024 (Ramadhan et al., 2024). Aspek yang dianalisis mencakup bukti, argumen pihak
pemohon dan tertuju, serta potensi dampak (Padri, 2023). Dengan memahami kompleksitas dan nuansa dari
pendapat yang ada dari sengketa pemilihan presiden 2024, artikel ini diharapkan dapat memberikan perspektif
objektif mengenai bagaimana sentimen dari masyarakat terhadap keputusan Mahkamah Konstitusi bagi para
pembacara serta terlibat menjadi bagian pada literatur teknologi Informasi serta demokrasi di Indonesia
(Syahrohim et al., 2024).
Melihat keberhasilan dari penelitian sebelumnya pada tahun 2017, artikel ini akan memiliki tujuan yang
searah dengan fokus pada penggunaan metode Naive Bayes. Artikel ini akan melakukan penanganan terhadap
ketidakeseimbangan kelas dimana masalah yang sering terjadi pada penelitian ini adalah jumlah kategori yang
tidak seimbang. Penelitian ini juga akan sangat memungkinkan untuk menggunakan data-data jenis lain selain
teks yang juga dapat memberikan data tambahan, seperti: gambar, emoji, dan metadata. Keputusan Mahkamah
Konstitusi akan menjadi titik awal penelitian ini akan mengambil data dan informasi dan melihat bagaimana
respon dan dampak dari keputusan tersebut dengan seiring berjalannya waktu.
Untuk menganalisis sentimen publik terhadap hasil pemilu, data preprocessing adalah langkah awal yang
sangat penting. Tahap ini melibatkan persiapan data dengan menghilangkan informasi yang kurang relevan dan
tidak konsisten melalui data cleaning dan text preprocessing. Data cleaning meningkatkan kualitas data dengan
menghapus atau mengoreksi informasi yang salah, tidak lengkap, atau tidak relevan, sementara text
preprocessing mencakup case folding, penghapusan data berisik, penghapusan stopwords, normalisasi teks,
tokenisasi, dan stemming. Setelah data diproses, visualisasi dengan wordcloud dapat membantu peneliti
memahami tema utama dan inti dari teks dengan cepat, memudahkan identifikasi kata-kata kunci dan pola
bahasa yang dominan dalam konteks analisis sentimen.
Feature extraction adalah metode untuk mengidentifikasi karakteristik unik dalam data teks, bertujuan untuk
menghitung dan membandingkan atribut teks berdasarkan histogram kata atau fitur lainnya. Tahap akhir dalam
analisis sentimen adalah data mining menggunakan Naive Bayes Classifier, yang merupakan metode klasifikasi
berbasis teorema Bayes dengan asumsi independensi antar fitur. Naive Bayes sering digunakan dalam klasifikasi
teks karena akurasinya yang tinggi dan komputasinya yang efisien, mampu mengklasifikasikan teks menjadi
sentimen positif, negatif, atau netral dengan efektif.
2. TINJAUAN LITERATUR
Pemilihan Presiden Indonesia tahun 2024 yang telah selesai memberikan hasil yang kontroversial dan Setelah
diumumkannya hasil Pilpres 2024 oleh Komisi Pemilihan Umum (KPU), Paslon 01 dan 03 kemudian membuat
3
permohonan sengketa dengan alasan tidak setuju dengan hasil perhitungan suara. Mahkamah Konstitusi (MK)
kemudian melaksanakan sengketa dimana dalam permohonannya, Paslon 01 dan 03 meminta MK untuk
membatalkan keputusan Komisi Pemilihan Umum (KPU) terkait hasil pemilu dan meminta dilakukannya
pemilu ulang, yang kemudian menghasilkan perdebatan di media sosial. Masyarakat banyak menggunakan
media sosial untuk mengekspresikan opini, pengalaman maupun hal lain yang menjadi perhatian mereka
(Troussas et al., 2013) dan pada aplikasi X tidak sedikit masyarakat yang mengekspresikan opini mereka di
aplikasi tersebut. Dan lebih tidak sedikit lagi masyarakat yang menggunakannya untuk mengekspresikan
opininya mengenai sengketa Pilpres.
Analisis sentimen merupakan teknik yang digunakan untuk mengidentifikasi dan menganalisis pandangan,
sikap, atau pendapat terhadap suatu subjek tertentu, seperti individu, organisasi, atau produk, dalam suatu
kumpulan data (Nasukawa & Yi, 2003). Menurut Cutlip dan Center dalam Resphati (Resphati, 2010), opini
adalah ekspresi dari sikap terhadap isu yang memuat elemen pertentangan, yang dapat ditemukan dalam
berbagai bentuk seperti komentar di platform media sosial, artikel di situs berita, atau tulisan dalam blog pribadi.
2.1 Analisis Sentimen
Analisis sentimen adalah suatu teknik yang digunakan untuk mengenali bagaimana opini atau perasaan tertentu
tercermin dalam teks, serta bagaimana opini tersebut dapat dikelompokkan ke dalam kategori sentimen positif
atau negatif (Nasukawa & Yi, 2003). Kemudian menurut pendapat yang dikemukakan oleh Cvijikj &
Michahelles, di mana analisis sentimen digunakan untuk memahami komentar yang diciptakan oleh pengguna
(internet) dan menjelaskan bagaimana sebuah produk maupun brand diterima oleh mereka (Cvijikj &
Michahelles, 2011). Sedangkan menurut pendapat lain, analisis sentimen adalah proses yang digunakan untuk
menentukan opini, emosi dan sikap yang dicerminkan melalui teks, dan biasanya diklasifikasikan menjadi opini
negatif dan positif (Coletta et al., 2014).
Berdasarkan ketiga pandangan tersebut, dapat disimpulkan bahwa analisis sentimen merupakan suatu proses
yang bertujuan untuk mengidentifikasi dan memahami opini atau perasaan yang dinyatakan oleh individu
melalui teks, dengan kemampuan untuk mengklasifikasikan sentimen tersebut sebagai positif atau negatif.
2.2 Rekomendasi Lain
Naïve Bayes Classifier merupakan algoritma yang sering digunakan dalam data mining karena kemudahannya
dalam penggunaan (Hall, 2007) dan waktu pemrosesan yang cepat. Algoritma ini mudah diimplementasikan
berkat strukturnya yang sederhana namun efektif (Taheri & Mammadov, 2013). Dengan bahasa yang lebih
sederhana, Naive Bayes Classifier mengasumsikan bahwa keberadaan maupun ketidakberadaan sebuah fitur
dalam sebuah kelas tidak memiliki keterkaitan dengan keberadaan maupun ketidakberadaan fitur lainnya.
Sebagai contoh, sesuatu yang berwarna merah, bulat dan memiliki diameter sekitar 10 cm bisa dikategorikan
sebagai buah apel. Walaupun fitur ini bergantung antara satu dengan yang lainnya, Naive Bayes Classifier akan
tetap menganggap bahwa fitur-fitur tersebut independen dan tidak memiliki pengaruh satu sama lainnya (Sujadi,
2022).
Tergantung pada struktur model probabilitasnya, Naive Bayes Classifier dapat dilatih dengan efektif dalam
melakukan pembelajaran terawasi. Dalam berbagai situasi aplikasinya, penaksiran parameter untuk model
Naive Bayes sering menggunakan metode maximum likelihood. Hal ini berarti pengguna dapat menggunakan
model Naive Bayes tanpa harus bergantung pada probabilitas Bayesian atau metode Bayesian.
Persamaan Naïve Bayes Classifier dirumuskan seperti berikut:
𝑃(𝐴|𝐵)=𝑃(𝐵|𝐴)× 𝑃(𝐴)
𝑃(𝐵)
(1)
2.3 Aplikasi X
Aplikasi X atau sebelumnya dinamakan Twitter adalah platform media sosial dan layanan microblogging yang
memungkinkan pengguna untuk mengirim pesan secara real-time. Pesan ini lebih dikenal dengan sebutan
"tweet". Tweet merupakan pesan singkat yang dibatasi oleh panjang karakter, yang umumnya tidak melebihi
140 karakter. Karena keterbatasan karakter, tweet seringkali menggunakan singkatan, bahasa slang, atau
kesalahan pengejaan (Agarwal et al., 2011). Sejak awal, Twitter dirancang sebagai layanan berbasis mobile
yang mengikuti batasan panjang pesan teks pada pesan singkat (SMS), dan hingga kini, Twitter tetap dapat
diakses melalui berbagai perangkat seluler yang mendukung pengiriman dan penerimaan pesan teks (Aukamp
et al., 2014).
X atau Twitter dibuat dengan tujuan untuk menjadi platform yang memungkinkan pengguna saling berbagi
pengalaman tanpa hambatan. Melalui Twitter, pengguna dapat dengan mudah mengikuti tren, cerita, informasi,
dan berita dari berbagai belahan dunia. Selain itu, X juga memfasilitasi penggunanya untuk tetap terhubung
dengan teman-teman dan keluarga mereka. Setiap kali pengguna mengirimkan tweet, pesan tersebut menjadi
publik dan dapat diakses oleh siapa pun, di mana pun, dan kapan pun. Terlebih lagi, bagi orang yang mengikuti
akun Twitter tersebut, tweet-tweet tersebut akan otomatis muncul di lini masa mereka.
4
2.4 Pilpres 2024
Pemilihan Presiden Republik Indonesia, yang juga dikenal sebagai Pemilihan Umum (Pemilu), merupakan salah
satu agenda krusial dalam sistem politik Negara Kesatuan Republik Indonesia (NKRI), yang diadakan setelah
pemilihan lembaga legislatif. Seiring berjalannya waktu, pilpres menjadi salah satu elemen paling signifikan
dalam dinamika politik (Farha et al., 2024).
Pada Pilpres 2024 terdapat 3 Paslon yaitu Paslon Nomor 1 Anies Baswedan-Muhaimin Iskandar, Paslon
Nomor 2 Prabowo Subianto-Gibran Rakabuming, dan Paslon Nomor 3 Ganjar Pranowo-Mahfud MD. Pasangan
Nomor Urut 1 Anies Baswedan-Muhaimin Iskandar dan Pasangan Nomor Urut 3 Ganjar Pranowo-Mahfud MD
mengajukan permohonan sengketa Pilpres 2024 ke MK. Dalam tuntutannya, kedua paslon meminta MK untuk
membatalkan keputusan Komisi Pemilihan Umum (KPU) terkait hasil pemilu dan meminta dilakukannya
pemilu ulang (Heriani, 2024).
2.5 Pembacaan Putusan MK
Proses pembacaan putusan Mahkamah Konstitusi (MK) adalah tahap akhir dalam proses persidangan di MK.
Sidang Pengucapan Putusan dilaksanakan dalam Sidang Pleno terbuka untuk umum yang dihadiri paling sedikit
7 orang Hakim dan para pihak. Putusan MK mempunyai kekuatan hukum mengikat sejak diucapkan dalam
Sidang Pleno terbuka. Setelah diucapkan, putusan tersebut diunggah pada laman resmi MK dan dapat diakses
oleh masyarakat (Sekretariat Jenderal dan Kepaniteraan Mahkamah Konstitusi, 2010).
3. METODOLOGI
Metode yang digunakan dalam penelitian ini adalah metode Naïve Bayes Classifier. Berikut tahapan-tahapan
yang ditunjukkan untuk melakukan penelitian pada Gambar 1.
Gambar 1. Tahapan metodologi menggunakan Naïve Bayes Classifier
3.1 Pengumpulan Data menggunakan Web Scrapping
Pengumpulan data adalah tahap pertama dalam penelitian ini. Web scraping adalah teknik otomatisasi
pengambilan data dari website, yang memfasilitasi ekstraksi konten dalam berbagai format, termasuk namun
tidak terbatas pada teks, hyperlink, gambar, video, audio, dan dokumen (Flores et al., 2020). Metode ini telah
diadopsi secara ekstensif di lintas sektor, mulai dari penelitian hingga analisis pasar dan pengumpulan data
komersial.
3.2 Data Selection
Data selection atau pemilihan data adalah tahap kedua dalam penelitian ini. Proses ini mencakup pemilihan data
yang relevan dari suatu dataset untuk dianalisis lebih lanjut. Pada tahap ini, peneliti harus memastikan bahwa
data yang dipilih sesuai dengan tujuan penelitian dan cukup representatif untuk menghasilkan hasil yang valid.
Pemilihan data yang tepat sangat penting untuk meningkatkan akurasi analisis dan mengurangi bias yang
mungkin dihasilkan dari data yang tidak relevan atau tidak memadai (Gharatkar et al., 2017).
3.3 Data Preprocessing
Data preprocessing merupakan langkah awal yang sangat krusial dalam pengolahan data. Pada tahap ini, data
dipersiapkan untuk analisis dengan tujuan menghilangkan data yang kurang relevan dan tidak konsisten
(Gharatkar et al., 2017).
3.3.1 Data Cleaning
Data cleaning adalah langkah data preprocessing untuk meningkatkan kualitas data dengan menghapus atau
mengoreksi informasi yang salah, tidak lengkap, atau tidak relevan. Tahapan ini mencakup pendeteksian dan
perbaikan masalah data, menghapus kolom yang tidak diinginkan, dan menyelesaikan ketidaksesuaian untuk
memastikan data yang lebih bersih dan akurat (Gharatkar et al., 2017).
3.3.2 Text Preprocessing
Text preprocessing merupakan tahapan standar dalam melakukan analisis sentimen, tahapan-tahapan pada text
preprocessing adalah sebagai berikut :
1. Case Folding : Mengubah huruf kapital pada setiap kata menjadi huruf kecil
2. Remove Noisy Data : Menghapus karakter khusus, tagar, URL, dan hyperlink yang tidak diperlukan dalam
analisis.
3. Remove Stopwords : Menghapus kata-kata yang tidak memiliki makna yang signifikan dalam analisis
sentimen. Contoh penggunaan dari remove stopwords adalah penghapusan kata "aku", "dan", "atau",
"adalah", dan lain sebagainya.
5
4. Text Normalization : Memeriksa dan memperbaiki kesalahan ejaan, serta menghapus kata-kata yang tidak
signifikan untuk analisis seperti "yg", "gak", "sdh", "tp" dll.
5. Tokenization : Memecah teks menjadi kata atau frasa menjadi unit terkecil
6. Stemming : Mengubah kata menjadi kata dasar. Contoh penggunaan dari stemming adalah "menghormati"
menjadi "hormat".
3.4 Visualisasi dengan WordCloud
Wordcloud adalah sistem yang menghasilkan visualisasi kata-kata, menyoroti frekuensi kemunculan kata-kata
tertentu dalam teks. Penggunaan wordcloud dalam analisis wacana membantu peneliti dengan cepat memahami
tema utama dan inti dari teks. Selain itu, wordcloud memudahkan dalam mengidentifikasi kata-kata kunci dan
pola bahasa yang dominan, sehingga mempercepat proses analisis dan interpretasi data secara keseluruhan
(Qeis, 2015).
3.5 Feature Extraction
Feature extraction merupakan metode untuk mengidentifikasi objek dengan memanfaatkan histogram unik yang
ada pada objek tersebut. Tujuan dari Feature extraction adalah untuk menghitung dan membandingkan
karakteristik, yang kemudian digunakan untuk mengklasifikasikan teks berdasarkan atribut histogram yang data
miliki (Religia et al., 2019).
3.6 Data Mining dengan Naïve Bayes Classifier
Naive Bayes adalah salah satu metode klasifikasi yang didasarkan pada penerapan teorema Bayes dengan
asumsi kesederhanaan (naive) bahwa setiap fitur bersifat independen satu sama lain. Metode ini sering
digunakan dalam klasifikasi teks karena memiliki akurasi yang cukup tinggi dan komputasi yang efisien
(Handayani & Pribadi, 2015).
4. HASIL DAN PEMBAHASAN
4.1 Pengumpulan Data Menggunakan Web Scrapping
Penelitian ini menerapkan metode web scrapping untuk mengumpulkan data dari platform X (Twitter), dengan
menggunakan frasa pencarian “MK Hasil Pemilu” selama periode 22-29 Maret 2024, menghasilkan data terkini
yang ditampilkan pada Gambar 2. Dari proses ini, berhasil dikumpulkan sejumlah 305 cuitan yang belum
diproses untuk analisis lebih mendalam (Faturrohman et al., 2024).
Gambar 2. Tahapan metodologi menggunakan Naïve Bayes Classifier
Setelah dilakukan web scrapping, tahap penambahan label (labeling) dilakukan dengan pembuatan kolom baru
di dataset yang ditambahkan secara manual oleh peneliti untuk mengklasifikasikan kategori atau sentimen data
yang termasuk kedalam “Negative”, “Neutral”, atau “Positive”.
4.2 Data Selection
Dalam penelitian ini, analisis sentimen akan difokuskan hanya pada penggunaan dua kolom data, yaitu
"full_text" dan "label". Kolom "full_text" berisi teks lengkap dari setiap cuitan, sementara kolom "label"
mengindikasikan kategori atau sentimen yang terkait dengan teks tersebut yang nantinya akan digunakan untuk
data pelatihan. Kolom-kolom lainnya seperti "conversation_id_str", "created_at", "favorite_count",
"image_url", "lang", "location", "quote_count", "reply_count", dan "retweed_count" tidak akan digunakan
dalam analisis ini.
4.3 Data Preprocessing
6
Pada tahap ini , data yang dianggap kurang relevan, yang salah, tidak lengkap. Tahap data preprocessing ini
dilakukan pada data dari kolom "conversation_id_str", "created_at", "favorite_count", "image_url", "lang",
"location", "quote_count", "reply_count", dan "retweed_count".
4.3.1 Data Cleaning
Pada penelitian ini data cleaning digunakan untuk memfilter data untuk mendapatkan data yang
nantinya dapat dilakukan analisis sentimen dengan menggunakan data pada kolom “full_text” yang
berisi cuitan pengguna X, dan kolom “label” yang berisi nilai “Negative”, “Neutral”, dan “Positive”.
Pada tahap ini 305 data cuitan yang terkumpul dibersihkan hingga menjadi tersisa 152 baris data yang
siap dianalisis lebih lanjut.
4.3.2 Text Preprocessing
Data pada kolom “full_text” akan diolah lebih lanjut dengan menggunakan text preprocessing untuk
mendapatkan baris data yang layak dan siap untuk analisis sentimen menggunakan model Naïve Bayes
Classifier. Tahap text preprocessing dilakukan secara bertahap dengan case folding, remove noisy data, remove
stopwords, text normalization, tokenization, dan stemming. Gambar 3 menjelaskan bagaimana data akan
diproses lebih lanjut dengan text preprocessing.
Gambar 3. Data Web Scrapping setelah dilakukan Text Preprocessing
4.4 Visualisasi dengan WordCloud
Visualisasi menggunakan WordCloud memudahkan peneliti dalam menganalisis kata-kata yang berpengaruh
signifikan dalam menentukan hasil analisis sentimen dengan membantu mengidentifikasi tren dan pola dalam
opini atau sentimen yang diungkapkan. Dalam WordCloud, kata dengan ukuran lebih besar menunjukkan
frekuensi kemunculan yang lebih tinggi, yang berarti kata tersebut lebih dominan dalam korpus teks yang
dianalisis. Hal ini sering kali mencerminkan pentingnya kata tersebut dalam konteks subjek yang dibahas,
memberikan wawasan tentang tema dan konsep kunci yang sering muncul dalam data teks. Hasil analisis ini,
yang mengungkap kata-kata berdampak pada sentimen, ditampilkan dalam Gambar 4 dan 5.
Gambar 4. Kumpulan kata hasil WordCloud dengan sentimen positif
7
Gambar 5. Kumpulan kata hasil WordCloud dengan sentimen negatif
4.5 Feature Extraction
Dalam penelitian ini, peneliti menggunakan CountVectorizer untuk mengubah representasi teks hasil data
preprocessing menjadi sebuah matriks yang berisi hitungan token. Setiap dokumen teks direpresentasikan
sebagai vektor dengan panjang yang sebanding dengan jumlah kata unik dalam seluruh kumpulan teks. Nilai
pada setiap elemen vektor menunjukkan frekuensi kemunculan kata tertentu dalam dokumen (Scikit-Learn,
2024). Hasil akhirnya adalah matriks yang menunjukkan jumlah token (kata) dalam setiap dokumen.
4.6 Data Mining dengan Model Naive Bayes Classifier
Pada proses data mining menggunakan algoritma Naive Bayes, model yang dibangun berhasil menunjukkan
performa yang cukup baik dengan tingkat akurasi keseluruhan sebesar 84%. Tingkat akurasi ini menunjukkan
bahwa model mampu mengklasifikasikan data dengan benar pada sebagian besar kasus yang diuji.
Gambar 6. Laporan evaluasi performa model Naïve Bayes Classifier
Pada klasifikasi kategori "Negative", model berhasil mencapai presisi sebesar 80%, yang berarti 80% dari
data yang diklasifikasikan sebagai "Negative" oleh model memang benar-benar termasuk dalam kategori
tersebut. Recall untuk kategori ini sebesar 85%, menunjukkan bahwa model mampu mengidentifikasi 85% dari
seluruh data yang sebenarnya berlabel "Negative". F1-score untuk kategori ini tercatat sebesar 82%, yang
merupakan harmonic mean dari presisi dan recall, menunjukkan keseimbangan antara kedua metrik tersebut
dalam performa klasifikasi. Dari hasil ini, dapat disimpulkan bahwa model mampu mengklasifikasikan data
dalam kategori "Negative" dengan baik dan cukup andal.
Untuk klasifikasi kategori "Positive", model menunjukkan performa yang lebih tinggi dengan presisi
sebesar 88%. Ini berarti 88% dari data yang diklasifikasikan sebagai "Positive" oleh model benar-benar berlabel
"Positive". Recall untuk kategori ini sebesar 84%, menunjukkan kemampuan model dalam mengidentifikasi
84% dari seluruh data yang sebenarnya berlabel "Positive". F1-score untuk kategori "Positive" tercatat sebesar
86%, yang mengindikasikan keseimbangan yang baik antara presisi dan recall pada kategori ini. Hal ini
menunjukkan bahwa model tidak hanya mampu mengidentifikasi data dengan label "Positive" dengan akurat,
tetapi juga secara konsisten dalam berbagai situasi pengujian.
5. KESIMPULAN
Berdasarkan hasil evaluasi performa model yang telah peneliti lakukan, dapat disimpulkan bahwa model Naive
Bayes yang digunakan dalam proses data mining ini mampu mengklasifikasikan data dengan baik, baik pada
kategori "Negative" maupun "Positive". Tingkat akurasi yang tinggi dan keseimbangan yang baik antara presisi,
recall, dan f1-score menunjukkan bahwa model ini dapat diandalkan untuk tugas-tugas klasifikasi yang serupa.
Dengan demikian, model ini layak untuk digunakan dalam aplikasi praktis yang membutuhkan analisis dan
klasifikasi data secara akurat.
8
DAFTAR PUSTAKA
Agarwal, A., Xie, B., Vovsha, I., Rambow, O., & Passonneau, R. J. (2011). Sentiment Analysis of Twitter Data.
Proceedings of the Workshop on Language in Social Media (LSM 2011), pp. 3038.
Aukamp, B., Coyne, B., Evins, S., Golden, J., Greenberger, P., Lapin, L., Neaman, L., Niestzche, J., Reigle, S., & Sharp,
A. (2014). The Twitter Government and Elections Handbook (U.S. Edition). Twitter, Inc.
Buntoro, G. A. (2017). Analisis Sentimen Calon Gubernur DKI Jakarta 2017 Di Twitter. INTEGER: Journal of
Information Technology, 2(1). https://doi.org/10.31284/j.integer.2017.v2i1.95
Coletta, L. F. S., Silva, N. F. F. da, Hruschka, E. R., & Hruschka, E. R. (2014). Combining Classification and Clustering
for Tweet Sentiment Analysis. 2014 Brazilian Conference on Intelligent Systems, pp. 210215.
https://doi.org/10.1109/BRACIS.2014.46
Cvijikj, I. P., & Michahelles, F. (2011). Understanding social media marketing. Proceedings of the 15th International
Academic MindTrek Conference: Envisioning Future Media Environments, pp. 175182.
https://doi.org/10.1145/2181037.2181066
Farha, S. W. A., Pratiwi, A. E., Prasasti, F. E., Maulita, S. A., & Aina, N. N. (2024). Partisipasi Mahasiswa UPGRIS
dalam Pilpres 2024. Pena Edukasia, 2(2), pp. 5459.
Faturrohman, A., Gunawan, T., & Putra, A. A. H. (2024). Dataset X MK Hasil Pemilu.
https://doi.org/https://doi.org/10.5281/zenodo.11314620
Flores, V. A., Permatasari, P. A., & Jasa, L. (2020). Penerapan Web Scraping Sebagai Media Pencarian dan Menyimpan
Artikel Ilmiah Secara Otomatis Berdasarkan Keyword. Majalah Ilmiah Teknologi Elektro, 19(2), pp. 157.
https://doi.org/10.24843/MITE.2020.v19i02.P06
Gharatkar, S., Ingle, A., Naik, T., & Save, A. (2017). Review preprocessing using data cleaning and stemming technique.
2017 International Conference on Innovations in Information, Embedded and Communication Systems (ICIIECS),
pp. 14. https://doi.org/10.1109/ICIIECS.2017.8276011
Hall, M. (2007). A decision tree-based attribute weighting filter for naive Bayes. Knowledge-Based Systems, 20(2), pp.
120126. https://doi.org/10.1016/j.knosys.2006.11.008
Handayani, F., & Pribadi, F. S. (2015). Implementasi Algoritma Naive Bayes Classifier dalam Pengklasifikasian Teks
Otomatis Pengaduan dan Pelaporan Masyarakat melalui Layanan Call Center 110. JURNAL TEKNIK ELEKTRO,
7(1), pp. 1924.
Heriani, F. N. (2024). Mengenal Ragam Putusan MK Terkait Sengketa Hasil Pemilu.
https://www.hukumonline.com/berita/a/mengenal-ragam-putusan-mk-terkait-sengketa-hasil-pemilu-
lt661e63abe2d24/?utm_source=copy&utm_medium=berita&utm_campaign=shared_sosmed.
Hidayat, B. H. R., & Wijiningsih, N. (2024). PERBANDINGAN PENYELESAIAN SENGKETA PEMILIHAN UMUM
PRESIDEN DI INDONESIA DAN BRASIL. Reformasi Hukum Trisakti, 6(1), pp. 186196.
https://doi.org/10.25105/refor.v6i1.19193
Nasukawa, T., & Yi, J. (2003). Sentiment analysis. Proceedings of the 2nd International Conference on Knowledge
Capture, pp. 7077. https://doi.org/10.1145/945645.945658
Padri, A. R. (2023). KLASIFIKASI KEMANCETAN LALU LINTAS DI INDONESIA MENGGUNAKAN METODE
NAIVE BAYES CLASSIFICATION. Simetris: Jurnal Teknik Mesin, Elektro Dan Ilmu Komputer, 14(2), pp. 297
310. https://doi.org/10.24176/simet.v14i2.10102
Qeis, M. I. (2015). APLIKASI WORDCLOUD SEBAGAI ALAT BANTU ANALISIS WACANA. International
Conference on Language, Culture, and Society - ICLCS LIPI.
Ramadhan, A., Rasya, H. S., Joe, C. P., & Triadi, I. (2024). Pengaruh Teknologi Dan Media Sosial Dalam Tata Negara
Dan Proses Pemilihan Presiden: Tinjauan Pada Pemilihan Presiden 2024. INNOVATIVE: Journal Of Social Science
Research, 4(2), pp. 76627674.
Rasji, R., Simbolon, E. Z., & Kasslim, V. (2024). Penyelesaian Sengketa Hasil Pemilihan Presiden dan Wakil Presiden
Tahun 2024 di Mahkamah Konstitusi. Jurnal Pendidikan Sejarah Dan Riset Sosial Humaniora, 4(2), pp. 4854.
Religia, Y., Rusdi, A., Romli, I., & Mazid, A. (2019). Feature Extraction untuk Klasifikasi Pengenalan Wajah
Menggunakan Support Vector Machine Dan K-Nearest Neighbor. Pelita Teknologi, 14(2), pp. 8592.
Resphati, A. (2010). Opini masyarakat tentang pemberitaan demo 100 hari pemerintahan SBY - Boediono di Surat
Kabar Jawa Pos Edisi 27-29 januari 2010. UPN Veteran Jawa Timur.
Scikit-Learn. (2024). CountVectorizer. Scikit-Learn.Org.
Sekretariat Jenderal dan Kepaniteraan Mahkamah Konstitusi. (2010). Hukum Acara Mahkamah Konstitusi. Mahkamah
Konstitusi.
Sujadi, H. (2022). ANALISIS SENTIMEN PENGGUNA MEDIA SOSIAL TWITTER TERHADAP WABAH COVID-
19 DENGAN METODE NAIVE BAYES CLASSIFIER DAN SUPPORT VECTOR MACHINE. INFOTECH
Journal, 8(1), pp. 2227. https://doi.org/10.31949/infotech.v8i1.1883
Syahrohim, I., Saputra, S. D., Saputra, R. W., Pranatawijaya, V. H., & Priskila, R. (2024). PERBANDINGAN
ANALISIS SENTIMEN SETELAH PILPRES 2024 DI TWITTER MENGGUNAKAN ALGORITMA MACHINE
LEARNING. Jurnal Informatika Dan Teknik Elektro Terapan, 12(2), pp. 13881395.
https://doi.org/10.23960/jitet.v12i2.4249
Taheri, S., & Mammadov, M. (2013). Learning the naive Bayes classifier with optimization models. International
Journal of Applied Mathematics and Computer Science, 23(4), pp. 787795. https://doi.org/10.2478/amcs-2013-0059
Troussas, C., Virvou, M., Espinosa, K. J., Llaguno, K., & Caro, J. (2013). Sentiment analysis of Facebook statuses using
Naive Bayes classifier for language learning. IISA 2013, pp. 16. https://doi.org/10.1109/IISA.2013.6623713
Article
Full-text available
The Jakarta Regional Head Election (Pilkada) 2024 is predicted to be one of the most exciting political events in Indonesia, with various parties striving to attract public attention through multiple communication channels. One platform that is increasingly popular in the context of political campaigns is TikTok, a short video-based social media platform known for its wide appeal, high interactivity, and creative format. TikTok provides opportunities for political candidates and their supporters to deliver innovative campaign messages and influence public opinion through strong visual and emotional approaches. This study analyze the sentiment of comments on TikTok campaign videos related to the Jakarta Pilkada 2024. Using the Naive Bayes algorithm, this research classifies sentiments into positive, negative, and neutral categories. The data used in this study are comments from campaign videos uploaded by candidates and their supporters. The results of this study are expected to make significant contributions to understanding the impact of social media on public preferences in the local political context, and to provide insights into how digital technology is transforming the landscape of political communication in Indonesia.
Article
Full-text available
Penelitian ini bertujuan untuk mengetahui sentimen publik terhadap pembangunan Ibu Kota Negara (IKN) dengan menganalisis opini publik yang dipublikasikan pada platform X menggunakan metode SVM. Data berupa tweet yang mengandung kata kunci “IKN” dikumpulkan melalui proses scraping menggunakan Node JS selama periode tertentu. Tujuan penelitian ini adalah untuk mengetahui apakah pengembangan IKN layak dilanjutkan atau perlu dikaji ulang berdasarkan opini masyarakat. Dari hasil pendataan, terdapat 580 tweet yang terdiri dari 72 label positif, 266 label netral, dan 242 label negatif. Analisis menunjukkan bahwa sentimen masyarakat terhadap pembangunan IKN secara umum bersifat netral. Selain itu, penelitian ini juga memberikan wawasan mengenai persepsi publik terhadap pembangunan IKN dan menjadi landasan untuk mengevaluasi urgensi proyek tersebut. Hasil penelitian diharapkan mampu mendukung perumusan kebijakan yang lebih responsif dan sesuai dengan kebutuhan dan ekspektasi publik terhadap pembangunan infrastruktur nasional.
Article
Full-text available
ABSTRAK Penelitian ini bertujuan untuk menganalisis persepsi pengguna di luar "Komunitas Marah-Marah" di Platform X melalui analisis sentimen menggunakan model BERT (Bidirectional Encoder Representations from Transformers). Komunitas Marah-Marah adalah sebuah komunitas di Twitter yang dikenal dengan gaya komunikasi emosional dan intens, di mana para anggotanya sering melampiaskan frustrasi, kemarahan, dan kekecewaan mereka. Penelitian ini berfokus pada sentimen yang dikemukakan oleh pengguna platform X terhadap interaksi dan isi cuitan yang berhubungan dengan komunitas tersebut. Data yang digunakan diperoleh melalui teknik crawling dengan kata kunci "Komunitas Marah-Marah", yang menghasilkan teks cuitan sebagai unit analisis. Metodologi penelitian ini mencakup preprocessing data yang meliputi tokenisasi, penghapusan stopwords, normalisasi, serta penerapan model BERT untuk klasifikasi sentimen. Model BERT yang digunakan dalam penelitian ini adalah versi pre-trained bahasa Indonesia, yang memungkinkan pemahaman konteks teks secara lebih akurat. Hasil analisis menunjukkan bahwa sentimen negatif mendominasi persepsi pengguna, dengan proporsi 74,60%, sedangkan sentimen netral mencapai 25,20%, dan sentimen positif hanya 0,20%. Temuan ini menggambarkan bagaimana interaksi dalam komunitas tersebut seringkali diwarnai oleh sentimen negatif, sementara sedikit interaksi positif terjadi. Penelitian ini memberikan wawasan tentang bagaimana komunitas yang didominasi oleh ekspresi emosi dapat mempengaruhi dinamika komunikasi di media sosial, serta memberikan pandangan lebih dalam mengenai dampaknya terhadap budaya komunikasi di Platform X. Kata kunci: Persepsi Pengguna, Komunitas Marah-Marah, Platform X, Analisis Sentimen, Model BERT.
Article
Full-text available
Artikel ilmiah adalah sebuah referensi yang biasanya digunakan oleh seorang mahasiswa atau peneliti untuk membuat sebuah penelitian. Artikel Ilmiah dapat dicari melalui Internet secara bebas, namun proses pencarian ini seringkali memakan waktu dikarenakan banyaknya artikel ilmiah yang ada di Internet. Pencarian ini dapat dilakukan secara otomatis dengan memanfaatkan Teknik Web Scraping sebagai teknik pengambilan data pada suatu situs web di Internet. Metode Depth First Search (DFS) adalah metode pencarian yang dapat dimanfaatkan untuk melakukan web Scraping data di Internet. Sistem ini bekerja dengan mengolah Keyword berupa kata kunci dari topik artikel ilmiah yang akan dicari yang diberikan oleh pengguna. Kemudian sistem akan mengirimkan request kepada server untuk mencari tautan yang berhubungan dengan Keyword tersebut. Setelah hasil pencarian sudah ditemukan, sistem akan secara otomatis mengunduh dan menyimpan artikel yang berformat .pdf ke komputer pengguna. Hasil uji coba dari 134 artikel yang berhasil diunduh menggunakan sistem ini menunjukkan bahwa sistem ini dapat bekerja dengan sangat baik untuk melakukan pencarian artikel ilmiah dengan tingkat relevansi antara artikel yang dicari dengan artikel yang diunduh sebesar 99%.
Article
Full-text available
Jakarta Governor Election 2017 discussed in society or internet, especially Twitter. Everyone is free opine on Jakarta governor candidate 2017 so many opinions, not only positive or neutral opinion but also negative. Social media, especially Twitter now become promotions or campaigns are effective and efficient. This research is expected be useful to conduct on public opinion containing sentiment positive, neutral or negative. The method used in this study, for data preprocessing using tokenisasi, cleansing and filtering, to define class sentiment with methods Lexicon Based. For classification using Naive Bayes classifier (NBC) and Support Vector Machine (SVM). The data is 300 tweet in Indonesian by keyword AHY, Ahok, Anies. The results of research is analysis sentiment Jakarta governor candidate 2017. The highest accuracy when using the method of classification Naïve Bayes Classifier (NBC), with average 95% accuracy, 95% precision, 95% recall, TP rate 96,8% and TN rate 84,6%. Keywords: analisis sentimen, jakarta governor candidate 2017, lexicon based, naïve bayes classifier, support vector machine Abstrak. Pemilihan Gubernur DKI Jakarta 2017 ramai diperbincangkan di dunia nyata maupun dunia maya, khususnya di media sosial Twitter. Semua orang bebas berpendapat atau beropini tentang calon Gubernur DKI Jakarta 2017 sehingga memunculkan banyak opini, tidak hanya opini yang positif atau netral tapi juga yang negatif. Media sosial khususnya Twitter sekarang ini menjadi salah satu tempat promosi atau kampanye yang efektif dan efisien. Penelitian ini diharapkan dapat bermanfaat membantu untuk melakukan riset atas opini masyarakat yang mengandung sentimen positif, netral atau negatif. Metode yang digunakan dalam penelitian ini, untuk preprocessing data menggunakan tokenisasi, cleansing dan filtering, untuk menentukan class sentimen dengan metode Lexicon Based. Untuk proses klasifikasinya menggunakan metode Naïve Bayes Classifier (NBC) dan Support Vector Machine (SVM). Data yang digunakan adalah tweet dalam bahasa Indonesia dengan kata kunci AHY, Ahok, Anies, dengan jumlah dataset sebanyak 300 tweet. Hasil dari penelitian ini adalah analisis sentimen terhadap calon gubernur DKI Jakarta 2017. Akurasi tertinggi didapat saat menggunakan metode klasifikasi Naïve Bayes Classifier (NBC), dengan nilai rata-rata akurasi mencapai 95%, nilai presisi 95%, nilai recall 95% nilai TP rate 96,8% dan nilai TN rate 84,6%. Kata Kunci: analisis sentimen, calon gubernur dki jakarta 2016, lexicon based, naïve bayes classifier, support vector machine 1. Pendahuluan Pemilihan Gubernur DKI Jakarta yang akan dilangsungkan pada tahun 2017 keramaiannya sudah mulai bisa dirasakan. Jadwal rangkaian Pemilihan Gubernur DKI Jakarta sudah ditetapkan (KPU, 2016). Sejak tahapan pendaftaran dan ditetapkan calon Gubernur DKI Jakarta 2017 nama-nama calonnya mulai banyak diperbincang, baik di dunia nyata maupun dunia maya. Semua orang bebas berpendapat atau beropini tentang calon Gubernur DKI Jakarta 2017
Article
Full-text available
Naive Bayes is among the simplest probabilistic classifiers. It often performs surprisingly well in many real world applications, despite the strong assumption that all features are conditionally independent given the class. In the learning process of this classifier with the known structure, class probabilities and conditional probabilities are calculated using training data, and then values of these probabilities are used to classify new observations. In this paper, we introduce three novel optimization models for the naive Bayes classifier where both class probabilities and conditional probabilities are considered as variables. The values of these variables are found by solving the corresponding optimization problems. Numerical experiments are conducted on several real world binary classification data sets, where continuous features are discretized by applying three different methods. The performances of these models are compared with the naive Bayes classifier, tree augmented naive Bayes, the SVM, C4.5 and the nearest neighbor classifier. The obtained results demonstrate that the proposed models can significantly improve the performance of the naive Bayes classifier, yet at the same time maintain its simple structure.
Conference Paper
Full-text available
The growing expansion of contents, placed on the Web, provides a huge collection of textual resources. People share their experiences, opinions or simply talk just about whatever concerns them online. The large amount of available data attracts system developers, studying on automatic mining and analysis. In this paper, the primary and underlying idea is that the fact of knowing how people feel about certain topics can be considered as a classification task. People's feelings can be positive, negative or neutral. A sentiment is often represented in subtle or complex ways in a text. An online user can use a diverse range of other techniques to express his or her emotions. Apart from that, s/he may mix objective and subjective information about a certain topic. On top of that, data gathered from the World Wide Web often contain a lot of noise. Indeed, the task of automatic sentiment recognition in online text becomes more difficult for all the aforementioned reasons. Hence, we present how sentiment analysis can assist language learning, by stimulating the educational process and experimental results on the Naive Bayes Classifier.
Conference Paper
Full-text available
This paper illustrates a sentiment analysis approach to extract sentiments associated with polarities of positive or negative for specific subjects from a document, instead of classifying the whole document into positive or negative.The essential issues in sentiment analysis are to identify how sentiments are expressed in texts and whether the expressions indicate positive (favorable) or negative (unfavorable) opinions toward the subject. In order to improve the accuracy of the sentiment analysis, it is important to properly identify the semantic relationships between the sentiment expressions and the subject. By applying semantic analysis with a syntactic parser and sentiment lexicon, our prototype system achieved high precision (75-95%, depending on the data) in finding sentiments within Web pages and news articles.
Article
Penelitian ini bertujuan untuk menganalisis sentimen opini masyarakat di media sosial Twitter setelah Pemilihan Presiden 2024 menggunakan beberapa algoritma machine learning yaitu Naive Bayes, Support Vector Machine, dan Logistic Regression. Data yang digunakan bersumber dari Twitter dengan total 4.260 data yang terdiri dari 3 dataset calon presiden (Ganjar Pranowo, Anies Baswedan, dan Prabowo Subianto). Dilakukan proses crawling data, pembersihan data, pelabelan data menggunakan Vader, dan pelatihan data dengan TF-IDF sebelum dilakukan klasifikasi sentimen. Hasil eksperimen menunjukkan bahwa algoritma Logistic Regression memiliki performa terbaik pada dataset Ganjar Pranowo dengan akurasi 84,39%, presisi 84,92%, recall 84,39%, dan f-measure 81,52%. Penelitian ini memberikan insight tentang perbandingan performa algoritma klasifikasi dalam kasus analisis sentimen pada media sosial yang dapat digunakan sebagai referensi untuk penelitian serupa di masa mendatang.
Article
Tujuan dari penelitian ini untuk data menganalisis akurasi kemancetan menggunakan google colab dalam mendeteksi kemacetan berdasarkan provinsi di indonesia, penulis mencoba menguji strategi dalam menangani Kemacetan wilayah indonesia, dengan memanfaatkan metode naïve bayes. Pada jurnal ini menerapkan dengan google colab. Penelitian ini memakai data yang bersumber dari crawling data di twiter. Penggunaan metode naive bayes dalam mencari Rute terpendek efesien dan tidak mancet. Penerapan Angkot Sekolah online menggunakan Metode naive bayes dalam Minimalisir Biaya Perjalanan menjemput Siswa dapat mengurangi macet, mengurangi kecelakaan, mengurangi waktu keterlambatan siswa, minimalisir ongkos perjalanan. Saran yang diberikan yaitu menjadi bahan evaluasi bagi pemerintah dalam menangani Kemacetan di indonesia, secara efisien, aman dan transparanKeyword: Klasifikasi kemancetan, naïve bayes
Sentiment Analysis of Twitter Data
  • A Agarwal
  • B Xie
  • I Vovsha
  • O Rambow
  • R J Passonneau
Agarwal, A., Xie, B., Vovsha, I., Rambow, O., & Passonneau, R. J. (2011). Sentiment Analysis of Twitter Data. Proceedings of the Workshop on Language in Social Media (LSM 2011), pp. 30-38.
Understanding social media marketing
  • I P Cvijikj
  • F Michahelles
Cvijikj, I. P., & Michahelles, F. (2011). Understanding social media marketing. Proceedings of the 15th International Academic MindTrek Conference: Envisioning Future Media Environments, pp. 175-182. https://doi.org/10.1145/2181037.2181066