ArticlePDF Available

DETEKSI PLAGIARISME TINGKAT KEMIRIPAN JUDUL SKRIPSI PADA FAKULTAS TEKNOLOGI INFORMASI MENGGUNAKAN ALGORITMA WINNOWING

Authors:

Abstract

ABSTRAK Untuk menentukan kemiripan teks judul skripsi yang di ajukan dengan judul-judul skripsi yang telah ada sebelumnya maka diperlukan penerapan suatu algoritma untuk menentukan kemiripan teks, salah satunya algoritma untuk menentukan kemiripan teks ialah algoritma Winnowing.Algoritma Winnowing adalah sebuah cara yang digunakan untuk mendeteksi kesamaan kata/kalimat (common subsequence) dalam dua atau lebih teks yang dibandingkan. Dua teks diketahui memiliki kesamaan kata/kalimat apabila di dalam dokumen tersebut dijumpai fingerprint, fingerprint inilah yang akan dijadikan dasar pembanding antara teks, algoritma ini akan mencari fingerprint (kesamaan di dalam dua teks) dengan cara mengubah n-gram dari sebuah teks ke dalam bentuk nilai angka yang disebut dengan nilai hash, teknik untuk mencari nilai tersebut adalah Hashing.Dengan sistem ini, Ketua Program Studi atau Koordinator Tugas Akhir nantinya hanya memasukkan judul yang akan diajukan mahasiswa, kemudian sistem akan mengecek secara otomatis dan menampilkan hasilnya. Hasil tersebut bisa dijadikan sebagai pertimbangan dalam pengambilan keputusan dan dapat menentukan apakah diterima atau ditolak judul skripsi tersebut.Kata kunci : Algoritma Winnowing, fingerprint, n-gram, Hashing
Technologia”Vol 10, No. 4, Oktober-Desember 2019 197
Jurnal Ilmiah Technologia
DETEKSI PLAGIARISME TINGKAT KEMIRIPAN JUDUL SKRIPSI PADA
FAKULTAS TEKNOLOGI INFORMASI MENGGUNAKAN ALGORITMA
WINNOWING
Nur Alamsyah1), Muhammad Rasyidan2)
1Fakultas Teknologi Informasi, Universitas Islam Kalimantan Muhammad Arsyad Al Banjari Banjarmasin
Email: uniskalam@gmail.com
2Fakultas Teknologi Informasi, Universitas Islam Kalimantan Muhammad Arsyad Al Banjari Banjarmasin
Email: mr.syidan@gmail.com
ABSTRAK
Untuk menentukan kemiripan teks judul skripsi yang di ajukan dengan judul-judul skripsi
yang telah ada sebelumnya maka diperlukan penerapan suatu algoritma untuk menentukan
kemiripan teks, salah satunya algoritma untuk menentukan kemiripan teks ialah algoritma
Winnowing.
Algoritma Winnowing adalah sebuah cara yang digunakan untuk mendeteksi kesamaan
kata/kalimat (common subsequence) dalam dua atau lebih teks yang dibandingkan. Dua teks
diketahui memiliki kesamaan kata/kalimat apabila di dalam dokumen tersebut dijumpai
fingerprint, fingerprint inilah yang akan dijadikan dasar pembanding antara teks, algoritma ini
akan mencari fingerprint (kesamaan di dalam dua teks) dengan cara mengubah n-gram dari
sebuah teks ke dalam bentuk nilai angka yang disebut dengan nilai hash, teknik untuk mencari
nilai tersebut adalah Hashing.
Dengan sistem ini, Ketua Program Studi atau Koordinator Tugas Akhir nantinya
hanya memasukkan judul yang akan diajukan mahasiswa, kemudian sistem akan mengecek
secara otomatis dan menampilkan hasilnya. Hasil tersebut bisa dijadikan sebagai pertimbangan
dalam pengambilan keputusan dan dapat menentukan apakah diterima atau ditolak judul skripsi
tersebut.
Kata kunci : Algoritma Winnowing, fingerprint, n-gram, Hashing
1. PENDAHULUAN
Seiring berjalannya waktu telah
banyak judul-judul skripsi yang telah diterima
dan tersimpan di akademis. Dalam pengajuan
judul tidak sedikit mahasiswa yang berulang
kali mengajukan judul skripsi, hal ini
dikarenakan mahasiswa tersebut tidak
mengetahui judul yang diajukan telah ada
sebelumnya karena penentuan diterima atau
ditolaknya judul-judul yang diajukan oleh
mahasiswa masih dilakukan secara manual
yaitu dengan dengan mengecek satu persatu
berdasarkan daftar judul-judul skripsi
angkatan yang telah lulus yang tersimpan di
file Microsoft excel.
Judul skripsi yang sama, tidak
menutup kemungkinan isi dari skripsi tersebut
juga sama namun tidak menutup kemungkinan
juga isi skripsi berbeda walaupun judul skripsi
sama sehingga mahasiswa bingung dalam
menentukan judul skripsinya. Dalam
menentukan diterima atau tidaknya sebuah
judul skripsi yang sekarang ini dilakukan
adalah dengan mengecek atau
membandingkan judul tersebut dengan daftar
judul-judul yang telah ada, tentu saja hal ini
akan membutuhkan waktu yang cukup lama
belum lagi jika pengaju judul skripsi
berjumlah banyak, tidak menutup
kemungkinan ada judul yang terulang atau
sama dengan judul-judul yang tersimpan di
akademis bahkan waktu yang dibutuhkan juga
akan semakin lama.
Di samping itu, pengelolaan daftar
judul-judul yang telah ada juga masih
manual sehingga tidak menutup
kemungkinan data akan hilang dan sulit dalam
Technologia”Vol 10, No. 4, Oktober-Desember 2019 198
Jurnal Ilmiah Technologia
mendistribusikan informasi tersebut kepada
mahasiswa. Oleh karena itu, diperlukan suatu
sistem yang mampu mendeteksi persentase
kemiripan teks judul secara cepat dan tepat
dan mampu menyediakan informasi tersebut
kepada seluruh mahasiswa.
Untuk menentukan kemiripan teks
judul skripsi yang di ajukan dengan judul-
judul skripsi yang telah ada sebelumnya maka
diperlukan penerapan suatu algoritma untuk
menentukan kemiripan teks, salah satunya
algoritma untuk menentukan kemiripan teks
ialah algoritma Winnowing.
Algoritma Winnowing adalah sebuah
cara yang digunakan untuk mendeteksi
kesamaan kata/kalimat (common
subsequence) dalam dua atau lebih teks yang
dibandingkan. Dua teks diketahui memiliki
kesamaan kata/kalimat apabila di dalam
dokumen tersebut dijumpai fingerprint,
fingerprint inilah yang akan dijadikan dasar
pembanding antara teks, algoritma ini akan
mencari fingerprint (kesamaan di dalam dua
teks) dengan cara mengubah n-gram dari
sebuah teks ke dalam bentuk nilai angka yang
disebut dengan nilai hash, teknik untuk
mencari nilai tersebut adalah Hashing.
Dengan sistem ini, Koordinator Tugas
Akhir atau Ketua Program Studi nantinya
hanya memasukkan judul yang akan diajukan
ke formulir yang telah disediakan, kemudian
sistem akan mengecek secara otomatis dan
menampilkan hasilnya. Hasil tersebut bisa
dijadikan sebagai pertimbangan dalam
menentukan apakah diterima atau ditolak judul
tersebut.
2. METODE PENELITIAN
Metode Pendeteksi Plagiarisme di bagi
menjadi tiga bagian yaitu metode
perbandingan teks lengkap, metode dokumen
fingerprinting, dan metode kesamaan kata
kunci. Klasifikasi metode pendeteksi
plagiarisme dapat digambarkan sebagai
berikut:
Gambar 1. Klasifikasi Metode Pendeteksi Plagiarisme
Ketiga metode diatas dapat diuraikan
sebagai berikut (Stein, 2006) :
1. Perbandingan Teks Lengkap
Metode ini di terapkan dengan
membandingkan semua isi dokumen. Dapat
diterapkan untuk dokumen yang besar.
Pendekatan ini membutuhkan waktu yang
lama tetapi cukup efektif, karena kumpulan
dokumen yang diperbandingkan adalah
dokumen yang di simpan pada penyimpanan
lokal. Metode perbandingan teks lengkap
tidak dapat diterapkan untuk kumpulan
dokumen yang tidak terdapat pada dokumen
lokal.
Algoritma yang digunakan pada metode ini
adalah algoritma brute force, algoritma edit
distance, algoritma boyer moore dan
algoritma lavenshtein distance
2. Dokumen Fingerprinting
Dokumen fingerprinting merupakan metode
yang digunakan untuk mendeteksi
keakuratan salinan antar dokumen, baik
semua teks yang terdapat di dalam dokumen
atau hanya sebagian teks saja. Prinsip kerja
dari metode dokumen fingerprinting ini
adalah dengan menggunakan teknik hashing.
Teknik hashing adalah sebuah fungsi yang
mengkonversi setiap string menjadi bilangan.
3. Kesamaan Kata Kunci.
Prinsip dari metode ini adalah mengekstrak
kata kunci dari dokumen dan kemudian di
bandingkan dengan kata kunci pada
dokumen yang lain. Pendekatan yang
digunakan pada metode ini adalah teknik dot.
3. HASIL DAN PEMBAHASAN
Hasil Analisis Algoritma Winnowing
Penelitian ini menggunakan metode
eksperimen, dengan tahapan penelitian
sebagai berikut:
Pengolahan Data
Data yang digunakan berupa dokumen teks
yang berasal dari judul-judul skripsi
mahasiswa yang telah lulus mulai angkatan
Tahun 2011 sd angkatan tahun 2013 dengan
total 1092 Judul skripsi, kemudian data yang
tersimpan di Microsoft excel nantinya akan
Technologia”Vol 10, No. 4, Oktober-Desember 2019 199
Jurnal Ilmiah Technologia
APLIKASI LAYANAN
KEPENDUDUKAN ELEKTRONIK PADA
DINAS KEPENDUDUKAN DAN
PENCATATAN SIPIL KOTA
BANJARMASIN
SISTEM INFORMASI MANAJEMEN
LAYANAN KEPENDUDUKAN PADA
DISCAPIL KOTA BANJARMASIN
aplikasilayanankependudukanelektronikpada
dinaskependudukandanpencatatan
sipilkotabanjarmasin
sisteminformasimanajemenlayanankependud
ukanpadadiscapilkotabanjarmasin
diiputkan ke form input data aplikasi deteksi
plagiarisme, berikut contoh data dalam bentuk
excel,
Analisis Deteksi Kemiripan dengan Algoritma
Winnowing
Proses deteksi kemiripan judul dapat
dilakukan dengan menerapkan berbagai
metode untuk menghasilkan presentasi
kemiripan. Tujuan utama dari deteksi
kemiripan judul adalah untuk menentukan
presentase kemiripan judul satu dengan judul
lainya.
Gambar 2. Skema deteksi kemiripan judul skripsi
Deteksi kemiripan judul skripsi dapat
dideteksi dengan salah satu algoritma yaitu
dengan algoritma winnowing dimana hasil
presentase kemirpan judul ditampilkan. Proses
deteksi kemiripan dilakukan dengan
menampilkan presentase dengan mengunakan
Persamaan Jaccard Coeficient pada hasil
Fingerprint.
Adapun langkah-langkah deteksi kemiripan
judul skripsi adalah sebagai berikut:
1. Masukan judul skripsi yang akan dilihat
tingkat presentase nya dengan judul skripsi
yang sudah ada sebelumnya.
2. Memasukan nilai n-gram, untuk
memebentuk rangkaian gram pada judul
yang dimasukan dan judul yang
dibandingkan.
3. Masukan nilai Window, untuk
menentukan pembentukan window dari
nilai Hash.
4. Proses deteksi kemiripan judul skripsi
dengan algoritma winnowing yang mana
tujuanya dari proses deteksi kemiripan
judul tersebut ada untuk menampilkan
tingkat presentase dengan judul-judul yang
sudah ada sebelumnya. Berdasarkan analisa
di atas, dapat disimpulkan bahwa proses
deteksi kemirpan judul skripsi berdasarkan
algoritma winnowing menghasilkan
presentase kemiripan dengan kumpulan
judul skripsi yang sudah ada, karena
semakin tinggi presentase kemiripan maka
akan semakin mirip dengan judul yang
dibandingkan.
Implementasi Algoritma Winnowing
Tahapan-tahapan untuk mengimplementasikan
Algoritma Winnowing untuk mendeteksi
presentase plagiarisme pada judul skripsi adalah
sebagai berikut;
1. Ambil 2 judul skripsi yang akan
dibandingkan.
Teks Judul 1:
Teks Judul 2:
2. Pembuangan Karakter yang Tidak
Relevan
Hapus semua huruf yang bukan A-Z, a-z, 0-9.
Kemudian ubah menjadi huruf kecil semua.
Teks Judul 1 akan terbentuk menjadi seperti
berikut:
dan Teks Judul 2 akan terbentuk menjadi seperti
berikut:
3. Pembentukan Rangkaian n-gram
Buat n-gram untuk masing-masing judul kalimat.
Jumlah data pengelompokan n-gram ini bisa
dimulai dari 2, 3, 5, 7 dan seterusnya misal n-
gram=3.
Pada teks Judul 1 akan terbentuk 87 rangkaian n-
gram yaitu:
Pada teks Judul 1 akan terbentuk 87 rangkaian n-
gram yaitu:
Technologia”Vol 10, No. 4, Oktober-Desember 2019 200
Jurnal Ilmiah Technologia
apl pli lik ika kas asi sil ila lay aya yan ana
nan ank nke kep epe pen end ndu dud udu
duk uka kan ane nel ele lek ekt ktr tro ron
oni nik ikp kpa pad ada dad adi din ina
nas ask ske kep epe pen end ndu dud udu
duk uka kan and nda dan anp npe pen enc
nca cat ata tat ata tan ans nsi sip ipi pil ilk
lko kot ota tab aba ban anj nja jar arm
rma mas asi sin
sis ist ste tem emi min inf nfo for orm rma
mas asi sim ima man ana naj aje jem eme
men enl nla lay aya yan ana nan ank nke
kep epe pen end ndu dud udu duk uka kan
anp npa pad ada dad adi dis isc sca cap api
pil ilk lko kot ota tab aba ban anj nja jar
arm rma mas asi sin
W-1 : {1440 1538 1498}
W-2 : {1538 1498 1462}
W-3 : {1498 1462 1474}
W-4 : {1462 1474 1446}
W-5 : {1474 1446 1556}
W-6 : {1446 1556 1466}
W-7 : {1556 1466 1494}
W-8 : {1466 1494 1454}
W-9 : {1494 1454 1576}
W-10 : {1454 1576 1410}
W-11 : {1576 1410 1488}
W-12 : {1410 1488 1430}
W-13 : {1488 1430 1510}
W-14 : {1430 1510 1484}
W-15 : {1510 1484 1458}
W-16 : {1484 1458 1520}
W-17 : {1458 1520 1448}
W-18 : {1520 1448 1514}
W-19 : {1448 1514 1468}
W-20 : {1514 1468 1570}
W-21 : {1468 1570 1482}
W-22 : {1570 1482 1558}
W-23 : {1482 1558 1464}
W-24 : {1558 1464 1418}
W-25 : {1464 1418 1500}
W-26 : {1418 1500 1442}
W-27 : {1500 1442 1482}
W-28 : {1442 1482 1468}
W-29 : {1482 1468 1548}
W-30 : {1468 1548 1606}
W-61 : {1530 1520 1446}
W-62 : {1520 1446 1470}
W-63 : {1446 1470 1412}
W-64 : {1470 1412 1434}
W-65 : {1412 1434 1548}
W-66 : {1434 1548 1434}
W-67 : {1548 1434 1536}
W-68 : {1434 1536 1446}
W-69 : {1536 1446 1550}
W-70 : {1446 1550 1564}
W-71 : {1550 1564 1498}
W-72 : {1564 1498 1532}
W-73 : {1498 1532 1486}
W-74 : {1532 1486 1514}
W-75 : {1486 1514 1532}
W-76 : {1514 1532 1546}
W-77 : {1532 1546 1512}
W-78 : {1546 1512 1362}
W-79 : {1512 1362 1392}
W-80 : {1362 1392 1428}
W-81 : {1392 1428 1498}
W-82 : {1428 1498 1464}
W-83 : {1498 1464 1450}
W-84 : {1464 1450 1542}
W-85 : {1450 1542 1490}
W-86 : {1542 1490 1446}
W-1 : {1570 1532 1586}
W-2 : {1532 1586 1550}
W-3 : {1586 1550 1454}
W-4 : {1550 1454 1512}
W-5 : {1454 1512 1484}
W-6 : {1512 1484 1510}
W-7 : {1484 1510 1488}
W-8 : {1510 1488 1562}
W-9 : {1488 1562 1542}
W-10 : {1562 1542 1490}
W-11 : {1542 1490 1446}
W-12 : {1490 1446 1558}
W-13 : {1446 1558 1470}
W-14 : {1558 1470 1480}
W-15 : {1470 1480 1410}
W-16 : {1480 1410 1480}
W-17 : {1410 1480 1402}
W-18 : {1480 1402 1470}
W-19 : {1402 1470 1446}
W-20 : {1470 1446 1496}
W-21 : {1446 1496 1464}
W-22 : {1496 1464 1506}
W-23 : {1464 1506 1494}
W-24 : {1506 1494 1454}
W-25 : {1494 1454 1576}
W-26 : {1454 1576 1410}
W-27 : {1576 1410 1488}
W-28 : {1410 1488 1430}
W-29 : {1488 1430 1510}
W-30 : {1430 1510 1484}
W-31 : {1510 1484 1458}
W-32 : {1484 1458 1520}
W-33 : {1458 1520 1448}
W-34 : {1520 1448 1514}
W-49 : {1498 1510 1404}
W-50 : {1510 1404 1434}
W-51 : {1404 1434 1532}
W-52 : {1434 1532 1486}
W-53 : {1532 1486 1514}
W-54 : {1486 1514 1532}
W-55 : {1514 1532 1546}
W-56 : {1532 1546 1512}
W-57 : {1546 1512 1362}
W-58 : {1512 1362 1392}
W-59 : {1362 1392 1428}
W-60 : {1392 1428 1498}
W-61 : {1428 1498 1464}
W-62 : {1498 1464 1450}
W-63 : {1464 1450 1542}
W-64 : {1450 1542 1490}
W-65 : {1542 1490 1446}
W-66 : {1490 1446 1560}
Sedangkan pada teks Judul 2 terbentuk 66
rangkaian n-gram yaitu:
4. Perhitungan Fungsi Hash untuk Setiap
n-gram
Buat Rolling Hash untuk masing-masing
N-Gram , Perhitungan nilai hash pada
rangkaian n-gram pada teks judul 1
bagian pertama apl dengan nilai basis
(b) = 2, panjang rangkaian ngram(n) = 3
H(apl) =asci (a)* 23 + asci (p)* 22 + asci (l) *
21
= 97 *8 + 112*4 + 108 * 2
= 1440
5. Pembentukan Window dari Nilai Hash
Kelompokkan (windowing) untuk
masing-masing hasil hash, langkahnya
mirip seperti n-gram. Pembentukan
window dari hasil perhitungan nilai hash
dengan ukuran lebar window (w) = 3
pada teks judul 1 yaitu:
Kemudian pada teks judul 2 hasilnya yaitu;
6. Pemilihan Fingerprint dari Setiap
Window
Ambil angka terkecil dari masing-masing
window. Untuk selanjutnya angka terkecil ini
diistilahkan Fingerprints. Pemilihan nilai
fingerprint dari hasil pembentukan window
pada tahap sebelumnya adalah ;
nilai fingerprint pada teks judul 1 adalah 78
window
nilai fingerprint pada teks judul 2 adalah 66
window
Fingerprints dari kelompok (window) kalimat
teks judul 1 dengan fingerprints (window)
kalimat teks judul 2 inilah yang nanti akan
dihitung tingkat koefisien plagiarisme-nya
7. Persamaan Jaccard Coeficient
Perhitungan kesamaan dengan menggunakan
persamaan jaccard coefficient yaitu;
Similarity (kemiripan) = 65/88 * 100% =
73.86 %
Jumlah Fingerprints pada teks judul 1 = 87
Jumlah Fingerprints teks judul 2 = 66
Union (Gabungan) Fingerprints 1 dan 2 = 153
Intersection (fingerprints yang sama) = 65
(Union - Intersection) = 88
Prosentase Plagiarisme
Koefisien Jaccard = (Intersection / (Union-
Intersection) * 100 (65/88) * 100 = 73.86 %
Jadi dapat disimpulkan dari kedua judul diatas
memiliki tingkat plagiarisme sebesar 73.86 %
Pengujian Metode Winnowing
Untuk Fakultas Teknologi Informasi
menggunakan ambang batas seperti berikut:
Technologia”Vol 10, No. 4, Oktober-Desember 2019 201
Jurnal Ilmiah Technologia
Apabila Plagiarisme ringan maka judul
DITERIMA sedangkan untuk plagiarism sedang
dan berat maka judul DITOLAK.
4. KESIMPULAN DAN SARAN
Proses pengujian dilakukan mulai dari pegujian
jumlah gram, jumlah window dan basis bilangan
prima. Dapat dilihat pada tabel dibawah ini;
Tabel hasil pengujian deteksi tingkat plagiarisme
pada judul skripsi
Berdasarkan dari tabel hasil Pengujian diatas
dalam menentukan tingkat plagiarisme dengan
menggunakan n-gram, window, bilangan prima
menghasilkan 73.86 % tingkat plagiarisme tinggi
artinya mendekati plagiarisme dengan n-gram = 3 ,
window = 3 dan bilangan prima = 2 sedangkan
dengan menggunakan n-gram = 3 , window = 3
dan bilangan prima = 2 menghasilkan 19.82 %
artinya hanya mempunyai tingkat plagiarisme
ringan
REFERENSI
Astuti, W. (Agustus 2017). Analisis String
Matching Pada Judul Skripsi dengan
Algoritma Knuth-Morris Pratt(KMP).
ILKOM Jurnal Ilmiah Volume 9 Nomor 2
ISSN Cetak 2087-1716 ISSN Online
2548-7779, 168 - 172.
Astutik, S., Cahyani, A. D., & Sophan, M. K.
(November 2014). Sistem Penilaian Esai
Otomatis pada E-Learning dengan
Algoritma Winnowing. Jurnal
Informatika, Vol 12, No.2 ISSN 1411-
0105, 47-52.
Christian. (2013). Perancangan Sistem Deteksi
Plagiarisme Dokumen Teks
Menggunakan Algoritma Damerau
Levenshtein Distance. Jurnal Mahasiswa
PTIIK UB Vol 1.
Nurdin, & Amin, M. (September 2017).
Sistem Pendeteksian Kemiripan Judul
Skripsi Menggunakan Algoritma
Winnowing. Jurnal Nasional Informatika
dan Teknologi Jaringan (InfoTekJar) Vol
2, No 1 e- ISSN : 2540-7600, p-ISSN :
2540-7597.
Ridho, M. (2013). Rancang Bangun Aplikasi
Pendeteksi Penjiplakan Dokumen
Menggunakan Algoritma Biword
Winnowing . Pekanbaru Riau:
UNIVERSITAS ISLAM NEGERI
SULTSN SYARIF KASIM .
Setiawan, A. (Januari 2017). Implementasi
Algoritma Winnowing Untuk Deteksi
Kemiripan Judul Skripsi Studi Kasus
STIMIK Budidarma. Majalah Ilmiah
INTI Volume: XII, Nomor : 1 ISSN :
2339-210X.
No
Window(w)
Nilai
basis
Presentase %
1
3
2
73.86 %
2
3
2
36.7 %
3
3
2
29.46 %
4
5
2
73.26 %
5
5
2
36.79 %
6
5
2
29.36 %
7
7
2
55.91 %
8
7
2
30.56 %
9
7
2
23.42 %
10
9
2
50%
11
9
2
31.73 %
12
9
2
19.82 %
... The methods used for plagiarism detection text weighting include the winnowing algorithm, the Boyer-Moore algorithm, and the Rabin-Karp algorithm (or also known as Karp-Rabin) [3], [4]. The winnowing algorithm has been used in a study to detect the similarity level of thesis titles submitted compared with preexisting thesis titles [5]. The findings of this study indicate that with the score of n-gram = 3, window = 3, and prime number = 2, a similarity score of 73.86% has been achieved. ...
... This score suggests a significant degree of similarity between the examined titles. With the input of n-gram = 7, window = 9, and prime number = 2, a similarity score of 19.82% has been achieved, indicating a moderate plagiarism level [5]. ...
... However, the processed data are already in the form of numbers from the previous rolling hash process. For example, the results of title 1 with the window input score of 5 The last step of the winnowing process is to find the minimum score of each window. If there is the same minimum score from each window, only one score is taken, which is the rightmost score. ...
Article
Full-text available
Plagiarisme adalah tindakan meniru dan mengutip bahkan menyalin atau mengakui hasil karya orang lain sebagai hasil karya diri sendiri. Tugas akhir merupakan salah satu syarat wajib mahasiswa untuk menyelesaikan pembelajaran pada perguruan tinggi. Tugas akhir harus disusun mahasiswa berdasarkan ide sendiri. Akan tetapi, banyak terjadi plagiarisme karena mudahnya melakukan kegiatan tersebut, yaitu hanya dengan menyalin teks gagasan orang lain kemudian ditempelkan dalam lembar kerja dan diakui bahwa gagasan tersebut adalah ide sendiri. Selain itu, mengganti beberapa kata dalam kalimat gagasan orang lain dengan gaya bahasa sendiri tanpa menuliskan sumber aslinya juga termasuk plagiarisme. Pengecekan tugas akhir yang masih manual juga menjadi masalah bagi koordinator tugas akhir, yang membutuhkan ketelitian tinggi dan waktu yang cukup banyak untuk mengecek plagiarime pada dokumen tugas akhir. Maka, deteksi plagiarisme sangat dibutuhkan untuk mencegah tindakan plagiarisme makin berkembang. Menyikapi hal tersebut, penelitian ini bermaksud mengembangkan sistem yang dapat mendeteksi persamaan antardokumen teks yang berfokus pada kata yang mengandung sinonim pada suatu kalimat. Salah satu algoritma yang digunakan adalah synonym recognition, yang berfungsi untuk mendeteksi kata yang mengandung sinonim, dengan proses membandingkan setiap kata dengan kata yang terdapat pada kamus. Synonym recognition dikombinasikan dengan metode winnowing, yang berfungsi untuk pembobotan teks berbasis fingerprint. Setelah diperoleh bobot dari masing-masing dokumen, tingkat kemiripan antardokumen dihitung dengan algoritma cosine similarity. Hasil rata-rata nilai kemiripan untuk deteksi judul dan abstrak dengan menambahkan synonym recognition meningkat sebesar 3,11% daripada tanpa menggunakan synonym recognition yang dikombinasikan dengan metode pembobotan winnowing. Hasil pengujian menunjukkan bahwa algoritma-algoritma yang digunakan akurat dengan pengujian akurasi dan root mean squared error (RMSE).
... Metode Pendeteksi Plagiarisme dibagi menjadi tiga bagian yaitu metode perbandingan teks lengkap, metode dokumen fingerprinting, dan metode kesamaan kata kunci [6]. Dokumen fingerprinting merupakan metode yang digunakan untuk mendeteksi keakuratan salinan antar dokumen, baik semua teks yang terdapat di dalam dokumen atau hanya sebagian teks saja. ...
... Dokumen fingerprinting merupakan metode yang digunakan untuk mendeteksi keakuratan salinan antar dokumen, baik semua teks yang terdapat di dalam dokumen atau hanya sebagian teks saja. Prinsip kerja dari metode dokumen fingerprinting ini adalah dengan menggunakan teknik hashing [6]. Teknik hashing adalah merubah data menjadi serangkaian bilangan bulat dengan jumlah data yang digunakan, dinyatakan dengan k-gram [7]. ...
Article
Full-text available
Plagiarisme adalah sebuah Tindakan mengambil atau menjiplak karya, gagasan atau ide-ide orang lain baik sengaja maupun tidak sengaja dan mengakui sebagai karya sendiri tanpa menyebutkan sumber dan penelitinya. Plagiarisme dalam proses pengerjaan tugas akhir, bukan merupakan hal yang baru terjadi. Plagiarisme dilakukan mulai dari pengusulan judul, dimana mahasiswa mengusulkan judul yang sama persis atau judul yang hampir sama. Membangun sebuah system yang dapat melakukan pengecekan kesamaan judul tugas akhir untuk mencegah kegiatan plagiarisme, dibutuhkan metode untuk proses pengecekan plagiarisme tersebut. Algoritma winnowing adalah salah satu algoritma yang dapat melakukan metode dokumen fingerprinting untuk mendeteksi plagiarisme. Proses plagiarisme menggunakan metode Winnowing ini dipengaruhi dengan nilai k-gram dan nilai window. Kedua variable tersebut ditentukan saat merancang dan membangun sebuah system plagiarisme menggunakan metode Winnowing. Pada penelitian ini, peneliti akan melakukan analisis terhadap pengaruh variabel k-gram dan window pada metode Winnowing dengan melihat hasil nilai plagiarisme yang dihasilkan. Peneliti akan menerapkan metode Winnowing dengan beberapa nilai k-gram dan nilai window. Hasil dari penelitian ini adalah sebuah sistem yang menerapkan metode winnowing untuk memeriksa kesamaan judul tugas akhir. Sistem pengecekan dibangun dengan nilai variabel k dan w dapat diisi oleh pengguna dengan tujuan sistem ini dibangun untuk melakukan analisis terhadap metode winnowing. Pada penelitian ini menggunakan 25 pasang nilai k dan w dan diperoleh bahwa Variabel k lebih berpengaruh pada hasil similaritas dibandingkan dengan variabel w, terbukti pada hasil penelitian, selisih hasil kemiripan untuk perbedaan nilai k yaitu 5% - 9% sedangkan selisih hasil kemiripan untuk perbedaan nilai w yaitu 1% - 3%.
... While rabin-karp algorithm, it is used to search for the number of the string [6]. According to N. Alamsyah [7] that winnowing algorithm, it has its own ways to find the similarity of word on the thesis tittle with fingerprint. The test is still the text form then it will be changed into a numeral which is called hash. ...
Article
Plagiarism is the act of imitating and quoting and even copying or acknowledging other people's work as one's own work. Plagiarism is currently growing rapidly, especially in the world of education. So that plagiarism detection is needed to prevent plagiarism from growing rapidly. In response to this, this paper intends to conduct research that compares the dice similarity and the jaccard coefficient to find the best document similarity value level against the Winnowing algorithm which functions to find the fingerprint value of each document. The test results show that the winnowing algorithm is quite good at using the dice similarity level with the results of an average similarity value of 71.17615% than testing using jaccard coefficient with the resulting value 35,58837%.
Article
Plagiarism is often found in the academic world and is considered a serious violation because it involves the appropriation of ideas, opinions, or writings of others. A thesis is the final work of a student that must meet scientific standards and be tailored to the field of study. It is important to check the similarity of the thesis using a web-based sistem to prevent plagiarism and ensure academic integrity. This sistem will be developed as a web-based platform with the aim of comparing the Winnowing algorithm and the Rabin-Karp algorithm in checking the similarity of thesis/final project texts with existing thesis data. In principle, both methods involve searching for strings using hashing functions to compare the sought string (m) with the compared string (n) by comparing the results of the hashing function used. However, the Winnowing algorithm differs in that it does not use all hash values from each formed set of grams. The hash values formed in the previous stage will be divided into a window of size (w). In this research, the sistem testing uses data from Computer Engineering students at Halu Oleo University to facilitate checking the plagiarism level of theses using the Rabin-Karp and Winnowing algorithms. In this study, the Rabin-Karp and Winnowing algorithms have been implemented successfully in the plagiarism checking sistem for students' theses. The test results for the comparison of the Winnowing and Rabin-Karp algorithms in terms of processing time show that the Rabin-Karp algorithm takes 1.509 seconds, while the Winnowing algorithm takes 1.508 seconds. Subsequent testing using Normalized Mean Absolute Error (NMAE) reveals that the Rabin-Karp algorithm has an absolute error value of 0.1829, while the Winnowing algorithm has a value of 0.0194. Therefore, based on the NMAE test, the Winnowing algorithm performs better than the Rabin-Karp algorithm.
ResearchGate has not been able to resolve any references for this publication.