DETAIL KOLEKSI

Deteksi Plagiasi Dengan Menggunakan Skema Authorship Attribution


Oleh : Vebry Dwiyana Rasalni

Info Katalog

Penerbit : FTI - Usakti

Kota Terbit : Jakarta

Tahun Terbit : 2014

Pembimbing 1 : Anung Ariwibowo

Subyek : Demodulation - Detection;Pattern recognition;Learning algorithms - Clustering algorithm

Kata Kunci : plagiarism detection, authorship attribution, clustering algorithm


File Repositori
No. Nama File Ukuran (KB) Status
1. 2014_TA_IF_06410001_Halaman-Judul.pdf 3441.21
2. 2014_TA_IF_06410001_Daftar-Pustaka.pdf 832.76
3. 2014_TA_IF_06410001_Lampiran.pdf 3332.42

D Deteksi plagiasi adalah sebuah proses untuk menemukan tindak plagiarisme pada sebuah dokumen. Penggunaan komputer yang semakin meluas serta kehadiran interne membuat tindak plagiarisme semakin mudah untuk dilakukan. Skema Authorship Attribution (AA) adalah sebuah proses identifikasi pengarang berdasarkan ciri penulisannya. Skema ini dapat dilakukan dengan salah satu penelitian yang tengah dikembangkan yaitu stylomeby, yang merupakan analisis statistik dari variasi yang terdapat dan gaya penulisan seseorang. Salah satu fitur yang digunakan dalam proses AA ini adalah fitur leksikal yaitu penghitungan frekuensi kemunculan huruf dan kata.Penerapan skema Authorship Attribution pada proses deteksi plagiasi dapat dicapai dengan mengimplementasikan algoritma clustering (pengelompokan) yang tersedia pada library Weka. Data dokumen yang berjumlah 60 laporan yang terdapat pada arsip tugas akhir diolah menggunakan library Tika untuk mengekstrak konten teks dari berbagai format dokumen (PDF, DOC, DOCX). Dengan penggunaan algoritma tersebut, sistem diharapkan dapat melakukan skema Authorship Attribution terkomputasi untuk dapat menjalankan proses deteksi plagiasi.Berdasarkan uji cobs yang dilakukan, tingkat kesalahan hasil clustering K-Means jauh lebih rendah dari pada algoritma EM. Dan lima percobaan yang dilakukan, EM gagal mengenali file uji satu kali dengan persentase 80% sedangkan KMeans dapat mengenali seluruh file uji dengan persentase 100%. KMeans memiliki rata — rata waktu pengerjaan I menit 45 detik sedangkan proses EM membutuhkan rata — rata 10 menit 54 detik.

P Plagiarism detection is a process to detect an act of plagiarism in a document. The immense use of computer with also the appearance of internet have established an easier conduct of plagiarism. The scheme of Authorship Attribution is a process to identify the author based from his/her writing's characteristics. This process can be achieved with one of a currently developing research, stylometry, a statistical analysis from one's variation of writing styles. One of feature used in this AA scheme is lexical feature which is the computation of letter and word appearance frequency.Application of Authorship Attribution scheme to the plagiarism detection process can be attained by implementing clustering algorithms that are available within Weka Library. Using 60 archived thesis documents, the data are processed with Tika library to extract text content with variety of file formats (PDF, DOC, and DOCX). With the use of those algorithms, system can be expected to apply the computed concept of Authorship Attribution to be able to perform plagiarism detection.Based on the conducted testing, the error rate of K-Means algorithm is much lower than EM Algorithm. From five attempts, EM failed to recognize tested document once with 80% of percentage whilst KMeans recognized all of the tested files with 100% of percentage. The average processing time for EM was 10 minutes and 54 seconds and for KMeans was 1 minutes 45 seconds.

Bagaimana Anda menilai Koleksi ini ?