JURNAL : POS TAGGING BAHASA MADURA DENGAN MENGGUNAKAN ALGORITMA BRILL TAGGER

JURNAL : POS TAGGING BAHASA MADURA DENGAN MENGGUNAKAN ALGORITMA BRILL TAGGER

JURNAL : POS TAGGING BAHASA MADURA DENGAN MENGGUNAKAN ALGORITMA BRILL TAGGER

Abstrak 

Bahasa Madura adalah bahasa daerah yang selain digunakan di Pulau Madura juga digunakan di daerah lainnya seperti di kota Jember, Pasuruan, dan Probolinggo. Sebagai bahasa daerah, Bahasa Madura mulai banyak ditinggalkan khususnya di kalangan anak muda. Beberapa penyebabnya adalah adanya rasa gengsi dan tingkat kesulitan untuk mempelajari Bahasa Madura yang memiliki ragam dialek dan tingkat bahasa. Berkurangnya penggunaan Bahasa Madura dapat mengakibatkan punahnya Bahasa Madura sebagai salah satu bahasa daerah yang ada di Indonesia. Oleh karena itu, perlu adanya usaha untuk mempertahankan dan memelihara Bahasa Madura. Salah satunya adalah dengan melakukan penelitian tentang Bahasa Madura dalam bidang Natural Language Processing sehingga kedepannya pembelajaran tentang Bahasa Madura dapat dilakukan melalui media digital. Part Of Speech (POS) Tagging adalah dasar penelitian text processing, sehingga perlu untuk dibuat aplikasi POS Tagging Bahasa Madura untuk digunakan pada penelitian Natural Languange Processing lainnya. Dalam penelitian ini, POS Tagging dibuat dengan menggunakan Algoritma Brill Tagger dengan menggunakan corpus yang berisi 10.535 kata Bahasa Madura. POS Tagging dengan Brill Tagger dapat memberikan kelas kata yang sesuai pada kata dengan menggunakan aturan leksikal dan kontekstual. Brill Tagger merupakan algoritma dengan tingkat akurasi yang paling baik saat diterapkan dalam Bahasa Inggris, Bahasa Indonesia dan beberapa bahasa lainnya. Dari serangkaian percobaan dengan beberapa perubahan nilai threshold tanpa memperhatikan OOV (Out Of Vocabulary), menunjukkan rata-rata akurasi mencapai lebih dari 80% dengan akurasi tertinggi mencapai 86.67% dan untuk pengujian dengan memperhatikan OOV mencapai rata-rata akurasi 67.74%. Jadi dapat disimpulkan bahwa Brill Tagger dapat digunakan untuk Bahasa Madura dengan tingkat akurasi yang baik. 

Kata kunci: part of speech, pos tagging, bahasa madura, brill tagger, tagset. 

1. PENDAHULUAN 

Bahasa Madura adalah bahasa daerah yang digunakan di Pulau Madura dan beberapa daerah lainnya seperti Jember, Pasuruan dan Probolinggo. Sebagai bahasa daerah, Bahasa Madura perlu dibina dan dikembangkan, terutama dalam hal peranannya sebagai sarana pengembangan kebudayaan daerah untuk mendukung kebudayaan nasional (halim,1976). Menurut Purwo (2000), Bahasa Madura menduduki peringkat keempat penutur terbanyak yang digunakan setelah Bahasa Jawa. Namun saat ini Bahasa Madura semakin banyak ditinggalkan oleh Masyarakat Madura khususnya di kalangan anak muda (Mulyadi, 2014). Ada banyak faktor yang menyebabkan semakin berkurangnya penggunaan dan pemahaman terhadap Bahasa Madura, antara lain karena (1) penggunaan Bahasa Indonesia sebagai bahasa utama pengantar pendidikan, (2) rasa malu saat menggunakan bahasa daerah, (3) sedikitnya penggunaan Bahasa Madura dalam media massa baik dalam bentuk tulisan maupun siaran berbahasa Madura, dan (4) sulitnya mempelajari Bahasa Madura yang memang memiliki ragam tutur/dialek dan cara penulisan yang unik (Sofyan, 2017).

Untuk lebih lengkapnya anda bisa mengdownload jurnal nya di link berikut :

JURNAL : POS TAGGING BAHASA MADURA DENGAN MENGGUNAKAN ALGORITMA BRILL TAGGER




 Kata Kunci : Algoritma Brill Tagger, Jurnal Sistem Pakar, Jurnal Teknik Informatika, Jurnal Skripsi, Jurnal, Contoh Jurnal, Skripsi Teknik Informatika,Contoh Skripsi, Skripsi