Jurnal: Penentuan Gender Otomatis Berdasarkan Isi Microblog Memanfaatkan Fitur Sosiolinguistik

Jurnal: Penentuan Gender Otomatis Berdasarkan Isi Microblog Memanfaatkan Fitur Sosiolinguistik

Jurnal: Penentuan Gender Otomatis Berdasarkan Isi Microblog Memanfaatkan Fitur Sosiolinguistik

Abstrak 

Penentuan gender secara otomatis dapat bermanfaat untuk kepentingan forensik dan komersial. Penelitian ini membahas penentuan gender pengguna secara otomatis berdasarkan isi microblog (Twitter) yang ditulis dalam Bahasa Indonesia dengan memanfaatkan fitur sosiolinguistik. Dilakukan pengukuran akurasi model klasifikasi untuk tiga jenis fitur: leksikal, sosiolinguistik dan kombinasi keduanya. Fitur leksikal menghasilkan akurasi 84.94%, dan sosiolinguistik 83.01%. Hasil terbaik dengan akurasi 86.22% didapat dengan kombinasi kedua fitur tersebut. Ditemukan beberapa perbedaan aspek sosiolinguistik antara Bahasa Indonesia dengan Bahasa Inggris. 

Kata Kunci Microblog, Twitter, Gender, Sosiolinguistik, Klasifikasi Teks 

Pendahuluan 

Penentuan gender seseorang secara otomatis berdasarkan isi tulisannya dapat digunakan untuk berbagai kepentingan. Pihak berwajib dapat menggunakannya untuk membuat profil tersangka. Sedangkan perusahaan dapat memanfaatkan prediksi gender ini untuk mengetahui jenis pelanggan yang menggunakan atau mengomentari produknya.

Peneliti: Yudi Wibisono

Untuk lebih lengkapnya silahkan download di link berikut:
Jurnal: Penentuan Gender Otomatis Berdasarkan Isi Microblog Memanfaatkan Fitur Sosiolinguistik