JURNAL: SISTEM PENGIDENTIFIKASI OTOMATIS POKOK KALIMAT SUATU PARAGRAF DALAM DOKUMEN EKSPOSITORI DENGAN MODEL RUANG VEKTOR

JURNAL: SISTEM PENGIDENTIFIKASI OTOMATIS POKOK KALIMAT SUATU PARAGRAF DALAM DOKUMEN EKSPOSITORI DENGAN MODEL RUANG VEKTOR

JURNAL: SISTEM PENGIDENTIFIKASI OTOMATIS POKOK KALIMAT SUATU PARAGRAF DALAM DOKUMEN EKSPOSITORI DENGAN MODEL RUANG VEKTOR

Abstrak 

Suatu dokumen biasanya terdiri dari bermacam-macam topik, berbeda dengan abstraksi yang ringkas dan padat informasi. Identifikasi dan isolasi pokok kalimat dengan membagi-bagi dokumen, yang disebut segmentasi teks, merupakan hal yang penting dalam pemrosesan bahasa alami, termasuk mesin penterjemah dan information retrievel. Dalam information retrievel, pengguna sering kali hanya tertarik pada bagian tertentu dari dokumen yang diambil, bukan pada keseluruhan dokumen itu. Untuk memenuhi kebutuhan tersebut dokumen harus disegmentasi ke dalam bagian-bagian yang koheren atau berkaitan. Segmentasi dokumen ke dalam blok-blok teks dengan pokok kalimat yang sama dapat membantu search engine untuk memilih dan mengambil suatu segmen yang seusai dengan query yang diajukan pengguna. Segmentasi yang secara nyata dapat dilihat adalah adanya pembagian dokumen dalam paragraf-paragraf. Penelitian yang dilakukan bertujuan memberikan kemudahan bagi pengguna dokumen ekspositori untuk memahami dokumen yang akan digunakan. Hasil yang diperoleh setelah dilakukan pengujian terdahap sistem adalah sebesar 50% dinilai dari kesesuaian penentuan pokok kalimat yang ditentukan secara manual dan oleh sistem. 

Kata Kunci: information retrievel, segmentasi teks, vector space model, tokenisasi 

Pendahuluan 

Penelitian ini adalah studi kasus khusus dari bidang pengolahan bahasa alami yang memfokuskan pada pencarian pokok kalimat dari suatu paragraf. Penentuan pokok kalimat secara alami oleh manusia dapat sangat mudah untuk dilakukan dikarenakan kemampuan manusia untuk dapat merangkum dan menentukan kata-kata mana yang bersesuaian yang dapat membentuk suatu kesatuan cerita walaupun terkadang manusia pun akan menemukan kesulitan juga dalam penentuan itu. Dalam bidang komputer terutama Informatika, hal ini dibahas lebih lanjut dalam studi kepustakaan antara kemampuan tata bahasa linguistik, pembentukan parsing, aturan, dan pemrograman yang cukup efisien. Penentuan pokok kalimat tersebut dilakukan dengan membagi (segmentation) kalimat dalam suatu alinea paragraf yang koheren dan berkaitan.

Peneliti: Muhammad Erwin Ashari Haryono

Untuk lebih lengkapnya silahkan download di link berikut:
JURNAL: SISTEM PENGIDENTIFIKASI OTOMATIS POKOK KALIMAT SUATU PARAGRAF DALAM DOKUMEN EKSPOSITORI DENGAN MODEL RUANG VEKTOR