JURNAL : Klasifikasi Metagenom dengan Metode Naïve Bayes Classifier

JURNAL : Klasifikasi Metagenom dengan Metode Naïve Bayes Classifier

JURNAL : Klasifikasi Metagenom dengan Metode Naïve Bayes Classifier
ABSTRAK - Studi metagenom merupakan langkah penting pada pengelompokan taksonomi. Pengelompokan pada metagenom dapat dilakukan dengan menggunakan metode binning. Binning diperlukan untuk mengelompokkan contigs yang dimiliki oleh masing-masing kelompok spesies filogenetik. Pada penelitian ini, binning dilakukan dengan menggunakan pendekatan komposisi berdasarkan supervised learning (pembelajaran dengan contoh). Metode supervised learning yang digunakan yaitu Naïve Bayes Classifier. Adapun metode yang digunakan untuk ekstraksi ciri adalah dengan melakukan perhitungan frekuensi k-mer. Klasifikasi pada metagenom dilakukan berdasarkan tingkat takson genus. Dari proses klasifikasi yang dilakukan, akurasi yang diperoleh dengan menggunakan fragmen pendek (400 bp) adalah 49.34 % untuk ekstraksi ciri 3-mer dan 53.95 % untuk ekstrasi ciri 4-mer. Sementara itu, untuk fragmen panjang (10 kbp), akurasi mengalami peningkatan yaitu 82.23 % untuk ekstraksi ciri 3-mer dan 85.89 % untuk esktraski ciri 4-mer. Dari hasil tersebut dapat disimpulkan bahwa akurasi semakin tinggi seiring dengan semakin panjangnya ukuran fragmen. Selain itu, penelitian ini juga menyimpulkan bahwa metode ekstrasi ciri yang memberikan hasil paling maksimal adalah dengan menggunakan ekstraksi ciri 4-mer.
Kata Kunci: metagenom, k-mer, Naïve Bayes Classifier, binning, klasifikasi

PENDAHULUAN - Studi metagenom merupakan langkah penting pada pengelompokan taksonomi(Higashi et al. 2012). Pengelompokan metagenom menggunakan proses yang disebut binning. Binning diperlukan untuk mengelompokan contigs yang dimiliki dari masing-masing kelompok spesies filogenetik. Metode binning terdiri atas dua pendekatan yaitu berdasarkan Komposisi dan homologi. Metode binning berdasarkan komposisi melakukan perhitungan frekuensi ciri yang muncul dari pasangan basa (base pair) yang membentuk sekuens metagenom. Ciri komposisi digunakan sebagai masukkan pembelajaran dengan contoh (supervised learning) atau pembelajaran secara observasi (unsupervised learning). Metode binning berdasarkan komposisi dengan supervised learning yang telah dilakukan antara lain Naïve Bayes Classifier (Rosen et al. 2008), Support Vector Machine (Kim et al. 2010), PhyloPythia (McHardy et al. 2007), dan Phymm (Brady dan Salzberg 2009). Metode binning berdasarkan komposisi dengan unsupervised learning terdiri atas Growing Self Organizing Map (Chan et al. 2008 dan Overbeek et. al., 2013), SOC atau Self Organizing Clustering (Amano et al. 2003; Amano et al. 2007), Kohonen SOM atau Kohonen Self Organizing Map (Abe et al. 2003).

DOWNLOAD JURNAL