Consistency and Replication

Consistency and Replication

Consistency and Replication

Replikasi adalah suatu teknik untuk melakukan copy / pendistribusian data dan objek-objek dalam melaksanakan sinkronisasi antara objek sehingga konsistensi data dapat terjamin.

Konsep dasar Replikasi :  

  • Dengan menggunakan teknik replikasi ini, data dapat didistribusikan ke lokasi yang berbeda melalui koneksi jaringan lokal maupun internet. 
  • Replikasi juga memungkinkan untuk mendukung kinerja aplikasi, penyebaran data fisik sesuai dengan penggunaannya, seperti pemrosesan transaksi online dan DSS(Desiscion Support System) atau pemrosessan database terdistribusi melalui beberapa server.
  • Keuntungan replikasi tergantung dari jenis replikasi tetapi pada umumnya replikasi mendukung ketersediaan data setiap waktu dan dimanapun diperlukan.
  • Secara garis besar ada dua yaitu reliability dan performance.


Reliability
Satu sistem, atau bahkan lebih dari satu, dapat terjadi tabrakan tanpa akses ke data yang mengalami interrupt. Memiliki salinan data dan mengijinkan data yang corrupt agar mudah dalah proses pendeteksian dan perbaikan.

    Performance
    Adapun keuntungan lainnya adalah :
    • Memungkinkan beberapa lokasi menyimpan data yang sama. Hal ini sangatberguna pada saat lokasi-lokasi tersebut membutuhkan data yangsama atau memerlukan server yang terpisah dalam pembuatan aplikasi laporan.
    • Aplikasi transaksi online terpisah dari aplikasi pembacaan seperti proses analisis database secara online, data smarts atau data warehouse.
    • Memungkinkan otonomi yang besar. Pengguna dapat bekerja dengan meng-copy data pada saat tidak terkoneksi kemudian melakukan perubahan untuk dibuat database baru pada saat terkoneksi
    • Data dapat ditampilkan seperti layaknya melihat data tersebut dengan menggunakan aplikasi berbasis Web
    • Meningkatkan kinerja pembacaan
    • Membawa data mendekati lokasi individu atau kelompok pengguna. Halini akan membantu mengurangi masalah karena modifikasi data danpemrosesan query yang dilakukan oleh banyak pengguna karena data dapat didistribusikan melalui jaringan dan data dapat dibagi berdasarkan kebutuhan masing-masing unit atau pengguna.
    • Penggunaan replikasi sebagai bagian dari strategi standby server.
    • Replikasi dapat digunakan apabila sebuah organisasi atau perusahaan didukung oleh hardware dan aplikasi sofware dalam sebuah sistem yang tersebar.
    • Aplikasi yang berbeda mempunyai kebutuhan yang berbeda untuk otonomi dan konsistensi data. Replikasi diperlukan dalam sistem tersebar apabila berikut ini:
    1. Meng-copy dan mendistribusikan data dari satu atau lebih lokasi
    2. Mendistribusikan hasil copy data berdasarkan jadwal
    3. Mendistribusikan perubahan data ke server lain
    4. Memungkinkan beberapa pengguna di beberapa lokasi untuk melakukan perubahan dan kemudian menggabungkan data yang telah dimodifikasi.
    5. Membangun aplikasi data yang menggunakan perlengkapan online maupun offline.
    6. Membangun aplikasi Web sehingga pengguna dapat melihat volume data yang besar. Merencanakan Replikasi.
    7. Perencanaan yang baik sebelum replikasi dapat memaksimalkan konsistensi data, meminimalkan kebutuhan jaringan dan menghindari beberapa masalah.

    Beberapa hal yang menjadi pertimbangan dalam perencanaan replikasi :
    1. Kebutuhan data yang akan diubah dan siapa yang mengubah
    2.  Pendistribusian data memerlukan konsistensi, otonomi dan kesinambungan
    3. Kelengkapan replikasi yang meliputi kebutuhan user, infra struktur teknik, jaringan dan keamanan serta karakteristik data
    4. Jenis replikasi dan pilihannya
    5. Topologi replikasi dan bagaimana mewujudkannya agar sesuai dengan jenis replikasi

    Jenis–jenis Replikasi
    • Snapshot replication : Mendistribusikan data yang dapat dilihat pada saat tertentu tanpa melakukan update. Biasanya digunakan pada saat memerlukan tampilan data seperti : daftar harga, katalog, data yang digunakan untuk pengambilan keputusan. Data-data ini sifatnya hanya ‘Readonly’.
    • Replikasi ini membantu pada saat :
    1. data sebagian besar statis dan tidak sering berubah
    2.  datanya sedikit
    3. dapat menerima copy data yang telah melewati batas waktu yang ditentukan
                                                           


    Transactional replication : Memelihara kekonsistenan transaksi yang terjadi

    Consistency and Replication



    • Merge replication : Merge replication memungkinkan pengguna bekerja dan merubah data sesuai dengan wewenangnya. Pada saat server tidak dikoneksikan ke seluruh lokasi dalam topologi, replikasi merubah ke nilai data yang sama.


    Consistency and Replication


    Konsistensi dalam Sistem Terdistribusi

      Konsistensi semantik merupakan kriteria penting dalam evaluasi sistem berkas yang menunjang berkas berbagi. Konsistensi semantik menunjukkan karakteristik sistem yang menspesifikasi semantik dari pengguna ganda yang mengakses berkas yang sama secara simultan. Konsistensi semantik berhubungan langsung dengan algoritma pada proses sinkronisasi.
      Beberapa contoh penting konsistensi semantik sebagai berikut:
      1. UNIX Semantics. Apa yang ditulis pengguna pada sebuah open berkas dapat dilihat pengguna lain yang juga sedang membuka berkas yang sama Sharing memungkinkan pengguna untuk berbagi pointer.
      2. Session Semantics. Apa yang ditulis pengguna pada sebuah open berkas tidak dapat dilihat pengguna lain yang juga sedang membuka berkas yang sama. Setelah berkas itu di-close, perubahan yang terjadi karena ada pengguna yang menulis berkas dapat dilihat.
      3. Immutable-Shared Files Semantics. Sebuah immutable berkas tidak dapat dimodifikasi. Walaupun beberapa pengguna mengakses immutable file, isi berkas tidak dapat diubah.
      Model konsistensi pada data yang di share sulit diterapkan secara efisien, dalam beberapa kesempatan penggunaan model yang sederhana dapat juga dipakai, karena lebih mudah dalam implentasinya. Salah satunya adalah model client-centric consistency, dimana proses model ini menitikberatkan pada pendekatan single client.
      Didalam sistem tersebar yang menjadi pemikiran pertama adalah bagaimana mengelola replika. Baru tahap berikutnya adalah menjaga agar server replika tetap konsisten.
       
      Dua jenis model konsistensi adalah :
      - Model konsistensi berpusat pada data (Data-Centric Concistency Models)
      - Model konsistensi berpusat pada client

      Consistency and Replication


      Gambar :
      A distributed System for replication -aware distributed objects
      Distributed System responsible for replica management

      Model konsistensi berpusat pada data (Data-Centric Concistency Models)

      • Model Konsistensi ini menitik beratkan pada proses Read danWrite dalam kaitan dengan Read dan Write operasi pada data yang di -share.
      • Hal ini disebut sebagai data store.contoh ; shared file System, memory space , database.
      • Setiap proses dapat mengakses data dari media penyimpanan sesungguhnya memiliki salinan (copy) data dari media penyimpanan yang sesungguhnya secara lokal. 
      • Konsistensi model terjadi antara proses dan penyimpanan data, jika proses berjalan sebagaimana mestinya maka penyimpanan data berfungsi sebagaimana mestinya juga.
      • Model konsistensi dapat membatasi nilai pada saat proses Read sehingga proses pengembalian data data dapat dilakukan. Beberapa diantaranya dibatasi, semakin terbatas pembatasan nilai yang ada semakin mudah diterapkan.
      • Pembatasan konsistensi meliputi beberapa tahap. Apapun proses bacaan pada satu item data data x kembalikan satu nilai sesuai dengan hasil dari yang paling terbaru di tuliskan item data x. 
      • Pembatasan ini membutuhkan model konsistensi. Ini mengasumsikan keberadaan dari waktu global absolut, dan sangat mungkin di implementasikan
      • Sebagai ilustrasi perilaku proses R(x) untuk proses Read pada data x yang memunculkan hasil k. Di mana W(x) merupakan proses Write.


      Consistency and Replication


      Sequential Consistency and Linearizability 
      Sequential consistency (Lamport, 1979): digunakan untuk shared memory pada sistem multiprosesor. Dalam data store dikatakan sequentialy consistent apabila memeenuhi kondisi berikut :

      Hasil dari tiap eksekusi adalah sama jika operasi read dan write untuk seluruh proses di data store diekseskusi pada beberapa perintah yang terurut (sequential) dan operasi untuk setiap proses terlihat pada urutan yang diperintah secara spesifik oleh program. 


      Causal Consistency
      Causal consistency lebih lemah dibandingkan sequential consistency. Causal consistency (Hutto and Ahamad, 1990), proses penulisan (write) harus terlihat pada perintah yang berbeda dan pada mesin yang berbeda.
      Jadi sistem menggunakan causal consistency jika Write berpotensi yang disebabkan saling terkait di lihat oleh node didalam sistem dengan perintah yang sama. Kebersamaan write akakn terlihat di dalam perintah yang berbeda pada node yang berbeda. Disinilah letak kelemahannya dibandingkan dengan sequential consistency, yang membutuhkan node -node untuk melihat proses write pada pesanan yang sama.

      Model konsistensi berpusat pada client (Client-centric consistency model ). Kita berasumsi bahwa tidak ada proses update secara simultan terhdap penyimpanan data, atau ketika terjadi proses tersebut bisa dengan mudah diselesaikanbmereka terjadi mereka dapat dengan mudah dipecahkan, dan kebanyakan operasinya tersebut melibatkan pembacaan data. Kita perhatikan untuk Domain Name System atau World Wide Web.

      Di dalam sistem ini, mayoritas operasi itu terbaca, dan sangat utama semua menulis dilaksanakan oleh penguasa pusat (pemilik –pemilik halaman web, hostmasters), jadi kita  tidak pernah mempunyai write – write conflicts.
      Jika tidak ada update berlangsung dalam jangka waktu lama, semua replika akan secara                           berangsur-angsur dijadikan konsisten (data lama akan di hapus dari cache).

      Proses ini disebut sebagai eventual consistency.


      Consistency and Replication


      Gambar : Hal dasar seorang pengguna mengakses replika yang berbeda dalam database terdistribusi

      Protokol-protokol untuk konsistensi
      Protokol pada konsistensi digunakan untuk menguraikan lebih dalam mengenai model konsistensi. Ada tiga protokol yaitu :

      - Primary-Based Protocols
      - Remote-Write Protocols & Local - Write Protocols
      - Replicated-Write Protocols
      - Active Replication & Quorum-Based Protocols
      - Cache-coherence Protocols

      Replikasi adalah suatu teknik untuk melakukan copy dan pendistribusian data dan objek-objek dan melaksanakan sinkronisasi antara objek sehingga konsistensi data dapat terjamin. Keuntungan replikasi tergantung dari jenis replikasi tetapi pada umumnya replikasi mendukung ketersediaan data setiap waktu dan dimanapun diperlu kan. Secara garis besar ada dua yaitu reliability dan performance.


      Reliability maksudnya : Satu sistem, atau bahkan lebih dari satu, dapat terjadi tabrakan tanpa akses ke data yang mengalami interrupt. Memiliki salinan data dan mengijinkan data yang corrupt agar mudah dalah proses pendeteksian dan perbaikan. Performance maksudnya. beberapa salinan data dapat membantu dari sisi skala sehingga mampu menangani sistem yang lebih besar Menangani client.


      Keuntungan replikasi lainnya adalah :
      1. Memungkinkan beberapa lokasi menyimpan data yang sama. Hal ini sangatberguna pada saat lokasi-lokasi tersebut membutuhkan data yang sama atau memerlukan server yang terpisah dalam pembuatan aplikasi laporan.
      2. Aplikasi transaksi online terpisah dari aplikasi pembacaan seperti proses analisis database secara online, data smarts atau data warehouse.
      3. Memungkinkan otonomi yang besar. Pengguna dapat bekerja dengan meng-copy data pada saat tidak terkoneksi kemudian melakukan perubahan untuk dibuat database baru pada saat terkoneksi.
      4. Data dapat ditampilkan seperti layaknya melihat data tersebut dengan menggunakan aplikasi berbasis Web.
      5. Meningkatkan kinerja pembacaan.
      6. Membawa data mendekati lokasi individu atau kelompok pengguna. Hal ini akan membantu mengurangi masalah karena modifikasi data dan pemrosesan query yang dilakukan oleh banyak pengguna karena data dapat didistri busikan melalui jaringan dan data dapat dibagi berdasarkan kebutuhan masing-masing unit atau pengguna.
      7. Penggunaan replikasi sebagai bagian dari strategi standby server.

      Replikasi dapat digunakan apabila sebuah organisasi atau perusahaan didukung oleh hardware dan aplikasi sofware dalam sebuah sistem yang tersebar. Aplikasi yang berbeda mempunyai kebutuhan yang berbeda untuk otonomi dan konsistensi data.
      Replikasi diperlukan dalam sistem tersebar apabila berikut ini:
      • Meng-copy dan mendistribusikan data dari satu atau lebih lokasi.
      • Mendistribusikan hasil copy data berdasarkan jadwal.
      • Mendistribusikan perubahan data ke server lain.
      • Memungkinkan beberapa pengguna di beberapa lokasi untuk melakukan perubahan dan kemudian menggabungkan data yang telah dimodifikasi.
      • Membangun aplikasi data yang menggunakan perlengkapan online maupun offline.
      • Membangun aplikasi Web sehingga pengguna dapat melihat volume data yang besar.

        Beberapa hal yang menjadi pertimbangan dalam perencanaan replikasi :
        1. Kebutuhan data yang akan diubah dan siapa yang mengubah
        2. Pendistribusian data memerlukan konsistensi, otonomi dan kesinambungan
        3. Kelengkapan replikasi yang meliputi kebutuhan user, infrastruktur teknik, jaringan dan keamanan serta karakteristik data.
        4. Jenis replikasi dan pilihannya


          Topologi replikasi dan bagaimana mewujudkannya agar sesuai dengan jenis replikasi, Jenis-jenis replikasi :
          - Snapshot replication
          - Transactional replication
          - Merge replication

          Jenis-jenis replikasi : Konsistensi semantik merupakan kriteria penting dalam evaluasi sistem berkas yang menunjang berkas berbagi.
          Beberapa contoh penting konsistensi semantik sebagai berikut:
            - UNIX Semantics.
            - Session Semantics.
            - Immutable -Shared Files Semantics.

            Dua jenis model konsistensi adalah :

            - Konsistensi berpusat pada data (Data-CentricConcistency Models)
            - konsistensi berpusat pada client

            Protokol pada konsistensi digunakan untuk menguraikan lebih dalam mengenai model konsistensi. Ada tiga protokol yaitu :

            - Primary-Based Protocols
            - Remote - Write Protocols & Local - Write Protocols
            - Replicated - Write Protocols
            - ActiveReplication & Quorum-Based Protocols
            - Cache-coherence Protocols