Clustering dan Grid Computing

Clustering dan Grid Computing

Clustering dan Grid Computing


Tujuan dari komputasi terdistribusi adalah menyatukan kemampuan dari sumber daya (sumber komputasi atau sumber informasi) yang terpisah secara fisik, ke dalam suatu sistem gabungan yang terkoordinasi dengan kapasitas yang jauh melebihi dari kapasitas individual komponen-komponennya. Adapun komputasi terdistribusi dalam bab ini akan membahan komputasi terkluster dan komputasi Grid.


Sistem Terdistribusi dan Terkluster
Seiring dengan perkembangan teknologi komputer dan server, muncullah trend DDP (distributed data processing), yaitu prosesor, data, dan aspek-aspek lainnya bisa tersebar dalam lingkup tertentu. Sistem seperti ini melibatkan adanya pembagian proses komputasi, pengendali, dan interaksi dalam jaringan. Dalam perusahaan-perushaan besar misalnya, sering digunakan kombinasi antara komputer dan server.

Komputer untuk menjalankan aplikasi-aplikasi seperti pengolah grafis, word processing, spReadsheet, sementara server sebagai back – end mengendalikan database dan sistem informasi perusahaan. Hal seperti ini adalah dampak dari perkembangan sistem terdistribusi. Tetapi, apakah sistem terdistribusi itu? Sistem terdistribusi adalah koleksi prosesor yang terhubung dalam jaringan serta tidak berbagi memori, yaitu memiliki memori masing-masing. Prosesor-prosesor itu bisa berkomunikasi melalui banyak cara, misalnya melalui jalur telepon atau high speed bus.  



Keuntungan
  • Resource sharing. Suatu komputer bisa mengakses sumber daya yang ada di komputer lain. Misalkan, komputer A bisa mengakses database yang ada di komputer B. Sebaliknya, komputer B bisa mencetak dokumen dengan menggunakan printer yang terpasang di komputer A.
  • Computation speedup. Jika suatu proses komputasi bisa dipecah -pecah menjadi sejumlah bagian yang berjalan secara konkuren, dalam sistem terdistribusi bagian-bagian komputasi ini bisa terbagi dalam komputer-komputer yang ada. Inilah yang menimbulkan adanya speedup. Lebih jauh lagi, bisa terjadi load sharing, yaitu jika suatu komputer mengerjakan tugas terlalu banyak, sebagian dari tugasnya itu bisa dialihkan ke komputer lain.
  • Reliability. Jika satu komputer mengalami kegagalan, maka secara keseluruhan sistem masih tetap dapat berjalan. Contoh: jika sistem terdiri atas komputer-komputer yang tersusun secara independen, kegagalan salah satu komputer seharusnya tidak mempengaruhi keseluruhan sistem. Tapi jika sistem terdiri atas komputer-komputer yang mengatur tugas spesifik seperti terminal I/O atau file System, maka kerusakan satu komputer saja bisa menyebabkan keseluruhan sistem mati.
  • Tentunya, perlu mekanisme untuk mendeteksi kegagalan seperti ini, sehingga jika ada komputer yang rusak, sumber daya yang ada padanya tidak digunakan dan sebagai gantinya komputer yang lain bisa menangani itu.
  • Communication. Karena satu komputer terhubung dengan Komputer-komputer laiinya, sangat dimungkinkan terjadi pertukaran informasi. Dengan adanya message passing, fungsi fungsi yang ada di suatu komputer misal file transfer, login, web browsing, bisa diperluas dalam sistem terdistribusi. Ini menyebabkan fungsi-fungsi ini bisa diakses secara jarak jauh. Misalnya, sejumlah orang yang terlibat dalam satu proyek, walaupun terpisah secara geografis, tetap bisa berkolaborasi dalam proyek itu. Dalam dunia industri, terjadi downsizing. Downsizing adalah mengganti mainframe dengan komputer atau workstation yang terhubung via jaringan. Dengan itu, mereka bisa mendapatkan fungsionalitas yang sesuai dengan biaya, kemudahan mengatur sumber daya, kemudahan maintenance /perawatan, dan lain -lain.



Clustering dan Grid Computing
Gambar 1. Sistem Terdistribusi dan Terkluster


Kelemahan :
  • Jika tidak direncanakan dengan tepat, sistem terdistribusi bisa menurunkan proses komputasi, misalnya jika kegagalan salah satu komputer mempengaruhi komputer-komputer yang lain.
  • Troubleshooting menjadi lebih rumit, karena bisa memerlukan koneksi ke komputer lain yang terhubung secara remote, atau menganalisis komunikasi antar komputer.
  • Tidak semua proses komputasi cocok untuk dilakukan dalam sistem terdistribusi, karena besarnya keperluan komunikasi dan sinkronisasi antar komputer. Jika bandwith, latency, atau kebutuhan komunikasi terlalu besar, maka performanya bisa menjadi lebih jelek daripada sistem yang tidak terdistribusi sama sekali. Karena itu, lebih baik komputasi dilakukan di sistem yang tidak terdistribusi.



Komputasi Grid

  • Computational Grid merupakan suatu infrastruktur hardware dan software yang menyediakan akses bersifat dependable, konsisten, pervasive, dan tidak mahal terhadap kemampuan komputasional high-end. (Carl Kesselman,Ian Foster in “The Grid : Blueprint for a New Computing Infrastructure” 1998)
  • Grid Computing adalah resource sharing dan penyelesaian masalah terkoordinasi dalam organisasi virtual yang dinamis dan multi-institusional. (Carl Kesselman, Ian Foster in “ the anatomy of the Grid” 2000)
  • Ian Foster pada tahun 2002 menyampaikan pengertian dari Grid.  Grid adalah suatu sistem yang:
  1. mengkoordinasi sumber daya (resources) yang tidak tunduk kepada kendali terpusat (Jika tidak,        kita sedang berurusan dengan sistem manajemen lokal)
  2. mengunakan protokol dan antarmuka (interface) yang bersifat standard, open, dan general-              purpose (Sebaliknya, kita berurusan dengan suatu sistem khusus aplikasi)
  3. untuk menghasilkan kualitas layanan (QoS) yang tidak trivial (tidak sepele). (Ini akan memenuhi          tuntutan pengguna yang kompleks, sehingga utilitas dari sistem terkombinasi secara signifikan             lebih besar daripada utilitas total dari bagian-bagiannya)
Pemilihan nama Grid sendiri adalah sebagai bentuk kiasan bagi pembuatan computer power agar dapat diakses semudah mengakses electric power, sehingga harus memiliki kemampuan untuk mengakses computing power (CPUs), aplikasi perangkat lunak dan data penelitian dalam suatu bentuk “on-demand”.

Konsep dasar dalam Grid Computing:
  • Sumber daya dikelola dan dikendalikan secara lokal.
  • Sumber daya berbeda dapat mempunyai kebijakan dan mekanisme berbeda, mencakup Sumber daya komputasi dikelola oleh sistem batch berbeda, Sistem storage berbeda pada node berbeda, Kebijakan berbeda dipercayakan kepada user yang sama pada sumber daya berbeda pada Grid.
  • Sifat alami dinamis: Sumber daya dan pengguna dapat sering berubah
  • Lingkungan kolaboratif bagi e-community (komunitas elektronik, diinternet)


Elemen-elemen dari infrastruktur Grid
  • Hardware/Sumber daya (Dibuat tersedia dari site-site berbeda yang terdistribusi secara geografis, mencakup CPU / Storage / Instruments, dll)
  • Software: Sesuatu yang menghubungkan bersama-sama semua sumber daya ini: middleware. Beberapa aplikasi untuk menggunakan sumber daya komputasi yang dibuat tersedia
  • Orang-orang: Siapa yang memelihara Grid, dan Siapa yang menggunakan Grid
  • Middleware adalah lapisan atau Layer perangkat lunak (software) yang terletak antara sistem operasi dan aplikasi.  Elemen-elemen dasar dari Middleware ini adalah
  1.  Keamanan (Security)
  2.  Pengelolaan sumber daya (resource management)
  3.  Pengelolaan data (data management)
  4. Layanan informasi (information services)
  • Solusi bagi Middleware yang telah tersedia, di antaranya adalah 
  1. Globus Toolkit (Argonne+ISI)
  2. LCG/Glite (dari proyek Uni Eropa)
  3. Grid bus (Melbourne, Australia)
  4. Unicore (Jerman)
  5. Dan masih banyak lainnya

Secara generik, keuntungan dasar dari penerapan komputasi Grid adalah:
  1. Perkalian dari sumber daya: Resource pool dari CPU dan storage tersedia ketika idle
  2. Lebih cepat dan lebih besar: Komputasi simulasi dan penyelesaian masalah apat berjalan lebih             cepat dan mencakup domain yang lebih luas
  3. Software dan aplikasi: Pool dari aplikasi dan pustaka standard, Akses terhadap model dan                  perangkat berbeda, Metodologi penelitian yang lebih baik
  4. Data : Akses terhadap sumber data global, dan Hasil penelitian lebih baik

    Ukuran dan/atau kompleksitas dari masalah mengharuskan orang-orang dalam beberapa organisasi berkolaborasi dan berbagi (share) sumber daya komputasi, data dan instrumen sehingga terwujud bentuk organisasi baru, VIRTUAL ORGANIZATION.  Organisasi virtual, sebagai hasil kolaborasi, memberikan beberapa keuntungan lebih lanjut, di antarnya:

    - Sumber daya dan orang-orang yang tersebar
    - Dihubungkan oleh jaringan, melintasi domain-domain admin
    - Berbagi sumber daya, tujuan bersama
    - Dinamis
    - Fault-tolerance
    - Tidak ada batas-batas geografis: Tidak ada masalah VISA karena tidak diperlukan perjalanan orang

    Sampai saat ini dan diperkirakan berlaku dalam beberapa tahun kedepan, ada kecenderungan besar komputasi Grid digunakan untuk :
    1. Jaringan penelitian publik  bagi para peneliti dan ilmuwan, EGEE, GEANT, dll
    2. Keterlibatan lebih banyak dari institusi keuangan (Bank, dll). Aplikasi keuangan yang lebih baru          saat ini ditulis untuk GRID aware atau dapat digunakan pada Grid
    3. Tidak lagi hanya komputasional tetapi sekarang juga layanan (service)
    4. Service Oriented Architecture (SOA). Enkapsulasi dari sekumpulan aplikasi atau layanan                   sebagai suatu antarmuka tunggal yang dapat dionfigurasi ulang berdasarkan pada kebutuhan             end-user. Standard bagi manajemen data.
    5. Komputasi Awan (cloud computing). Kemampuan untuk men-deploy atau men-deliver                     layanan/sumber daya seperti dibutuhkan.

    Pada waktu yang akan datang, para peneliti memperkirakan komputasi Grid semakin dibutuhkan seiring dengan kemajuan teknologi jaringan komputer dan telekomunikasi serta tuntutan dari  pengguna, yaitu:

    - Ke arah aplikasi tersebar yang berinterakses satu sama lain dan menawarkan integrasi dinamis                        satu dengan lainnya.
    - Segala suatu dari sistem operasi ke delivery on demand aplikasi software atau service, dimana                       dan kapan end-user memerlukannya. Tidak perlu instal, update.
    - Jaringan adalah komputer Desktop anda adalah sebagaimana anda inginkan, dimana dan kapan                     anda menginginkannya.


    Dari gambaran sekilas di atas, serta melihat kondisi di negara kita, komputasi Grid dapat digunakan untuk tersedianya akses internet atau berbagi pakai sumber daya komputasi dalam negeri secara efektif dan efisien. Berikut beberapa alasanya:

    - Setiap orang melalui jaringan Grid dapat berpartisipasi sebagai pattner aktif dalam proses                              pengembangan dan memajukan penelitian dan/atau teknologi.
    - Penggunaan teknologi Grid menawarkan kesempatan besar bagi peneliti dan ilmuwan, memilih                        fitur-fitur khusus dari komputasi Grid yang paling memenuhi kebutuhannya, dan juga                                      menentukan bagaimana diimplementasikan.
    - Bagi banyak negara ketiga, sering terjadi lack dari jaringan, karena itu situs-situs perlu untuk                         diinterkoneksikan.
    - Bandwitdh dapat menjadi faktor yang membatasi. Grid merupakan network demanding                                  infrastructure . Namun ada aplikasi-aplikasi yang tidak memerlukan bandwidth besar, situs                            peripheral (hanya node pengguna) dapat berjalan baik dengan bandwidth terbatas (~1 Mb),                          Grid kampus atau metropolian yang terisolasi dapat menjadi pilihan.



    Kata Kunci : Clustering dan Grid Computing, sistem terdistribusi, materi teknik informatika, skripsi teknik informatika, skripsi