Seputar Dunia IT dan Fakta Unik Lainnya

Friday 26 February 2016

Makalah Grid Computing - High Performance Computing

Grid Computing



1. GRID COMPUTING

  • Secara sederhana, grid computing dapat diartikan sebagai sistem komputasi terdistribusi yang setingkat lebih tinggi dibandingkan sistem terdistribusi pada umumnya.
  • Grid computing menghadirkan ilusi akan adanya sebuah sistem virtual tunggal yang sangat besar dan powerful, padahal sebetulnya grid terdiri dari komputer-komputer berskala kecil dan heterogen.


2. VISI dan MISI GRID 2

Grid 2

  • Visi : “Virtual Computing” - Layanan informasi untuk mencari computation, storage resources.. 
    Bandingkan dengan Visi Teknologi Web : “Virtual Documents”.
  • Misi : Kolaborasi melalui  through berbagi sumber daya (dan  expertise) untuk meningkatkan level riset.

3. VISI "A GRID"

A Grid


  • Visi Awal Grid : "The Grid"
  • Realita Sekarang : "Many Grid"
  • Tiap grid adalah infrastruktur yang membuat “Virtual Organisations” untuk membagi sumberdaya komputasi
  • VO : Orang yang berada pada organisasi yang berbeda ingin bekerja sama dan membagi sumber dayanya melewati batas organisasi


4. KINERJA GRID

A. Eksploitasi Sumber Daya Tak Terpakai agar bisa digunakan seoptimal mungkin.
B. Pengaturan Kapasitas CPU Paralel.
C. Eksekusi Aplikasi Paralel di bidang scientific.
D. Sumber Daya Virtual dan User Group Virtual untuk Kolaborasi.
E. Reliability
F. Management

A. EKSPLOITASI SUMBERDAYA TAK TERPAKAI

  • Desktop machine umumnya hanya sibuk (busy) selama 5% dari keseluruhan waktu penggunaannya. Sisa waktunya sebanyak 95% dapat digunakan untuk grid.

  • Skenario eksploitasi sumberdaya pada grid: sebuah job/application dapat dijalankan di mesin mana saja yang tidak terpakai di dalam grid tsb.

  • Ada 2 persyaratan utk skenario di atas :
    1. Job/application tsb harus dapat dieksekusi secara remote dan tanpa overhead yang terlalu besar.
    2. Mesin remote harus memenuhi requirement  hardware dan  software yang sesuai untuk job/application tsb.

  • Selain processor, resource harddisk yang tak terpakai juga dapat digunakan untuk membentuk “data grid” yaitu storage data virtual.

B. PENGATURAN KAPASITAS CPU PARALEL

  • Untuk memanfaatkan kapasitas CPU secara paralel, sebuah aplikasi harus dirancang menggunakan algoritma paralel.
  • Design issue yg utama adalah scalability. Semakin kecil overhead komunikasi antar sub program paralel, maka semakin scalable program tersebut.
  • Beberapa kendala dalam merancang algoritma paralel yang scalable antara lain :
    1. Algoritma tsb sulit untuk dibagi secara paralel
    2. Adanya ketergantungan antar subprogram misalnya dalam read/write file serta database.


C. APLIKASI PARALEL

  • Tidak semua aplikasi dapat diparalelkan, dan bila dapat diparalelkan tidak semuanya memiliki scalability yang baik.
  • Sampai saat ini, belum ada tools yang dapat mengubah secara otomatis sebuah program serial menjadi program paralel yang dapat mengeksploitasi kemampuan grid secara optimal → ini adalah topik riset yang cukup banyak dikaji dan membutuhkan keahlian matematis dan programming yang sangat tinggi.

D. SUMBERDAYA VIRTUAL UNTUK KOLABORASI

  • Grid computing memungkinkan kolaborasi yang sangat besar menggunakan sistem heterogenous.
  • Para pengguna (user) grid bisa dikelola secara dinamis menjadi beberapa user group virtual, masing-masing memiliki policy yang berbeda dalam hak akses terhadap resource grid.
  • File sharing pada grid :
    1. File dan database dapat disimpan secara tersebar di banyak mesin.
    2. Teknik striping digunakan untuk meningkatkan data transfer rates.
    3. Data bisa diduplikasi sebagai backup.
  • Sharing tidak hanya pada file, tapi juga meliputi tools, software, services (layanan), license, dsb. Semua resources ini divirtualisasikan agar seluruh resource yang heterogen tersebut dapat saling berinteraksi dengan cara yang sama (memiliki uniform inter-operability).

E. RELIABILITY

  • Superkomputer yang mahal (mainframe) biasanya menggunakan arsitektur hardware yang sangat mahal untuk meningkatkan aspek reliability (keandalan, atau ketahanan thd failure). Beberapa arsitektur yang mahal tsb misalnya :
    1. Sirkuit ganda/redundan, dilengkapi teknik vote untuk hasil yang reliable
    2. Duplicate processors, dilengkapi hot pluggability di mana sistem bisa direcovery atau diganti tanpa perlu mematikan powernya.
    3. Power supply ganda.
    4. Cooling system ganda.
  • Di masa yang akan datang, untuk meningkatkan reliability pada grid, aspek software akan lebih dioptimalkan dibanding aspek hardware, karena software lebih murah dibanding hardware.
  • Pada grid, bila satu mesin di satu lokasi mengalami failure, maka mesin-mesin lainnya tidak akan terpengaruh.
  • Grid management software dapat mensubmit ulang sebuah job ke mesin lain bila mesin sebelumnya mengalami failure.
  • Jobs yang penting dapat diduplikasi sama persis, dan dijalankan di beberapa mesin sekaligus.
  • Sistem grid dapat memiliki keandalan sangat tinggi (high reliability) bila memanfaatkan konsep “autonomic computing”, yaitu teknik untuk mengatasi secara otomatis suatu trouble/error pada grid, tanpa perlu campurtangan dari administrator atau operator.

F. MANAGEMENT

  • Semua sumberdaya pada grid divirtualisasikan, tujuannya supaya penanganan thd sistem yang heterogen tsb dapat dilakukan dengan cara yang sama (uniform).
  • Virtualisasi pada grid penting agar infrastruktur yang sangat besar itu dapat dimanage dengan mudah.
  • Setiap job/project yang dijalankan di grid memiliki priority yang berbeda-beda, dan memerlukan sumberdaya yang berbeda-beda.
  • Adanya virtualisasi memudahkan pembagian akses sumberdaya untuk semua job/project tersebut.
  • Ketika grid mengalami maintenance, sebuah job atau work dapat diroute ulang (reroute) ke mesin-mesin lainya, tanpa sedikitpun mengganggu jalannya eksekusi job/project tersebut secara keseluruhan.

5. KOMPONEN GRID

A. COMPUTATION

  • Computing cycle adalah komponen yang paling utama di dalam sebuah grid.
  • Ada 3 cara untuk memanfaatkan computation pada grid :
    1. Menjalankan aplikasi secara remote pada mesin yang tersedia di grid.
    2. Menjalankan aplikasi yang dapat membagi-bagi pekerjaannya pada beberapa prosesor.
    3. Menjalankan aplikasi yang harus dieksekusi berulang-ulang pada prosesor yang berbeda.
  • Bila N prosesor dapat mengeksekusi sebuah program paralel dalam waktu 1/N, maka ia disebut fully-scalable. Tapi dalam kenyataannya, selalu ada overhead komunikasi.

B. STORAGE


  • Storage meliputi :
    1. Primary Storage (Memory)
    2. Secondary Storage (Harddisk): membentuk data grid
  • Secondary Storage pada grid memerlukan distributed file system misalnya AndrewFS, NFS, DFS, GPFS. Masing-masing menawarkan tingkat performansi, fitur keamanan, dan fitur keandalan (reliability) yang berbeda-beda.
  • Kapasitas storage dapat ditingkatkan dengan cara memanfaatkan storage pada banyak mesin, di mana storage tsb diintegrasikan menjadi satu oleh file system tertentu.
  • Dengan file system tertentu yang mengintegrasikan data grid, maka :
    1. Sebuah file tunggal dapat disebar ke beberapa storage device pada mesin yang berbeda, sehingga dapat melebihi batasan ukuran (file size) normal.
    2. Bisa dibuat name space tunggal yang seragam untuk keseluruhan grid storage, sehingga user yang mengakses file tertentu tidak perlu mengetahui di mesin mana file tsb sesungguhnya berada.
    3. Sebuah data pada grid dapat diduplikasi dan disebar secara otomatis ke mesin-mesin yang ada, untuk meningkatkan redundancy, reliability, dan performance.
  • Ini mungkin adalah titik temu antara teknologi “grid computing” dengan teknologi “big data”. Teknologi big data pada intinya juga menyediakan abstraksi dalam mengelola data berukuran sangat besar.
  • Grid computing bisa disebut juga “big compute”, yang berfokus pada bagaimana menyelesaikan suatu masalah komputasi yang sangat besar dalam waktu yang singkat. Sementara “big data” lebih berfokus kepada pengelolaan data, di mana waktu eksekusi bukanlah fokus utama.
  • Teknik data striping juga diterapkan untuk meningkatkan data transfer rate, khususnya pada akses data yang sifatnya sekuensial dan dapat diprediksi.

C. COMMUNICATION

  • Komunikasi internal di dalam grid penting untuk mengirim jobs dan data yang dibutuhkan antar mesin. Bandwidth yang tersedia menjadi resource yang menentukan tingkat utilisasi grid.
  • Komunikasi eksternal misalnya dari grid ke Internet.

BERIKUT SITUS YANG MENYEDIAKAN GRID :

  1. Boinc: http://boinc.barkeley.edu
  2. Globus :http://globus.org


Download File Disini



No comments:

Post a Comment

BILA ANDA MEMASUKKAN LINK HIDUP, MAKA AKAN OTOMATIS TERDELETE..

Blog Archive