Rumah stomatitis Ketersediaan sistem. Manajemen ketersediaan layanan TI

Ketersediaan sistem. Manajemen ketersediaan layanan TI

Layanan “Infrastruktur TI sebagai layanan”, IaaS, menjadi semakin populer di kalangan klien korporat, dan layanan tersebut sudah digunakandan untuk aplikasi yang sangat penting. Saatnya untuk mencari tahuapa yang dijamin oleh penyedia layanan ini dan tanggung jawab apa yang mereka tanggung jika infrastruktur TI virtual memperlambat pekerjaan atau menjadi tidak tersedia sama sekali.

Kami menyurvei penyedia layanan infrastruktur IaaS tingkat perusahaan terkemuka untuk menganalisis penawaran mereka. Dalam hal ini, “tingkat perusahaan” berarti sebagai berikut: platform cloud diterapkan di pusat data yang memenuhi persyaratan Tingkat III (sertifikat dari Uptime Institute tidakwajib), dan memberikan tingkat toleransi kesalahan yang tinggi karena mekanisme Ketersediaan Tinggi (HA) dan relokasi mesin virtual jika terjadi bencana.

KETERSEDIAAN DAN WAKTU RESPON

Parameter utama layanan IaaS, yang biasanya ditentukan dalam perjanjian SLA, adalah tingkat ketersediaannya, waktu respons terhadap berbagai insiden dan durasi penyelesaiannya, serta skema dan parameter kompensasi jika terjadi downtime.

Jika Anda memutuskan untuk menggunakan infrastruktur TI virtual, Anda dapat dengan aman mengandalkan ketersediaan 99,5% atau lebih tinggi. Setidaknya, tidak ada penyedia layanan yang kami survei yang menyebutkan angka lebih rendah. Selain itu, perwakilan dari banyak perusahaan menekankan bahwa nilai yang ditunjukkan dalam tanggapan mereka (lihat Tabel 1) bersifat umum dan, atas permintaan pelanggan, tingkat ketersediaan dapat ditingkatkan dengan menggunakan berbagai cara teknis.

Biasanya, platform IaaS tingkat perusahaan dihosting di pusat data (in-house atau eksternal) yang memenuhi tingkat ketahanan Tier III, yang diketahui menyediakan ketersediaan 99,98%. Nilai ketersediaan infrastruktur virtual IaaS yang ditunjukkan oleh penyedia tidak melebihi karakteristik situs fisik, dan hal ini wajar saja.

Pengecualian adalah ketersediaan 99,99% yang disediakan oleh Dataline dalam mode metrocluster. Versi ini tahan bencana cloud mencakup dua pusat data perusahaan - untuk informasi lebih lanjut tentang metrocluster, lihat materi “Cloud tahan bencana dengan harga “tidak selangit””, yang diterbitkan dalam Journal of Network Solutions/LAN edisi Oktober 2013 () .

Pada prinsipnya, pemasok dapat menunjukkan dalam SLA ketersediaan tinggi yang diinginkan, bahkan 100%, tetapi kemudian ia berisiko kehilangan lebih dari yang diperolehnya, karena pembeli yang masuk akal akan memerlukan skema kompensasi yang ketat untuk dimasukkan dalam kontrak jika tidak terpenuhi. syarat-syarat yang disepakati. Meskipun belum ada skema standar yang dikembangkan, setiap pemasok menawarkan sesuatu yang berbeda, sehingga pembeli harus mengevaluasi kompensasi yang diusulkan dengan mempertimbangkan kemungkinan kerugian finansial jika terjadi downtime layanan TI.

Banyak perusahaan menawarkan pengembalian persentase tertentu dari pembayaran bulanan untuk setiap jam tambahan (di atas SLA) tidak tersedianya layanan. Misalnya, dengan tingkat ketersediaan 99,95% yang ditentukan dalam SLA (waktu henti tidak lebih dari 1 jam per bulan), untuk setiap tambahan jam pemutusan layanan, Inoventica siap mengganti 2% dari pembayaran bulanan. Cloud4Y dalam versi standar mengkompensasi 1% untuk 1 jam waktu henti (perhitungan menggunakan total biaya layanan untuk satu bulan kalender penuh sebelum bulan ini), tetapi tidak lebih dari 50% dari biaya layanan.

Sejumlah penyedia layanan memberikan perhitungan rinci tentang bagaimana kompensasi bervariasi berdasarkan tingkat ketersediaan (lihat Tabel 2). Jika terjadi penurunan yang signifikan pada tingkat ini, kompensasi yang sangat signifikan akan ditawarkan. Misalnya, jika nilainya kurang dari 95%, Onlanta (Lanit Group of Companies) mengizinkan pengurangan tingkat pembayaran layanan hingga 40%. Dan perusahaan IT-Grad, jika tingkat ketersediaannya turun di bawah 96,71%, menjanjikan kompensasi sebesar 50%. Jelas bahwa penyedia layanan menganggap penurunan kualitas layanan seperti ini tidak mungkin terjadi.

“Kami telah memperkenalkan dua prinsip kompensasi independen: untuk pelanggaran indikator target untuk parameter layanan dan indikator target untuk memproses permintaan,” kata Vitaly Mzokov, kepala arahan Layanan Cloud dan Solusi Infrastruktur dari perusahaan Servionics (I-Teco Group). - Pelanggaran terhadap indikator target parameter layanan diberi kompensasi dalam skala progresif. Bergantung pada tingkat ketersediaan aktual, indikator kompensasi dihitung, dinyatakan sebagai persentase dari jumlah faktur untuk penggunaan layanan. Kompensasi atas pelanggaran indikator target untuk memproses permintaan dihitung berdasarkan durasi menunggu klien, akurat hingga menitnya.”

Menurut praktik yang diterapkan di Servionica, jenis permintaan pelanggan, serta target umum untuk waktu respons maksimum terhadap permintaan dan waktu maksimum untuk menyelesaikan masalah dijelaskan dalam peraturan interaksi layanan. Dan dalam perjanjian SLA itu sendiri, indikator-indikator ini ditentukan untuk layanan tertentu.

“Sesuai kesepakatan, pelanggan bisa mendapatkan beberapa layanan dari kami. Oleh karena itu peraturan tersebut menguraikan indikator umum dengan catatan: “Indikator target yang ditentukan dalam SLA untuk layanan tertentu tumpang tindih dengan indikator yang ditentukan dalam peraturan.” Hal ini dilakukan agar, jika perlu, dimungkinkan untuk memperjelas (memperluas atau mengurangi) waktu reaksi dan waktu larutan, jelas Vitaly Mzokov. - Kami wajib menanggapi permintaan apa pun dalam waktu 15 menit. Waktu penyelesaian maksimum, tergantung pada jenis dan prioritas permintaan, berkisar dari 1 jam (untuk insiden dengan prioritas No. 1) hingga 48 jam (untuk permintaan yang memerlukan pemrosesan penuh atas permintaan informasi pelanggan - misalnya, memberikan informasi tentang tarif dan layanan lainnya, berbagai klarifikasi dan instruksi).

Waktu respons terhadap suatu aplikasi biasanya bergantung pada prioritasnya. Berikut ini, misalnya, tingkat prioritas yang digunakan oleh Linxdatacenter:

  • Kritis - layanan sama sekali tidak tersedia, tindakan pemulihan segera harus diambil, waktu respons 15 menit, waktu pemulihan tidak lebih dari 4 jam;
  • Tinggi - layanan sebagian tidak tersedia, waktu respons hingga 1 jam, peningkatan prioritas;
  • Normal - klarifikasi parameter layanan, pertanyaan tidak mendesak saat ini, waktu respons hingga 1 jam, 24 jam diberikan untuk mempersiapkan respons.

Tabel 3 menunjukkan contoh lain - kategorisasi kueri yang digunakan oleh Cloud4Y; waktu reaksi - tidak lebih dari 30 menit.

Mereka mencoba bekerja segera di T-Systems. Menurut Vsevolod Egupov, direktur penjualan departemen ICT T-Systems RUS, spesialis perusahaan ini “dalam 80% kasus merespons dalam 30 detik” (!). Namun, seperti sebagian besar responden kami, ia mencatat bahwa waktu reaksi bergantung pada seberapa kritisnya situasi.

ALAT PEMANTAUAN

Tidaklah cukup untuk menentukan dalam perjanjian SLA tingkat ketersediaan yang menarik dan skema kompensasi yang ketat; penting juga untuk menyediakan alat kontrol yang nyaman dan efektif kepada klien; Dan di sini pendekatan pemasok berbeda secara signifikan.

Mengacu pada praktik perusahaan Servionika, Vitaly Mzokov mencatat bahwa klien lebih tertarik untuk menerima pelaporan yang transparan dan akurat dari operator daripada menguasai alat khusus untuk pemantauan independen. Sebagai aturan, Servionica memberikan laporan bulanan mengenai serangkaian parameter yang disepakati, namun, atas permintaan klien, kontrak dapat menyediakan pelaporan yang lebih sering.

Banyak perusahaan, secara default, memberikan laporan status kesehatan layanan sebulan sekali, namun dapat melakukannya lebih sering jika diminta oleh klien. Contoh laporan yang ditawarkan oleh Onlanta ditunjukkan pada Gambar 1. Menurut Mikhail Lyapin, kepala divisi cloud-nya, Onlanta adalah satu-satunya perusahaan di Rusia yang memberikan laporan kepada pelanggan tentang ketersediaan sumber daya cloud dengan tingkat detail seperti itu. . Menurutnya, sebagian besar penyedia layanan puas dengan statistik tingkat ketersediaan mesin virtual.

Sejumlah perusahaan menawarkan pelanggan konsol layanan mandiri online. Menurut Ruslan Zaedinov, Wakil Direktur Jenderal, Kepala Pusat Data dan Komputasi Cloud di Croc, setiap konsumen layanan IaaS memiliki akses ke konsol tersebut dengan kemampuan bawaan untuk memantau fungsi komponen tertentu secara online. Misalnya, dalam kasus mesin virtual, spesialis TI pelanggan dapat memantau berapa banyak prosesor yang dimuat, cara kerja I/O, berapa banyak memori yang digunakan, dll. Data ini tersedia secara real-time, dan juga, berdasarkan permintaan, dalam bentuk statistik untuk periode apa pun.

APAKAH ANDA PERLU MENJAMIN KINERJA?

Tentu saja, seiring dengan meningkatnya beban pada platform IaaS penyedia, tingkat kinerja mesin virtual dapat menurun. Penyedia layanan melakukan yang terbaik untuk mencegah perkembangan tersebut. Semua perusahaan menyetujui hal ini. Namun, beberapa menyertakan parameter kinerja dalam SLA, sementara yang lain menganggap ukuran seperti itu tidak diperlukan.

Inilah yang dikatakan Vitaly Slizen, anggota dewan direksi Inoventica mengenai hal ini: “Kami tidak melihat adanya penurunan [produktifitas] bahkan dengan peningkatan beban, karena kami segera memperluas dan memodernisasi kapasitas pusat data. Parameter ini (kinerja VM dan sistem penyimpanan) tidak tercermin secara terpisah dalam SLA, karena kepatuhannya adalah tanggung jawab utama kami, terlepas dari permintaan pelanggan.” Spesialis Inoventica terus memantau semua parameter utama fasilitas infrastruktur yang disewa, yang memungkinkan mereka dengan cepat menerima informasi tentang potensi masalah dan memprediksinya secara tepat waktu.

Igor Drozdov, manajer dukungan penjualan teknis di Linxdatacenter, juga berbicara tentang tidak adanya degradasi: “Perusahaan kami menyediakan sumber daya komputasi yang terjamin untuk digunakan. Mereka dicadangkan di cloud dan berkembang seiring bertambahnya jumlah klien, sehingga kinerja mesin virtual dan sistem penyimpanan tetap berada pada tingkat tinggi secara konsisten. Selain itu, kami melakukan peningkatan server secara tepat waktu dan melakukan pemantauan kinerja menggunakan produk VMware khusus.”

Orange Business Services juga merupakan salah satu penyedia layanan yang tidak mengatur parameter kinerja dalam standar SLA. Pada saat yang sama, seperti yang dicatat oleh Dmitry Dorodnykh, kepala departemen pengembangan untuk komunikasi terpadu dan produk TI di Orange Business Services di Rusia dan CIS, “jika klien memerlukan jaminan sumber daya komputasi tertentu untuk dialokasikan untuk mesin virtualnya , kami menggunakan alat standar platform virtualisasi modern, yang ketika terjadi persaingan sumber daya, mesin virtual dapat dipindahkan ke server lain.”

Vsevolod Egupov percaya bahwa memasukkan karakteristik kinerja ke dalam SLA “tidak masuk akal, karena degradasi mempengaruhi tingkat ketersediaan layanan yang diatur dalam perjanjian.” Di T-Systems, kinerja mesin virtual dan sistem penyimpanan dikendalikan oleh departemen manajemen kapasitas, dan spesialisnya bertanggung jawab untuk mencegah degradasinya.

Ada juga banyak perusahaan yang percaya bahwa menambahkan karakteristik kinerja ke SLA adalah hal yang disarankan. Kemacetan Dalam lingkungan TI tervirtualisasi, banyak ahli yang mempertimbangkan kinerja sistem penyimpanan, sehingga sebagian besar vendor sangat memperhatikan karakteristik penyimpanan seperti jumlah operasi input/output per detik (IOPS).dan waktu akses disk (latensi).

Dataline menyediakan metrik kinerja penyimpanan dan mesin virtual untuk setiap SLA (lihat Tabel 4). Pada saat yang sama, seperti yang dicatat oleh Dmitry Tishin, kepala departemen pengembangan layanan di perusahaan ini, “bergantung pada persyaratan yang diajukan klien pada lanskap sistem, metriknya dapat diubah.” Nilai IOPS diukur oleh sistem pemantauan NetApp DFM, dan waktu akses disk diukur dengan perangkat lunak virtualisasi standar (vCenter). Jika masalah muncul dengan mesin virtual, teknisi tim virtualisasi dan shift yang bertugas menerima peringatan yang sesuai. Selain itu, Dataline menyediakan pemantauan berbagai parameter di level tersebut sistem operasi dan layanan yang berjalan di dalamnya. Jika klien menggunakan layanan perusahaan untuk mengelola OS dan layanan, pemantauan tersebut dilakukan secara default.

Untuk mencegah penurunan kinerja mesin virtual, spesialis Dataline menggunakan serangkaian tindakan. Dengan demikian, cluster menggunakan mekanisme Distributed Resource Scheduler (DRS), yang memantau beban server fisik sesuai dengan parameter dasar - jika beban tertentu di server tercapai, beberapa mesin virtual secara otomatis dipindahkan ke yang lain. Cluster mempertahankan redundansi server sehingga beban pada keseluruhan cluster tidak lebih dari 70%. Sebagai bagian dari kontrak layanan yang disepakati dengan pemasok peralatan, kapasitas sumber daya cluster dapat ditingkatkan sesuai jadwal.

Safedata juga mengatur karakteristik kinerja seperti IOPS dan MIPS di SLA. “Kami tidak dapat mengurangi produktivitas di bawah nilai yang ditentukan dalam SLA,” kata Anton Antonov, kepala departemen penjualan Safedata. “Jika terjadi penurunan layanan ketika beban pada server fisik meningkat, host EXSi cadangan tambahan akan dioperasikan.”

Karakteristik kinerja sistem disk penyimpanan yang diatur dalam SLA Cloud4Y ditunjukkan pada Tabel 5. Menurut Evgeniy Bessonov, kepala departemen pemasaran Cloud4Y, jika terjadi pelanggaran terhadap indikator kinerja yang dijamin dari CPU, HDD, RAM, kompensasi diberikan, yang dinegosiasikan secara terpisah atau dibayarkan sesuai dengan ketentuan standar: 1% dari biaya bulanan selama 1 jam.

“Kami menjamin performa mesin virtual pada batas bawah, tanpa membatasi pada batas atas,” kata Ruslan Zaedinov. “Jadi, jika server tempat mesin virtual berada memiliki sumber daya komputasi gratis yang melebihi sumber daya yang dijamin, sumber daya tersebut akan tersedia untuk pelanggan.” Sedangkan untuk sistem penyimpanan, saat ini semua klien Croc menggunakan saluran komunikasi yang sama dengan sistem penyimpanan. Untuk waktu yang lama hal ini tidak menimbulkan masalah, tetapi sekarang, untuk memenuhi kebutuhan pelanggan yang terus meningkat, perusahaan mentransfer sistem penyimpanan cloud dari drive Fibre Channel dan SATA ke flash drive dengan akses langsung dari mesin virtual melalui Infiniband jaringan. Pada saat yang sama, perangkat lunak sedang diimplementasikan untuk memastikan jaminan throughput sistem penyimpanan data di cloud. Perubahan terkait pada SLA akan dilakukan pada musim gugur ini.

Dengan persetujuan pelanggan, Servionica mencatat dalam SLA setiap proyek indikator kinerja masing-masing komponen platform cloud. Selain itu, perjanjian tersebut menetapkan metode untuk mengukur indikator-indikator ini dan frekuensi pengukuran. “Setiap operator dapat menulis “100.500 OP per 1 GB ruang disk dijamin”, tetapi tidak semua orang dapat membuktikan bahwa kriteria ini terpenuhi. Kami menginginkan hubungan yang paling transparan antara operator platform cloud dan konsumennya,” tegas Vitaly Mzokov. Performa mesin virtual dan sistem penyimpanan ditentukan dalam SLA Servionics berdasarkan indikator IOPS dan Latensi.

Seperti yang dikatakan Maxim Zakharenko, direktur umum penyedia layanan Oblakotek, dalam kontrak yang mereka buat, indikator kinerja puncak diatur sedemikian rupa sehingga beban pada I/O dan bandwidth jaringan tidak melebihi 80%. Pemantauan dilakukan dengan menggunakan sistem Microsoft SCOM. Dia mencatat bahwa indikator yang berbeda penting untuk sistem yang berbeda: untuk situs Web - waktu respons, untuk hosting infrastruktur TI - indikator beban puncak pada prosesor, memori, jaringan virtual, dll. Perusahaan ini juga menyertakan parameter cadangan terjamin dalam SLA-nya, metode dan ketentuan untuk menyediakan dan menyimpan data pengguna (“Perpisahan Jujur”).

SLA ujung ke ujung

Tidak peduli seberapa tinggi keandalan platform IaaS itu sendiri, yang terletak di pusat data yang toleran terhadap kesalahan, saluran akses ke platform ini dapat menjadi hambatan bagi pelanggan. Kabar baiknya adalah banyak penyedia yang kami survei memiliki SLA end-to-end yang mencakup layanan IaaS itu sendiri dan saluran aksesnya. Pada saat yang sama, menurut mereka, dengan pengaturan dan pencadangan saluran yang tepat, tingkat ketersediaan komunikasi tidak lebih rendah dari platform SLA, dan oleh karena itu dalam SLA ujung ke ujung ini karakteristik penting tidak berkurang.

Namun, seperti yang dicatat oleh Vsevolod Egupov, pengurangan atau pemeliharaan tingkat ketersediaan bergantung pada cara saluran komunikasi diatur - jika saluran tersebut dicadangkan, ketersediaannya tidak menurun. Jika tidak, tingkat ketersediaan di SLA ujung ke ujung dikurangi menjadi tingkat ketersediaan tautan. T-Systems RUS memiliki jaringan pusat datanya sendiri yang berlokasi di seluruh dunia. Klien Rusia dilayani terutama dari pusat data yang berlokasi di Jerman dan Austria. Perusahaan telah menandatangani SLA dengan Rostelecom, Beeline, dan juga bekerja sama dengan operator telekomunikasi lainnya.

Penyedia layanan IaaS yang juga merupakan operator telekomunikasi memanfaatkan hal ini. Oleh karena itu, sebagai operator telekomunikasi internasional, Orange Business Services menerapkan SLA end-to-end yang mencakup IaaS dan layanan komunikasi. Tingkat ketersediaan pada SLA tersebut adalah 99,95%. Namun, seperti yang dijelaskan Dmitry Dorodnykh, karakteristik ini bergantung pada lokasi geografis klien - misalnya, di wilayah Tengah tingkat ini lebih tinggi daripada di luar Ural dan Siberia. Mil terakhir mungkin memiliki parameter SLA sendiri. Skema dan mekanisme pemantauan SLA pada saluran komunikasi telah dikembangkan selama beberapa dekade, sehingga masalah pemantauan tidak menjadi masalah bagi Orange Business Services.

Seperti yang dicatat oleh Vitaly Slizen, Inoventica memiliki saluran komunikasi tulang punggung sendiri dan jaringan pusat data yang tersebar secara geografis, yang memungkinkan penerapan geokluster. Hal ini memungkinkan Anda untuk menyimpan data dan fungsionalitas layanan bahkan jika terjadi kerusakan fisik pada salah satu pusat data. Menurutnya, Inoventica adalah “satu-satunya perusahaan di pasar Rusia yang menyediakan rangkaian layanan lengkap “data center - channel - service - client (AWC)” sesuai dengan SLA, yaitu minimal untukpenundaan transmisi paket (penundaan pulang pergi) kurang dari 10 ms dan kehilangan paket hampir nol." Saat ini, solusi komprehensif Inoventica tersedia untuk klien di lima distrik federal Federasi Rusia.

Penyedia layanan IaaS yang bukan operator telekomunikasi secara aktif berkolaborasi dengan mereka. Oleh karena itu, Servionika telah menciptakan SLA untuk bekerja sama dengan operator telekomunikasi yang melayani pusat datanya (lebih dari 10 penyedia telekomunikasi besar). Perusahaan menyiarkan ketentuan SLA ini dalam kontrak dengan klien yang menggunakan layanan komunikasi. Dan kontrol atas kepatuhan terhadap SLA disediakan oleh layanan teknis pusat data TrustInfo. “Kami menetapkan dalam kontrak kami parameter SLA yang sama dengan operator, yaitu, kami bertanggung jawab atas kualitas pekerjaan mereka dan penyediaan saluran komunikasi yang tidak terputus,” kata Vitaly Mzokov.

Untuk menyediakan saluran komunikasi kepada klien, Dataline berlatih menggunakan jasa operator telekomunikasi dengan skema subkontrak. Dengan skema ini, perusahaan mengontrol kualitas berdasarkan kontraknya dengan operator, sementara klien menerima layanan komprehensif darinya dan hanya berurusan dengan satu pihak lawan. Tingkat ketersediaan layanan komprehensif tersebut tidak menurun. Dataline memiliki jaringan transmisi datanya sendiri di Moskow, yang menjamin karakteristik berikut: pangsa paket yang hilang tidak lebih dari 0,2%, penundaan jaringan rata-rata tidak lebih dari 5 ms.

Menurut Ruslan Zaedinov, Croc menggunakan saluran lebar yang bandwidthnya cukup untuk semua pelanggan di cloud. Jaminan yang valid secara teknis diberikan melalui redundansi silang saluran antara pusat data Croc yang berbeda menggunakan cincin optiknya sendiri. Bagi organisasi yang membutuhkan bandwidth tetap pada saluran komunikasi, perusahaan menerapkan koneksi individual ke cloud melalui saluran terpisah dengan bandwidth terjamin atau bahkan melalui optik “gelap”. Koneksi ini paling sering dilengkapi dengan cara individu enkripsi, termasuk yang bersertifikat.

Jadi, layanan IaaS ditawarkan di Rusia oleh sejumlah besar perusahaan, dan menurut aturan yang cukup dapat dimengerti dan didokumentasikan (dalam SLA). Industri belum mencapai konsensus mengenai apakah karakteristik kinerja infrastruktur TI virtual harus diatur dalam SLA, namun indikator ketersediaan yang terjamin tampaknya cukup dapat diterima bahkan untuk pelanggan korporat yang paling menuntut sekalipun. Selain itu, penyedia memahami kebutuhan pelanggan akan SLA end-to-end dan berupaya memperbaikinya.

Alexander Barskov- Editor terkemuka Jurnal Solusi Jaringan/LAN. Beliau dapat dihubungi di:

Ketersediaan tinggi adalah sesuatu yang ingin ditunjukkan oleh banyak orang. Semua orang sudah terbiasa dengan taktik pemasaran dan ketersediaan 99% tampaknya sangat tinggi. Hanya sebagian kecil klien yang memahami bahwa ketersediaan 98-99% adalah angka yang sangat buruk, dan di beberapa tempat, angka yang tidak berharga.

Lihatlah angka-angka ini dan Anda akan melihat perbedaan ketersediaan 90% dan ketersediaan 99,999%:

Ketersediaan Waktu henti per bulan Waktu henti per tahun
90% 3 hari 37 hari
98% 14,6 jam 7,3 hari
99% 7,3 jam 3,7 hari
99,8% 1,5 jam 18 jam
99,9% 44 menit 8,8 jam
99,99% 4,4 menit 53 menit
99,999% 26 detik 5,3 menit

Melihat tabel di atas, Anda memahami bahwa pusat data yang menjamin ketersediaan jaringan 99% mampu melakukan downtime selama 7 jam per bulan. Bayangkan situasi ini: ada sesuatu yang diperbaiki di pusat data sepanjang hari, situs web Anda tidak tersedia, Anda mengalami kerugian, tetapi Anda tidak dapat mengajukan klaim ke pusat data - bahkan dalam situasi ini, pusat data akan memberikan ketersediaan yang dijanjikan.

Saya menganggap 99% ketersediaan jaringan buruk. Saya lebih memilih pusat data yang menyediakan ketersediaan jaringan setidaknya 99,9%.

Mungkin ada proyek Internet yang dapat bertahan selama 37 hari downtime per tahun (lebih dari sebulan!). Namun tetap saja, sebagian besar toko online, portal, dan situs web (terutama yang transaksinya dilakukan melalui situs) tidak mampu mendapatkan kemewahan bahkan 18 jam setahun. Reputasi selalu sulit untuk dipulihkan, dan jika hilang karena alasan seperti “administrator sistem sedang libur”, itu sangat disayangkan.

"Lima sembilan" - itulah ketersediaan tinggi

Istilah “lima sembilan” berarti ketersediaan 99,999% dan ditemukan dalam literatur pemasaran tidak kalah seringnya dengan literatur teknis. Dipercayai bahwa situs atau sistem dengan tingkat ketersediaan “lima sembilan” adalah ketersediaan tinggi.

Setiap orang memerlukan ketersediaan yang tinggi

Tabel tersebut menunjukkan bahwa 99,999% ketersediaan hanya memiliki downtime 5,3 menit per tahun. Namun bahkan pusat data yang menjamin ketersediaan 100% pun sering kali melakukan trik pemasaran.
Misalnya, mereka mengurangi waktu pemeliharaan rutin dari waktu ketersediaan. Misalnya, sebuah pusat data menjanjikan ketersediaan 99,99%, tetapi pada saat ia melakukan pekerjaan terjadwal untuk menggantikan sesuatu, ia menulis “pekerjaan rutin sedang dilakukan dalam waktu 2 jam” dan tidak menganggap ini sebagai tidak tersedia. Oleh karena itu kesimpulannya - baca perjanjian tingkat layanan (SLA) dengan cermat.

Jika Anda ingin memastikan ketersediaan setinggi mungkin untuk situs web Anda di satu server, pilih pusat data dengan ketersediaan SLA TERJAMIN (perjanjian tingkat layanan) yang baik.

Catatan! SLA harus menjamin waktu penggantian perangkat keras yang rusak. Dan, idealnya, waktu respons terhadap masalah tersebut.

Selain itu, admin Anda harus memantau pengoperasian layanan dan merespons ketidaktersediaan dengan cepat.

Sedikit tentang apa yang menyebabkan ketersediaan tinggi

Ketersediaan dapat berupa jaringan dan layanan.

Ketersediaan jaringan- ini adalah saat server Anda dapat diakses melalui jaringan.
Ketersediaan layanan adalah saat server Anda dapat melayani klien.

Ketersediaan layanan tidak bisa lebih baik dari ketersediaan jaringan jika Anda tidak menggunakan koneksi alternatif (dengan ketersediaan jaringan Anda sendiri).

Ketersediaan layanan tergantung pada:

  • ketersediaan jaringan server Anda
  • kecepatan reaksi admin Anda terhadap masalah tersebut
  • kecepatan respon dukungan pusat data terhadap suatu masalah
  • kecepatan penggantian perangkat keras yang rusak di pusat data

Tidak dapat diaksesnya terdiri dari:

  • masalah aksesibilitas jaringan
  • masalah perangkat keras
  • masalah dengan beban di server (“melambat”, tidak dapat mengatasinya)
  • kesalahan perangkat lunak (“kusen” pemrogram)

Dan bulanan (kecuali dalam kasus kegagalan perangkat keras) dan terlebih lagi ketersediaan tahunan sebesar 99,8% dapat dipastikan dalam DC yang baik di satu server tanpa tindakan tambahan untuk memastikan toleransi kesalahan. Ketersediaan 99,9% sudah membutuhkan sedikit keberuntungan.

Jika Anda memerlukan jaminan ketersediaan di atas 99,8%, Anda perlu mengatasi toleransi kesalahan. Dan harus ada lebih dari satu server. Tapi ini adalah topik untuk diskusi lain.

Saat ini, teknologi berkembang dengan kecepatan yang semakin meningkat. Karena alasan ini, di banyak organisasi, perangkat keras dan perangkat lunak yang diperlukan untuk beroperasi menjadi lebih banyak dan beragam, meskipun ada upaya untuk menstandarkannya. Teknologi lama dan baru dipaksa untuk hidup berdampingan. Koeksistensi ini menyebabkan munculnya fasilitas jaringan tambahan, antarmuka dan sarana komunikasi. Ketergantungan dunia usaha terhadap teknologi semakin meningkat.

Downtime komputer selama beberapa jam dapat menimbulkan konsekuensi serius bagi bisnis dan reputasi perusahaan di pasar, terutama saat ini karena Internet telah berubah menjadi pasar versi elektronik. Di dunia elektronik ini, pesaing dipisahkan satu sama lain hanya dengan mengklik tombol mouse. Dalam hal ini, kepuasan pelanggan menjadi faktor yang sangat penting. Inilah salah satu alasan mengapa sistem komputasi saat ini harus tersedia 24 jam sehari, tujuh hari seminggu.

14.1.1. Konsep dasar

Pada Gambar. Gambar 14.1 secara skematis menyajikan konsep dasar proses Manajemen Ketersediaan.

Beras. 14.1. Konsep konseptual proses Manajemen Ketersediaan (sumber: OGC)


Ketersediaan

Tingkat Ketersediaan Tinggi berarti pelanggan memiliki akses yang hampir konstan terhadap layanan TI karena berkurangnya waktu henti dan pemulihan penyediaan layanan yang cepat. Tingkat ketersediaan ditentukan menggunakan metrik. Ketersediaan layanan tergantung pada:

Kompleksitas infrastruktur TI;

Keandalan komponen;

Kemampuan untuk merespons kegagalan dengan cepat dan efektif;

Kualitas pelayanan dan kualitas kerja organisasi pendukung dan pemasok;

Kualitas dan batasan kompetensi proses manajemen operasional.

Keandalan dalam konteks proses ini berarti ketersediaan suatu layanan untuk jangka waktu yang disepakati tanpa adanya kegagalan. Konsep ini mencakup konsep keberlanjutan. Keandalan layanan akan meningkat jika dilakukan tindakan preventif terhadap downtime. Keandalan layanan merupakan indikator statistik dan ditentukan oleh kombinasi faktor-faktor berikut:

Keandalan komponen yang digunakan untuk menyediakan layanan;

Kemampuan suatu layanan atau komponennya untuk berfungsi secara efektif meskipun terjadi kegagalan pada satu atau lebih subsistem (ketahanan);

Pemeliharaan preventif untuk mencegah downtime.

Konsep “pemeliharaan” dan “pemulihan” mengandung arti pelaksanaan pekerjaan untuk menjamin berfungsinya pelayanan dan pemulihannya setelah kegagalan, serta pelaksanaan pemeliharaan preventif dan pemeriksaan rutin (terjadwal), yaitu:

Mengambil tindakan untuk mencegah kegagalan;

Deteksi kegagalan tepat waktu;

Melakukan diagnosa, termasuk diagnosa mandiri komponen secara otomatis;

Penyelesaian masalah;

Memulihkan operasi setelah kegagalan;

Pemulihan layanan.

Penyediaan layanan oleh penyedia eksternal

Konsep ini mengacu pada kewajiban kontrak penyedia layanan eksternal (kontraktor, pihak ketiga). Kontrak menentukan dukungan yang akan diberikan pada layanan yang diberikan organisasi eksternal(pengalihdayaan). Karena ini hanya sebagian dari layanan TI, istilah ini tidak mengacu pada ketersediaan layanan secara keseluruhan. Jika kontraktor bertanggung jawab atas layanan secara keseluruhan, seperti halnya, misalnya, ketika mengadakan kontrak pemeliharaan, maka istilah “Penyediaan layanan” dan “ketersediaan” akan menjadi sama. Manajemen Ketersediaan yang Efektif memerlukan pengetahuan tentang lingkungan bisnis dan TI. Penting untuk dipahami bahwa aksesibilitas tidak bisa “dibeli” begitu saja: aksesibilitas harus dibangun sejak tahap awal pengembangan dan implementasi. Pada akhirnya, ketersediaan bergantung pada kompleksitas infrastruktur, keandalan komponen, profesionalisme organisasi TI dan kontraktornya, serta kualitas proses itu sendiri.

14.2. Tujuan Proses

Tujuan dari Proses Manajemen Ketersediaan adalah untuk memberikan Tingkat Ketersediaan layanan TI yang hemat biaya dan konsisten yang akan membantu bisnis mencapai tujuannya. Mendefinisikan tujuan proses dengan cara ini berarti bahwa kebutuhan pelanggan (bisnis) harus sesuai dengan apa yang dapat ditawarkan oleh infrastruktur TI dan organisasi. Jika terjadi kesenjangan antara supply dan demand, maka Availability Management Process harus memberikan solusi terhadap situasi tersebut. Selain itu, proses ini memastikan bahwa Tingkat Ketersediaan yang dicapai dinilai dan ditingkatkan lebih lanjut jika diperlukan. Artinya, aktivitas proaktif dan reaktif dilakukan dalam proses tersebut. Saat mengembangkan suatu proses, asumsi berikut harus dibuat:

Menggunakan Proses Manajemen Ketersediaan sangat penting untuk mencapai kepuasan pelanggan yang maksimal. Ketersediaan dan keandalan merupakan dua indikator yang sangat menentukan persepsi pelanggan terhadap layanan yang diberikan.

Ketersediaan tinggi bukan berarti bebas kegagalan. Manajemen Ketersediaan terutama bertanggung jawab untuk merespons situasi yang tidak diinginkan tersebut secara profesional.

Perancangan proses tidak hanya membutuhkan pemahaman menyeluruh tentang teknologi informasi, namun juga pemahaman tentang proses dan layanan pelanggan. Pencapaian tujuan hanya mungkin dilakukan dengan menggabungkan kedua aspek ini.

Proses Manajemen Ketersediaan memiliki cakupan yang luas, mencakup layanan baru dan yang sudah ada, hubungan dengan pemasok eksternal dan internal, seluruh komponen infrastruktur (perangkat keras, perangkat lunak, jaringan, dll) dan aspek organisasi yang mempengaruhi aksesibilitas seperti Tingkat Pengetahuan Personil, proses manajemen, prosedur dan alat.

14.2.1. Manfaat menggunakan proses

Manfaat utama yang diberikan oleh Proses Manajemen Ketersediaan adalah bahwa layanan yang dirancang, diterapkan, dan dikelola oleh organisasi TI memenuhi persyaratan ketersediaan layanan. Pemahaman menyeluruh terhadap proses bisnis pelanggan dan teknologi informasi, dipadukan dengan keinginan terus-menerus untuk memaksimalkan ketersediaan layanan dalam batas wajar, dapat berkontribusi besar pada pembentukan budaya layanan yang nyata. Keuntungan lain dari proses ini adalah:

Menciptakan satu titik kontak mengenai ketersediaan produk dan layanan dan memiliki satu orang yang bertanggung jawab atas permasalahan ini;

Memastikan bahwa produk dan layanan baru memenuhi persyaratan yang ditetapkan untuk produk dan layanan tersebut dan standar aksesibilitas yang disepakati dengan pelanggan;

Tingkat biaya dipertahankan pada tingkat yang dapat diterima;

Terus memantau standar aksesibilitas dan memperbaikinya jika diperlukan;

Jika layanan tidak tersedia, lakukan tindakan pemulihan yang sesuai dengan situasi;

Mengurangi jumlah penolakan akses terhadap sistem dan mengurangi periode tidak tersedianya layanan;

Pergeseran penekanan dari perbaikan cacat ke peningkatan layanan;

Kemudahan membenarkan nilai tambah bagi organisasi TI.

Proses Manajemen Aksesibilitas dikaitkan dengan proses ITIL berikut.

Manajemen Tingkat Layanan

Proses Manajemen Tingkat Layanan menegosiasikan dan mengelola Perjanjian Tingkat Layanan, di mana Ketersediaan adalah salah satu parameter terpenting.

Manajemen konfigurasi

Proses Manajemen Konfigurasi memiliki informasi tentang infrastruktur dan dapat memberikan informasi berharga kepada Proses Manajemen Ketersediaan.

Manajemen kapasitas

Mengubah Kapasitas sering kali memengaruhi ketersediaan layanan, dan perubahan parameter ketersediaan memengaruhi parameter kapasitas suatu layanan. Proses Manajemen Kapasitas memiliki banyak informasi, termasuk informasi infrastruktur. Oleh karena itu, proses ini sering kali bertukar informasi tentang skenario peningkatan atau penghentian komponen TI, serta tren ketersediaan yang dapat menyebabkan perubahan dalam kebutuhan kapasitas layanan.

Manajemen Kontinuitas Layanan

Proses Manajemen Ketersediaan tidak bertanggung jawab untuk memulihkan proses bisnis setelah bencana. Merupakan tanggung jawab Proses Manajemen Kontinuitas Layanan TI untuk memberikan Proses Manajemen Ketersediaan informasi tentang proses bisnis yang paling penting. Dalam praktiknya, banyak tindakan untuk meningkatkan ketersediaan layanan mengarah pada peningkatan kontinuitas layanan TI dan sebaliknya.

Manajemen Masalah

Proses Manajemen Masalah terlibat langsung dalam mengidentifikasi penyebab masalah ketersediaan layanan yang ada dan potensial serta menyelesaikannya.

Manajemen Insiden

Proses Manajemen Insiden mendefinisikan bagaimana insiden diselesaikan. Proses ini memberikan laporan yang berisi informasi tentang waktu yang dihabiskan untuk penyelesaian insiden, perbaikan, dll. Informasi yang relevan digunakan untuk menentukan Tingkat Ketersediaan yang dicapai.

Manajemen keamanan

Proses Manajemen Ketersediaan erat kaitannya dengan Proses Manajemen Keamanan, yang permasalahan utamanya adalah:

Kerahasiaan;

Integritas;

Ketersediaan.

Kriteria keamanan harus dipertimbangkan ketika menentukan persyaratan aksesibilitas. Proses Manajemen Ketersediaan dapat memberikan informasi berharga kepada Proses Manajemen Keamanan, terutama mengenai layanan baru.

Manajemen perubahan

Proses Manajemen Aksesibilitas menginformasikan Proses Manajemen Perubahan tentang masalah pemeliharaan layanan baru dan elemennya serta memulai perubahan untuk mengatasi masalah aksesibilitas. Proses Manajemen Perubahan menginformasikan Proses Manajemen Ketersediaan tentang isi Rencana Perubahan Masa Depan (FSC).

14.3. Proses

Untuk memenuhi standar ketersediaan layanan yang tinggi, komponen penting diduplikasi jika memungkinkan dan sistem deteksi dan resolusi kesalahan digunakan. Seringkali, jika cacat terdeteksi, sistem cadangan mulai beroperasi secara otomatis. Namun, dalam situasi seperti ini, tindakan organisasi juga perlu diambil, dan Proses Manajemen Ketersediaan dapat menyediakan hal tersebut.

Beras. 14.2. Masukan dan Keluaran Proses Manajemen Ketersediaan (sumber: OGC)


Proses Manajemen Ketersediaan mulai berlaku setelah bisnis mendefinisikan dengan jelas persyaratan aksesibilitas layanannya. Ini adalah proses berkelanjutan yang berakhir hanya ketika layanan tidak lagi tersedia.

Pintu masuk untuk Proses Manajemen Ketersediaan adalah (Gbr. 14.2):

Persyaratan bisnis untuk aksesibilitas;

Menilai dampak terhadap seluruh proses bisnis yang didukung oleh TI;

Persyaratan ketersediaan, keandalan dan pemeliharaan komponen infrastruktur TI;

Data mengenai kesalahan yang mempengaruhi layanan atau komponennya, biasanya dalam bentuk catatan dan laporan insiden dan masalah;

Data konfigurasi layanan dan komponennya serta data pemantauan;

Tingkat Layanan yang Dicapai dibandingkan dengan tingkat yang disepakati untuk semua layanan yang ditentukan dalam perjanjian layanan.

Keluar:

Kriteria untuk merancang arsitektur untuk memastikan ketersediaan dan pemulihan layanan TI yang baru dan lebih baik;

Teknologi yang menjamin ketahanan infrastruktur dan mengurangi atau menghilangkan dampak komponen yang rusak;

Jaminan ketersediaan, keandalan, dan pemeliharaan komponen infrastruktur yang diperlukan untuk menyediakan layanan TI;

Laporan pencapaian Ketersediaan, Keandalan, dan Tingkat Layanan;

Persyaratan untuk memantau ketersediaan, keandalan dan pemeliharaan;

Rencana ketersediaan untuk secara proaktif meningkatkan infrastruktur TI Anda.

14.4. Kegiatan

Sebagai bagian dari Proses Manajemen Ketersediaan, sejumlah kegiatan utama terkait perencanaan dan pemantauan dilakukan, yaitu:

Perencanaan

Menentukan persyaratan ketersediaan layanan;

Merancang sistem untuk mencapai Tingkat Ketersediaan yang dibutuhkan;

Merancang sistem untuk mencapai kemampuan pemulihan yang diperlukan;

Pertanyaan keamanan;

Manajemen Pelayanan;

Mengembangkan Rencana Aksesibilitas.

Pemantauan

Melakukan pengukuran dan menyusun laporan.

Berikut ini adalah uraian kegiatan utama.

14.4.1. Menentukan persyaratan ketersediaan layanan

Jenis pekerjaan ini harus diselesaikan sebelum Perjanjian Tingkat Layanan disepakati dan memengaruhi layanan TI baru dan perubahan pada layanan yang sudah ada. Organisasi TI harus menentukan secepat mungkin apakah dan bagaimana organisasi tersebut akan memenuhi persyaratan ini. Dalam pelaksanaan jenis kegiatan ini ditentukan hal-hal sebagai berikut:

Fungsi bisnis utama;

Jangka waktu downtime layanan TI yang disepakati;

Penilaian kuantitatif terhadap persyaratan ketersediaan layanan;

Mengukur dampak downtime yang tidak direncanakan terhadap fungsi bisnis;

jam kerja Pelanggan;

Perjanjian jendela untuk pemeliharaan terjadwal.

Mendefinisikan dengan jelas persyaratan ketersediaan layanan sejak dini dapat menghindari kesalahpahaman dan salah tafsir terhadap perjanjian pada tahap selanjutnya. Persyaratan pelanggan harus dibandingkan dengan persyaratan yang dapat disediakan organisasi. Jika perbedaan teridentifikasi, dampak perbedaan tersebut terhadap biaya layanan harus ditentukan.

14.4.2. Merancang sistem untuk mencapai Tingkat Ketersediaan yang diperlukan

Berbagai jenis kerentanan yang mempengaruhi ketersediaan harus diidentifikasi sedini mungkin. Hal ini akan menghindari biaya pengembangan yang terlalu tinggi, biaya yang tidak direncanakan pada tahap selanjutnya, Single Point of Failure (SPOF), biaya tambahan pada faktur vendor, dan penundaan rilis.

Desain yang baik dengan mempertimbangkan standar aksesibilitas akan menghasilkan perjanjian layanan yang efektif dengan pemasok. Perancangannya menggunakan beberapa metode, seperti Component Failure Impact Analysis (CFIA - lihat bagian 14.4.9) untuk mengidentifikasi kegagalan yang disebabkan oleh adanya SPOF, metodologi Analisis dan Manajemen Risiko CCTA (CRAMM - lihat bab "Manajemen Kontinuitas Layanan TI" ) ") dan metode pemodelan. Jika standar aksesibilitas tidak dapat dipenuhi, tindakan terbaik adalah berupaya melakukan perbaikan yang sesuai pada desain. Kepatuhan terhadap standar dapat dicapai dengan menggunakan teknologi tambahan, metode lain, alat pengembangan, strategi Manajemen Rilis yang berbeda, atau meningkatkan atau mengubah proses desain.

Jika persyaratannya sangat tinggi, Anda dapat mencoba menggunakan teknologi toleransi kesalahan yang berbeda, Proses Manajemen Layanan yang berbeda (Manajemen Insiden, Masalah dan Perubahan) atau sumber daya Manajemen Layanan tambahan. Pilihan opsi sangat bergantung pada sumber daya keuangan yang tersedia.

14.4.3. Merancang sistem untuk mencapai Tingkat Layanan yang diperlukan

Karena ketersediaan layanan yang berkesinambungan jarang dapat dicapai, maka periode kemungkinan tidak tersedianya layanan harus diperhitungkan. Ketika layanan terganggu, penting untuk menyelesaikan kegagalan dengan cepat dan benar dan mencoba mencapai standar ketersediaan yang disepakati. Merancang prosedur pemulihan mencakup aspek-aspek seperti penggunaan Proses Manajemen Insiden yang efektif dan prosedur eskalasi, peringatan, pencadangan, dan pemulihan yang sesuai. Tugas, tanggung jawab dan wewenang harus didefinisikan dengan jelas.

14.4.4. Masalah Keamanan Utama

Keamanan dan keandalan berkaitan erat. Kurangnya pertimbangan terhadap masalah keamanan informasi dapat mempengaruhi ketersediaan layanan. Tingkat Ketersediaan yang tinggi harus didukung dengan sistem keamanan informasi yang efektif. Selama tahap perencanaan, permasalahan keamanan harus dipertimbangkan dan dampaknya terhadap penyediaan layanan harus dinilai.

Pertanyaan mungkin termasuk yang berikut::

Penetapan orang yang berwenang mengakses kawasan lindung;

14.4.5. Manajemen Pelayanan

Dalam praktik normal, selalu ada periode tidak tersedianya layanan yang dijadwalkan. Periode ini dapat digunakan untuk melakukan tindakan pencegahan seperti peningkatan dan perubahan perangkat lunak dan perangkat keras. Namun, dalam lingkungan bisnis yang berkelanjutan, menentukan periode yang dialokasikan untuk pemeliharaan menjadi semakin sulit. Desain, implementasi, dan pengendalian aktivitas pemeliharaan sistem telah menjadi salah satu bidang penting dalam Proses Manajemen Ketersediaan.

Pemeliharaan harus dilakukan pada saat dampaknya terhadap pemberian layanan minimal. Artinya perlu ditentukan terlebih dahulu tujuan pemeliharaan, jangka waktu pelaksanaannya, dan pekerjaan apa yang akan dilakukan (untuk itu dapat digunakan metode Component Failure Impact Analysis (CFIA)). Informasi pemeliharaan tersebut sangat penting untuk Proses Manajemen Perubahan dan proses lainnya.

14.4.6. Melakukan pengukuran dan menulis laporan

Pengukuran dan pelaporan merupakan aktivitas penting dalam Proses Manajemen Ketersediaan karena memberikan dasar untuk memverifikasi perjanjian layanan, menyelesaikan masalah, dan membuat saran untuk perbaikan layanan.

Jika Anda tidak mengukur, Anda tidak bisa mengelola.

Jika Anda tidak mengukur, Anda tidak dapat berkembang.

Jika Anda tidak mengukur, Anda mungkin tidak peduli.

Jika Anda tidak dapat mempengaruhi, maka Anda tidak boleh mengukur.

Siklus hidup suatu kejadian meliputi tahapan sebagai berikut:

Terjadinya suatu insiden: Waktu ketika pengguna menyadari kegagalan atau ketika kegagalan terdeteksi (secara otomatis atau manual).

Deteksi: Penyedia layanan telah diberitahu tentang kegagalan tersebut. Insiden tersebut menerima status “Dilaporkan”. Waktu yang dibutuhkan untuk ini dikenal sebagai waktu deteksi.

Tanggapan: Penyedia layanan memerlukan waktu untuk merespons kejadian tersebut. Ini adalah waktu respons dan digunakan untuk melakukan diagnosa yang dilanjutkan dengan pekerjaan perbaikan. Proses Manajemen Insiden mencakup jenis pekerjaan seperti Penerimaan dan Pendaftaran Insiden, Klasifikasi, Perbandingan, Analisis, dan Diagnostik.

Memperbaiki: Penyedia layanan memulihkan komponen yang menyebabkan kegagalan.

Pemulihan layanan: layanan dipulihkan. Hal ini melibatkan pelaksanaan pekerjaan seperti konfigurasi dan inisialisasi, dan kemudian memulihkan layanan kepada pengguna.

Pada Gambar. Gambar 14.3 menunjukkan periode waktu yang dapat diukur.

Beras. 14.3. Mengukur aksesibilitas (sumber: OGC)


Seperti yang Anda lihat dari gambar, waktu respons organisasi TI dan kontraktor eksternal merupakan salah satu faktor yang menentukan waktu henti. Karena faktor ini secara langsung mempengaruhi kualitas layanan dan organisasi TI dapat mengendalikannya, perjanjian mengenai waktu respons dapat dimasukkan dalam Perjanjian Tingkat Layanan. Saat melakukan pengukuran, Anda dapat mengambil nilai rata-rata untuk mendapatkan gambaran yang benar tentang parameter yang relevan. Rata-rata dapat digunakan untuk menentukan Tingkat Layanan yang dicapai dan memperkirakan ketersediaan yang diharapkan di masa depan. Informasi ini dapat digunakan untuk mengembangkan Rencana Peningkatan Layanan.

Proses Manajemen Ketersediaan biasanya menggunakan metrik berikut:

Waktu Rata-rata untuk Memperbaiki (MTTR): Waktu rata-rata antara terjadinya kegagalan dan pemulihan suatu layanan, yang juga dikenal sebagai “waktu henti”. Ini terdiri dari waktu deteksi kegagalan dan waktu resolusi kegagalan. Metrik ini berkaitan dengan aspek layanan seperti pemulihan dan pemeliharaan.

Waktu Rata-Rata Antar Kegagalan (MTBF): Waktu rata-rata antara pemulihan dari satu kegagalan dan terjadinya kegagalan lainnya, yang juga dikenal sebagai uptime. Metrik ini berkaitan dengan keandalan layanan.

Waktu Rata-Rata Antar Insiden Sistem (MTBSI): waktu rata-rata antara dua kejadian berturut-turut. Metrik ini merupakan penjumlahan dari dua metrik MTTR dan MTBF.

Hubungan antara metrik MTBF dan MTBSI membantu Anda memahami apakah terdapat banyak kegagalan kecil atau sedikit gangguan besar.

Metrik berikut dapat disertakan dalam laporan ketersediaan layanan:

Koefisien ketersediaan (atau tidak tersedianya) layanan, dinyatakan dalam metrik MTTR, MTBSI dan MTBF;

Total waktu status operasional dan waktu henti;

Jumlah kegagalan;

informasi tambahan tentang kegagalan yang mungkin terjadi saat ini atau di masa depan yang menyebabkan Tingkat Ketidaktersediaan Sistem yang lebih tinggi dari yang telah disepakati sebelumnya.

Masalah dengan pelaporan adalah metrik yang disajikan di atas mungkin tidak dirasakan oleh pelanggan. Oleh karena itu, laporan ketersediaan layanan harus ditulis dari sudut pandang pelanggan. Laporan tersebut terutama harus memberikan informasi tentang ketersediaan layanan untuk fungsi bisnis penting dan ketersediaan data (yaitu, memberikan wawasan bisnis), bukan tentang ketersediaan komponen teknis TI. Laporan harus ditulis dalam bahasa yang dapat dimengerti oleh pelanggan.

14.4.7. Mengembangkan Rencana Aksesibilitas

Salah satu hasil utama dari proses ini adalah Rencana Aksesibilitas. Ini merupakan Rencana Ketersediaan Layanan jangka panjang untuk beberapa tahun ke depan dan bukan merupakan Rencana Implementasi Proses Manajemen Ketersediaan.

Rencana adalah dokumen hidup. Hal ini pertama-tama harus menggambarkan situasi saat ini, dan kemudian dapat mencakup rekomendasi dan kegiatan khusus untuk meningkatkan layanan yang ada, serta usulan untuk memperkenalkan layanan baru dan pemeliharaannya. Untuk membuat rencana yang lengkap dan akurat, diperlukan interaksi dengan Proses seperti Manajemen Tingkat Layanan, Manajemen Kontinuitas Layanan TI, Manajemen Keuangan Layanan TI, dan Manajemen Pengembangan Aplikasi (secara langsung atau melalui Proses Manajemen Perubahan).

14.4.8. Peralatan

Agar efektif, Proses Manajemen Ketersediaan harus menggunakan sejumlah alat untuk tujuan berikut:

Penentuan waktu henti;

Mencatat informasi sejarah;

Pembuatan laporan;

Analisis statistik;

Analisis dampak.

Proses Manajemen Ketersediaan mengambil informasi dari catatan Proses Manajemen Insiden, CMDB, dan Database Proses Manajemen Kapasitas (CL). Informasi ini dapat disimpan dalam Database Proses Manajemen Ketersediaan khusus.

14.4.9. Metode dan teknik

Saat ini ada jangkauan luas Metode dan teknik Manajemen Aksesibilitas yang membantu dalam perencanaan, peningkatan aksesibilitas, dan pelaporan. Yang paling penting tercantum di bawah ini.

Analisis Dampak Kegagalan Komponen (CFIA)

Metode ini melibatkan penggunaan matriks ketersediaan komponen strategis dan perannya dalam setiap layanan. Saat mengembangkan matriks seperti itu, database CMDB bisa sangat berguna.

Contoh matriks CFIA pada Gambar. Gambar 14.4 menunjukkan bahwa Unit Konfigurasi, yang ditandai dengan “X” untuk banyak layanan, merupakan elemen penting dari infrastruktur TI (analisis horizontal) dan bahwa layanan, yang sering ditandai dengan “X”, bersifat kompleks dan rentan terhadap kegagalan (vertikal). analisis). Metode ini juga dapat digunakan untuk mempelajari tingkat ketergantungan terhadap pihak ketiga (metode CFIA tingkat lanjut).

Barang Konfigurasi Layanan A Layanan B
PC No.1 B B
PC No.2 B
Kabel No.1 B B
Kabel No.2 B
Konektor No.1 X X
Konektor No.2 X
Segmen jaringan Ethernet X X
Perute X X
Tautan Jaringan Area Luas (WAN). X X
Perute X X
Segmen X X
Pusat Informasi Jaringan A A
pelayan B B
Perangkat lunak sistem B B
Aplikasi B B
Basis data X X

X – kegagalan/cacat berarti layanan tidak tersedia

A – konfigurasi gagal-aman

B – konfigurasi gagal-aman, dengan peralihan

“ ” – tidak ada dampak


Beras. 14.4. Matriks CFIA (

Metrik yang dijelaskan di atas dapat digunakan saat membuat perjanjian ketersediaan layanan dengan pelanggan. Perjanjian ini merupakan bagian dari Perjanjian Tingkat Layanan. Rumus di bawah ini membantu menentukan apakah Tingkat Ketersediaan yang dicapai memenuhi persyaratan yang disepakati:

Beras. 14.6. Rumus ketersediaan (sumber: OGC)

Uptime sistem yang dicapai sama dengan selisih antara uptime yang disepakati dan downtime sebenarnya. Misalnya: jika tercapai kesepakatan tentang ketersediaan layanan 98% pada hari kerja dari pukul 07.00 hingga 19.00 dan selama periode tersebut terjadi kegagalan layanan selama dua jam, maka mencapai waktu kinerja (persentase ketersediaan) akan sama dengan:

(5x12- 2)/(5 X 12) X 100% = 96,7%

Analisis Pemadaman Sistem (SOA)

Metode ini dapat digunakan untuk menentukan penyebab kegagalan, mempelajari efektivitas organisasi TI dan prosesnya, serta untuk menyajikan dan mengimplementasikan proposal peningkatan layanan.

Karakteristik metode SOA:

Cakupan luas: tidak terbatas pada infrastruktur tetapi juga mencakup proses, prosedur dan aspek budaya perusahaan;

Pertimbangan masalah dari sudut pandang pelanggan;

Implementasi bersama metode ini oleh perwakilan pelanggan dan organisasi TI (tim metode SOA).

Kelebihan metode ini antara lain efisiensi pendekatan, komunikasi langsung antara pelanggan dan pemasok, serta cakupan usulan perbaikan layanan yang lebih luas.

Pos Pengamatan Teknis (TOR)

Metode ini melibatkan tim spesialis TI khusus yang memantau satu aspek aksesibilitas yang dipilih. Hal ini dapat digunakan ketika cara konvensional tidak memberikan dukungan yang memadai. Metode TOP memungkinkan Anda menggabungkan pengetahuan desainer dan manajer sistem.

Perhitungan Ketersediaan Layanan

Keuntungan utama dari metode ini adalah pendekatannya yang rasional, efektif dan informal, yang dengan cepat membuahkan hasil.

perangkat lunak otomatisasi proses

  1. perangkat lunak Bmc
  2. Rekan komputer
  3. Hewlett Packard
  4. Microsoft

perangkat lunak Bmc

BMC Software adalah pengembang dan pemasok alat administrasi jaringan, aplikasi, basis data, sistem ERP dan CRM yang terkenal di dunia yang meningkatkan ketersediaan, kinerja, dan kemampuan pemulihan aplikasi dan data bisnis penting. Produk BMC tersedia untuk berbagai platform, termasuk berbagai implementasi dan versi UNIX, Windows, OS/2, OS/390, OpenVMS dan NetWare. Di antara ciri khas produk BMC, hal pertama yang perlu diperhatikan adalah fokusnya pada dukungan perjanjian tingkat layanan pengguna (Perjanjian Tingkat Layanan, SLA) dan pembangunan model yang berfungsi yang bertujuan untuk mengimplementasikan perjanjian tersebut, serta kinerjanya yang tinggi ( Gambar 1). Perusahaan menawarkan rangkaian produk berikut untuk manajemen infrastruktur TI:

  • Manajemen Aplikasi BMC- alat ini dirancang untuk mengelola kinerja dan ketersediaan aplikasi bisnis (termasuk aplikasi dari Oracle dan SAP) dan produk server (seperti server Microsoft Exchange dan J2EE BEA WebLogic, IBM WebSphere, dll.);
  • Manajemen Basis Data BMC- alat untuk administrasi, manajemen kinerja, dan pemulihan database yang dikelola oleh DBMS dari produsen terkemuka - Oracle, IBM, Microsoft, Sybase;
  • Manajemen Infrastruktur BMC- alat untuk mengelola sistem operasi server dan mainframe, penyimpanan data, jaringan, perangkat keras, middleware, dan mengoptimalkan kinerja kategori perangkat lunak ini;
  • Manajemen Operasi BMC- alat untuk melakukan operasi rutin sesuai jadwal dan untuk menyusun laporan tentang peristiwa jaringan;
  • Manajemen Layanan Perbaikan BMC- alat untuk mencari, mendeteksi, memodelkan kegagalan aplikasi dan meresponsnya;
  • Manajemen Keamanan BMC- alat untuk mengelola hak akses pengguna ke aplikasi dan sumber daya perusahaan.

Data aplikasi BMC dapat disimpan di BMC Atrium CMDB (Database Manajemen Konfigurasi), yang menyediakan alat visualisasi data yang nyaman.

perangkat lunak Bmc

Perhatikan bahwa produk BMC menyertakan antarmuka pemrograman aplikasi terdokumentasi yang memungkinkan Anda membuat solusi sendiri berdasarkan produk tersebut dan mengintegrasikan alat BMC dengan aplikasi lain.

Beras. 1. Area pengelolaan infrastruktur TI yang dicakup oleh produk BMC

Rekan komputer

Rangkaian produk manajemen infrastruktur TI Unicenter dari Computer Associates (CA) dapat disesuaikan agar sesuai dengan hampir semua lingkungan komputasi.

Keluarga ini mencakup produk-produk berikut:

  • Manajemen Aset Unicenter- alat untuk mengotomatisasi pengelolaan aset TI perusahaan, yang dengannya akuntansi komprehensif dan pengendalian sumber daya TI dilakukan. Fungsionalitas Manajemen Aset Unicenter membantu meningkatkan kualitas keputusan manajemen terkait dengan aset TI perusahaan dan mengurangi risiko terkait. Unicenter Asset Management menyediakan pemantauan penggunaan aplikasi di server, komputer pribadi, dan perangkat klien lainnya. Selain itu, produk ini memungkinkan Anda untuk mengotomatiskan proses manajemen aset TI, termasuk akuntansi dan inventaris perangkat lunak dan perangkat keras yang berjalan di jaringan perusahaan, pemeliharaan berbagai komponen infrastruktur TI, administrasi lisensi, dan pelaporan di lingkungan yang heterogen (Gbr. 2);

Beras. 2. Bidang Manajemen Infrastruktur TI Terintegrasi yang Dicakup oleh Produk Rekanan Komputer

  • Pengiriman Perangkat Lunak Unicenter- menyediakan otomatisasi proses penerapan dan pembaruan perangkat lunak pada komputer desktop, seluler, dan saku, serta pada server di lingkungan jaringan yang heterogen, termasuk pengiriman aplikasi, distribusi patch dan pembaruan, manajemen konfigurasi sistem, dan pengembalian instalasi pada berbagai platform perangkat lunak dan perangkat keras . Produk ini menciptakan kondisi untuk meningkatkan efisiensi layanan TI dan mengurangi biaya dukungan informasi bisnis melalui otomatisasi proses TI dan memperkenalkan katalog aplikasi dengan kemampuan layanan mandiri tingkat lanjut. Salah satu keunggulan utama Pengiriman Perangkat Lunak Unicenter adalah otomatisasi tingkat tinggi dalam proses instalasi dan pemeliharaan perangkat lunak serta manajemen izin pengiriman aplikasi yang fleksibel dan terperinci;
  • Kendali Jarak Jauh Unicenter adalah sistem perusahaan yang andal dan aman untuk manajemen jarak jauh komputer Windows. Daftar tugas manajemen jarak jauh mencakup pemeliharaan layanan jarak jauh, seperti aplikasi jaringan, administrasi server, dan kendali jarak jauh komputer pengguna akhir (misalnya, saat memberikan dukungan teknis). Sistem ini merupakan salah satu solusi industri terbaik di kelasnya dan menyediakan pemeliharaan sistem terpusat, manajemen berbasis kebijakan, kontrol akses, audit sesi, dan kemampuan administrasi tingkat lanjut. Unicenter Remote Control sepenuhnya memenuhi kebutuhan perusahaan besar dalam hal kendali jarak jauh dan memungkinkan operator melakukan beberapa tugas sekaligus: menyalin file ke komputer jarak jauh, berkomunikasi dengan pengguna, meluncurkan aplikasi, memantau dan merekam tindakan pengguna, dan mengelola pengaturan dan pengaturan keamanan. Perlu dicatat bahwa selama pengembangan Remote Control Unicenter, perhatian khusus diberikan untuk mengurangi waktu yang dibutuhkan untuk mengimplementasikan dan menguasai sistem.

Hewlett Packard

HP OpenView adalah serangkaian produk perangkat lunak yang ditujukan untuk mengelola teknologi informasi perusahaan dalam skala apa pun - dari sistem kecil berdasarkan server Windows hingga sistem terdistribusi besar berdasarkan berbagai versi UNIX, Linux dan Windows, yang berisi beberapa ribu komputer. Kompleks ini mencakup alat untuk mengelola jaringan, sistem operasi, aplikasi, serta kinerjanya, menyalin dan menyimpan data, dan layanan.

Portofolio solusi perangkat lunak HP OpenView terdiri dari beberapa kelompok produk (Gbr. 3), termasuk alat untuk mengelola server dan aplikasi, penyimpanan data, jaringan, teknologi Internet, dan peralatan telekomunikasi (ada serangkaian produk HP OpenView yang dirancang khusus untuk perusahaan telekomunikasi , dan saat ini HP adalah penyedia alat manajemen peralatan telekomunikasi paling terkenal. Secara terpisah, kami mencatat kehadiran alat manajemen layanan TI dalam portofolio solusi HP.

Beras. 3. Portofolio solusi perangkat lunak HP OpenView untuk departemen TI

Alat manajemen server dan aplikasi harus mencakup, pertama-tama, Operasi HP OpenView untuk Windows Dan Operasi HP OpenView untuk Unix. Produk-produk ini dirancang untuk memantau dan mengelola kinerja aplikasi, serta mengontrol jaringan dan kejadian aplikasi. HP OpenView Operations untuk Windows terintegrasi dengan alat manajemen infrastruktur jaringan Manajer Node Jaringan OpenView HP, yang memungkinkan Anda secara otomatis mencari server baru yang ditambahkan ke jaringan, dan kemudian secara otomatis menerapkan komponen dan kebijakan yang diperlukan berdasarkan hasil pencarian layanan.

Hewlett Packard

Untuk mengelola kinerja aplikasi, kelompok ini menyertakan alat Manajer Kinerja HP ​​OpenView Dan Agen Kinerja, memungkinkan, dengan menggunakan satu antarmuka, pemantauan terpusat, analisis dan perkiraan penggunaan sumber daya di lingkungan terdistribusi dan heterogen, serta Wawasan Kinerja HP ​​OpenView, membantu memantau kejadian di jaringan dan aplikasi serta menganalisisnya. Solusi Paket Laporan HP OpenVew Dan Pelapor HP OpenView dirancang untuk membuat laporan tentang pengoperasian infrastruktur TI terdistribusi suatu perusahaan berdasarkan data yang diterima dari aplikasi HP OpenView.

Untuk mengelola identitas dan akses ke sumber daya TI, rangkaian HP OpenView menyertakan produk HP OpenView Select Identity, HP OpenView Select Access, dan HP OpenView Select Federation, dan untuk mengelola pencadangan dan pemulihan data DBMS server - Pelindung Data Penyimpanan HP OpenView. Yang terakhir dari produk ini adalah solusi perlindungan data dan pemulihan sistem tingkat perusahaan dalam situasi darurat, menerapkan teknologi pemulihan instan, serta opsi pemulihan bencana alternatif untuk menghilangkan waktu henti yang tidak direncanakan, memungkinkan Anda memulihkan fungsionalitas sistem informasi dalam beberapa menit. menit.

Kami juga mencatat kehadiran rangkaian produk ini yang dirancang untuk berinteraksi dengan pengguna akhir guna meningkatkan kualitas layanan mereka - Meja Layanan HP OpenView, serta alat pemantauan proses bisnis Wawasan Proses Bisnis HP OpenView dan kontrol untuk arsitektur berorientasi layanan - Manajer Arsitektur Berorientasi Layanan HP OpenView.

Hewlett Packard

Untuk mengelola layanan Internet, rangkaian produk ini memberikan solusinya Layanan Internet HP OpenView, memungkinkan pemeriksaan eksternal atas layanan aplikasi, layanan Internet, dan protokol dengan memodelkan permintaan pengguna untuk direktori, layanan email, layanan web, layanan akses jarak jauh (termasuk dial-up dan akses nirkabel).

Rangkaian produk IBM Tivoli, yang dirancang untuk mengelola aplikasi perusahaan dengan berbagai ukuran, didasarkan pada serangkaian komponen inti yang membangun solusi untuk perusahaan tertentu. Rumah ciri khas Rangkaian produk ini disebut manajemen infrastruktur TI yang proaktif, yang mampu mengidentifikasi dan menghilangkan kesalahan sebelum terjadi. Produk keluarga Tivoli tersedia untuk platform AIX, HP-UX, Sun Solaris, Windows, Novell NetWare, OS/2, AS/400, Linux, z/OS, OS/390. Perhatikan bahwa baru-baru ini IBM merekomendasikan penerapan produk keluarga Tivoli untuk mengikuti teknik perpustakaan ITIL (Perpustakaan Infrastruktur Teknologi Informasi), mengalihkan penekanan pada posisi produknya dari pengelolaan sumber daya dan sistem TI menjadi pengelolaan layanan TI (Gbr. 4).

Beras. 4. Beberapa produk software Tivoli yang mendukung proses manajemen layanan ITIL

Rangkaian produk Tivoli mencakup manajemen konfigurasi dan solusi dukungan operasional:

  • Manajer Konfigurasi IBM Tivoli- memungkinkan Anda mengelola instalasi dan pembaruan perangkat lunak, termasuk pada komputer saku;
  • Manajer Lisensi IBM Tivoli- dimaksudkan untuk inventaris perangkat lunak;
  • Kendali Jarak Jauh IBM Tivoli- memungkinkan Anda menetapkan kebijakan untuk mengelola sumber daya TI perusahaan dan mengelolanya dari jarak jauh sistem desktop;
  • Penjadwal Beban Kerja IBM Tivoli- memungkinkan untuk mengotomatiskan beban kerja.

Selain alat manajemen konfigurasi, rangkaian produk Tivoli mencakup solusi manajemen kinerja dan ketersediaan:

  • Pemantauan IBM Tivoli- untuk menerapkan pemantauan terdistribusi terhadap berbagai sistem, secara otomatis mendeteksi dan menyelesaikan masalah serta menganalisis tren;
  • Pemantauan IBM Tivoli untuk Basis Data(DBMS yang diproduksi oleh IBM, Oracle dan Microsoft didukung) dan Manajer Tivoli untuk Sybase- untuk manajemen server dan database terpusat;
  • Pemantauan IBM Tivoli untuk Infrastruktur Web- untuk mengelola server web dan server aplikasi;
  • Pemantauan IBM Tivoli untuk Aplikasi- untuk mengelola aplikasi bisnis SAP;
  • Penganalisis IBM Tivoli untuk Lotus Domino 6.0 Dan Pemantauan IBM Tivoli untuk Kinerja Transaksi- untuk mendeteksi masalah kinerja dalam sistem yang didasarkan pada produk server dari IBM sendiri;
  • Penganalisis Situs Web IBM Tivoli- untuk menganalisis lalu lintas pengunjung, statistik lalu lintas halaman, dan integritas konten situs web;
  • Penasihat Tingkat Layanan IBM Tivoli- untuk memberikan manajemen proaktif dan prediksi kegagalan melalui analisis kinerja kuantitatif;
  • IBM Tivoli NetView- untuk manajemen jaringan;
  • Penganalisis Sakelar IBM Tivoli- untuk mendeteksi dan mengisi semua switch tingkat jaringan;
  • Konsol IBM Tivoli Enterprise- untuk pencarian multi-level untuk penyebab kesalahan dan analisis kejadian.

Selain itu, terdapat sejumlah solusi untuk manajemen otomatis distribusi sumber daya TI dan beban puncak.

Keluarga Tivoli juga mencakup produk keamanan:

  • Server Direktori IBM- untuk menyinkronkan data keamanan di semua aplikasi yang digunakan;
  • Integrator Direktori IBM- untuk mengintegrasikan parameter identifikasi yang terdapat dalam katalog, database, sistem kolaboratif dan aplikasi bisnis;
  • Manajer Identitas IBM Tivoli Dan Manajer Akses IBM Tivoli untuk Sistem Operasi- untuk mengontrol akses ke aplikasi dan sistem operasi;
  • Manajer Risiko IBM Tivoli- untuk manajemen keamanan jaringan terpusat.

Selain itu, keluarga Tivoli mencakup beragam produk manajemen pencadangan dan penyimpanan.

Microsoft

Meskipun saat ini Microsoft bukan pemimpin pasar dalam alat manajemen infrastruktur TI, alat manajemen aplikasi yang diproduksi oleh perusahaan ini digunakan cukup luas di negara kita.

Tujuan utama alat Microsoft Microsoft Systems Management Server (SMS) dan Microsoft Operations Manager (MOM), serta alat administrasi yang tersedia untuk pengguna sistem operasi server Microsoft versi terbaru (seperti Layanan Penerapan Otomatis, Layanan Instalasi Jarak Jauh, Microsoft Konsol Manajemen Kebijakan Grup, Layanan Pembaruan Microsoft Windows), - manajemen perangkat lunak, instalasi otomatis sistem operasi Microsoft dan aplikasi yang dirancang untuknya, pengiriman pembaruan otomatis, manajemen akses dan hak pengguna (Gbr. 5).

Beras. 5. Pengelolaan sistem informasi menggunakan Microsoft Operations Manager dan Microsoft Systems Management Server

Server Manajemen Sistem Microsoft dirancang untuk memastikan distribusi otomatis dan akuntansi perangkat lunak dalam sistem terdistribusi besar berdasarkan sistem operasi Microsoft itu sendiri, termasuk perencanaan dengan penentuan peralatan dan perangkat lunak pada jaringan lokal, verifikasi, analisis, implementasi aplikasi bisnis untuk berbagai kelompok pengguna sasaran, pemasangan aplikasi pada tempat kerja yang baru muncul sesuai dengan hak pengguna. Produk ini memungkinkan Anda melakukannya pengaturan sasaran berbagai perangkat lunak untuk berbagai kelompok pengguna, serta memecahkan masalah yang berkaitan dengan inventaris perangkat lunak dan kontrol atas penggunaan sumber daya perangkat lunak dan perangkat keras dengan mengumpulkan informasi tentang produk dan peralatan perangkat lunak yang diinstal pada jaringan dan penggunaannya.

Microsoft

Manajer Operasi Microsoft dirancang untuk mengidentifikasi dan memecahkan masalah jaringan, perangkat keras, dan aplikasi dengan memantau secara langsung kejadian yang sedang berlangsung, serta status dan kinerja sumber daya jaringan, dan mengeluarkan peringatan tentang potensi masalah (Gambar 6).

Beras. 6. Memantau kesehatan server menggunakan Microsoft Operations Manager

Produk ini ditujukan untuk mengelola infrastruktur TI perusahaan kecil atau kelompok server khusus (hingga 10 pcs.) Edisi Grup Kerja Manajer Operasi Microsoft 2005. Ini memungkinkan Anda untuk mengidentifikasi potensi ancaman dalam fungsi perangkat lunak Anda dan, berkat alat analisis bawaan, mencegahnya berkembang menjadi masalah serius, meningkatkan efisiensi operasi TI, menyederhanakan dukungan untuk platform dan aplikasi yang heterogen, dan juga membuat kustom paket layanan.

Selain itu, terdapat solusi terpisah untuk manajemen kinerja dan analisis peristiwa untuk komponen infrastruktur TI berdasarkan produk server Microsoft, seperti Paket Manajemen Direktori Aktif- untuk memantau status layanan direktori Direktori Aktif, Paket Manajemen Pertukaran- untuk mengelola layanan pesan dan penyimpanan data Exchange, serta sejumlah produk lainnya. Untuk memastikan interaksi dengan alat manajemen infrastruktur TI yang diproduksi oleh perusahaan lain, tersedia produk Kerangka Konektor MOM, memungkinkan penyiaran peringatan dua arah dan sinkronisasi data menggunakan layanan web.

manajemen IB

  1. Cobit - "tujuan pengendalian untuk informasi dan teknologi terkait"
  • Baca bagian 1
  • Kerangka operasional Microsoft
    • Baca bagian 1
  • model perintah mof
    • Baca bagian 1
  • model manajemen risiko
    • Baca bagian 1

    Standar Tujuan Pengendalian untuk Informasi dan Teknologi Terkait (CobiT), yang kini memasuki edisi ketiga, membantu memenuhi berbagai kebutuhan manajemen dengan membentuk hubungan antara risiko bisnis, persyaratan pengendalian, dan masalah teknis. Hal ini memungkinkan Anda untuk membuat praktik manajemen TI yang baik di semua kelompok proses dalam standar, dan juga menggambarkan jenis aktivitas TI dalam bentuk struktur yang dapat dikelola dan terstruktur secara logis. “Praktik yang baik” menurut CobiT adalah rekomendasi yang disepakati para ahli yang membantu mengoptimalkan investasi di bidang teknologi informasi dan menyediakan sistem indikator yang dapat digunakan jika terjadi situasi darurat.

    Konsep inti CobiT adalah pengendalian TI memandang informasi sebagai produk yang diperlukan untuk mendukung tujuan atau kebutuhan bisnis dan sebagai hasil dari penerapan gabungan TI dan sumber daya terkait yang harus dikelola oleh proses TI.

    Standar CobiT mencakup seri buku berikut:

    1. Ringkasan untuk manajemen.

    2. Dasar-dasar.

    3. Kontrol sasaran (tujuan detail - 318 buah)

    4. Pedoman pengelolaan.

    5. Pedoman Audit.

    6. Metode pelaksanaan.

    Standar CobiT mengidentifikasi 34 proses TI, dikelompokkan ke dalam empat kelompok berikut (Gambar 1.1):

    1. Perencanaan dan pengorganisasian - proses yang mencakup strategi dan taktik, serta menentukan jalur pengembangan TI yang memberikan kontribusi terbaik untuk mencapai tujuan bisnis.

    2. Akuisisi dan implementasi – proses yang mencakup pengembangan dan perolehan solusi TI yang harus diintegrasikan ke dalam proses bisnis. Mengubah sistem yang ada.

    Cobit - "tujuan pengendalian untuk informasi dan teknologi terkait"

    3. Operasi dan pemeliharaan adalah proses yang benar-benar menyediakan layanan yang diperlukan.

    4. Pengendalian – proses pengawasan manajemen dan evaluasi independen yang melibatkan audit internal dan eksternal atau sumber lain.

    Untuk masing-masing dari 34 proses TI, satu tujuan pengendalian tingkat proses TI ditentukan (niat atau hasil yang diinginkan yang dicapai melalui penerapan prosedur pengendalian dalam aktivitas TI). Tujuan pengendalian ini selanjutnya dipecah menjadi tujuan pengendalian rinci. Ada 318 tujuan rinci yang ditentukan dalam standar CobiT.

    Gambar 1.1. Proses TI CobiT

    Menurut CobiT, proses TI digunakan untuk mendukung 7 kebutuhan informasi berikut (sebagian tumpang tindih).

    1. Kegunaan – informasi relevan dan konsisten dengan BP, disampaikan tepat waktu, konsisten dan dapat digunakan.

    2. Efisiensi – penyediaan informasi berdasarkan penggunaan sumber daya secara optimal.

    3. Kerahasiaan – perlindungan informasi dari akses tidak sah.

    4. Integritas – keakuratan dan kelengkapan informasi sesuai dengan nilai dan harapan bisnis.

    5. Ketersediaan - informasi tersedia berdasarkan permintaan BP saat ini dan di masa depan.

    6. Kepatuhan – kepatuhan terhadap kewajiban hukum, peraturan dan kontrak yang menjadi subjek BP.

    7. Keandalan - memberikan manajemen informasi yang diperlukan untuk mengelola organisasi dan memenuhi tanggung jawabnya sehubungan dengan aktivitas keuangan dan pelaporan kepada otoritas pengatur.

    Cobit - "tujuan pengendalian untuk informasi dan teknologi terkait"

    Tujuan pengendalian proses TI dapat memberikan persyaratan informasi di atas dan bersifat primer atau sekunder.

    CobiT juga mendefinisikan sumber daya TI yang terlibat dalam memenuhi kebutuhan informasi di atas. Ada 5 kelas sumber daya TI:

    1. Data – objek informasi dalam arti luas, termasuk yang tidak terstruktur, grafik, suara.

    2. Aplikasi – serangkaian prosedur manual dan perangkat lunak.

    3. Teknologi – perangkat keras, OS, DBMS, jaringan, multimedia, dll.

    4. Infrastruktur – semua sumber daya untuk menampung dan mendukung IS.

    5. Personil – mencakup personel dan keterampilan, kesadaran dan kemampuan mereka untuk merencanakan, mengatur, memperoleh, menyampaikan, memelihara dan mengendalikan kekayaan intelektual dan layanan.

    Tujuan pengendalian proses TI, hubungannya dengan kebutuhan informasi dan sumber daya TI disajikan pada Gambar 1.2.

    Gambar 1.2. Tujuan pengendalian proses TI

    Jadi, untuk setiap tujuan pengendalian, persyaratan informasi primer dan sekunder yang didukungnya diidentifikasi. Ditentukan juga sumber daya apa yang terlibat dalam memenuhi persyaratan ini.

    Buku Panduan Manajemen CobiT memperkenalkan model tingkat kematangan proses organisasi, dengan peringkat kematangan berkisar dari 0 (tidak ada) hingga 5 (dioptimalkan). Model kematangan ini selanjutnya digunakan ketika melakukan audit proses TI dan menjawab pertanyaan sejauh mana proses TI memenuhi persyaratan yang diperlukan. Dari sudut pandang ini, CobiT memiliki hubungan yang baik dengan standar perbankan Rusia.

    Di CobiT, indikator kunci untuk mencapai tujuan dimasukkan untuk masing-masing dari 34 proses. Mereka menentukan tolok ukur yang, pada kenyataannya, memberi sinyal kepada manajemen bahwa proses TI memenuhi persyaratan bisnis. Tolok ukur ini biasanya dinyatakan dengan persyaratan informasi seperti:

    Cobit - "tujuan pengendalian untuk informasi dan teknologi terkait"

    Ketersediaan informasi yang diperlukan untuk memenuhi kebutuhan bisnis.

    Tidak ada risiko integritas atau kerahasiaan.

    Profitabilitas proses dan operasi.

    Bukti keandalan, kegunaan, dan kepatuhan.

    Untuk masing-masing dari 34 proses, indikator kinerja utama diperkenalkan - yang menunjukkan seberapa baik proses TI menjalankan fungsinya dan berfungsi untuk mencapai tujuannya. Indikator-indikator tersebut merupakan indikator kunci sejauh mana tujuan dapat dicapai, dan juga merupakan indikator yang baik mengenai kemampuan, praktik dan keterampilan yang ada.

    Untuk masing-masing dari 34 proses TI, skala kualitatif (0-5) telah ditentukan, yang menunjukkan dalam hal mana proses tersebut harus diklasifikasikan sebagai model pengembangan tingkat tertentu.

    Dalam Buku Panduan Audit CobiT, masing-masing dari 34 proses mendefinisikan cara menilai tingkat kepatuhannya terhadap persyaratan yang ditetapkan. Untuk masing-masingnya, berikut ini didefinisikan:

    1. Orang-orang dalam organisasi yang harus diwawancarai selama audit.

    2. Informasi dan dokumen yang diperoleh dari orang yang diwawancarai.

    3. Faktor-faktor yang perlu dinilai (jenis kuesioner).

    4. Faktor-faktor yang perlu diuji (verified).

    Buku CobiT “Teknik Implementasi” berbicara tentang siapa yang perlu dipengaruhi untuk menerapkan COBIT dalam suatu organisasi, dan memberikan rencana tindakan untuk menerapkan COBIT. Kuesioner untuk personel yang digunakan pada tahap implementasi disediakan untuk penilaian internal tata kelola perusahaan TI, manajemen diagnostik internal. Formulir untuk audit dan penilaian risiko disediakan.

  • Persyaratan veteriner dan sanitasi untuk kualitas air (SanP dan N), kebersihan minum. Perhitungan kebutuhan air.
  • pendidikan profesional yang lebih tinggi. "Universitas Pelayanan Negeri Rusia"

  • Arsitektur Ketersediaan Maksimum Oracle Landasan pendekatan DBaaS (Database as a Service) ORACLE WHITE PAPER | SEPTEMBER..."

    Arsitektur Ketersediaan (MAA)

    Arsitektur Referensi Ketersediaan Maksimum

    Oracle (Arsitektur Ketersediaan Maksimum Oracle)

    Dasar dari pendekatan DBaaS (database as a service).

    KERTAS PUTIH ORACLE | SEPTEMBER 2015

    Pendahuluan 1

    Arsitektur Referensi Ketersediaan Tinggi - Ikhtisar 2

    Perunggu: Mesin Virtual Tunggal 4 Ketersediaan Tinggi dan Perlindungan Data di Oracle Database 4 Konsolidasi Basis Data Perunggu 5 Manajemen Siklus Hidup dan Database sebagai Layanan (DBaaS) 5 Sistem Rekayasa Oracle 5 Kesimpulan Perunggu: Perlindungan Data, RTO, dan RPO 6 Perak: Ketersediaan Tinggi dengan Otomatis Failover 7 Oracle Real Application Clusters (Oracle RAC) 8 Oracle RAC One Node 8 Silver Ringkasan: Perlindungan Data, RTO, dan RPO 9 Gold: Ketersediaan Tinggi yang Komprehensif dan Kemampuan Pemulihan Bencana 9 Oracle Active Data Guard - Perlindungan Data Real-Time dan Ketersediaan Tinggi 10 Oracle GoldenGate 11 Oracle Site Guard 12 Kesimpulan Gold: Perlindungan Data, RTO dan RPO 13 Platinum: Tidak Ada Waktu Henti untuk Aplikasi Siap Platinum 14 Teknologi Kontinuitas Aplikasi 14 Oracle Active Data Guard Far Sync 15

    Pemeliharaan Zero Downtime dengan GoldenGate dan Replikasi Aktif-Aktif 15 Definisi Ulang Berbasis Edisi 16 Solusi Oracle Global Data Services 16 Kesimpulan Platinum: Perlindungan Data, RTO, dan RPO 17 Kesimpulan 17

    ARSITEKTUR REFERENSI ORACLE MAA - DASAR PENDEKATAN DBAAS (DATABASE AS A SERVICE)

    Pendahuluan Di dunia saat ini, perusahaan berada di bawah tekanan yang kuat untuk berbuat lebih banyak dengan lebih sedikit, mengurangi risiko dan meningkatkan fleksibilitas. Konsolidasi aktif teknologi TI dan penerapan DBaaS (database as a service) di cloud publik dan privat adalah strategi yang digunakan banyak perusahaan untuk mencapai tujuan ini. Kedua perkembangan ini mempunyai dampak signifikan terhadap desain dan implementasi arsitektur untuk ketersediaan tinggi dan perlindungan data.

    Sebagai hasil dari konsolidasi database, masalah downtime dan kehilangan data menjadi semakin buruk. Konsekuensi dari kegagalan lingkungan tunggal yang berdiri sendiri yang digunakan oleh pengembang tunggal atau kecil kelompok kerja, seringkali tidak signifikan. Kegagalan lingkungan konsolidasi yang mendukung seluruh tim pengembangan organisasi, atau kegagalan beberapa aplikasi yang digunakan oleh banyak departemen, dapat mengganggu operasi perusahaan. Dalam contoh ini, tingkat layanan yang menyediakan ketersediaan tinggi dan perlindungan data untuk lingkungan terkonsolidasi jauh lebih penting dibandingkan tingkat layanan sebelumnya untuk lingkungan mandiri.

    Konsolidasi data dan pendekatan DBaaS juga memerlukan standarisasi layanan dan proses TI. Standardisasi merupakan kondisi penting untuk mengurangi biaya dan kompleksitas operasional. Jika dilakukan dengan benar, standardisasi juga dapat meningkatkan ketangkasan organisasi, memungkinkan TI merespons perubahan kebutuhan bisnis dengan cepat.

    Arsitektur Ketersediaan Maksimum Oracle mendefinisikan empat arsitektur referensi ketersediaan tinggi yang memberikan tingkat standardisasi yang diperlukan sekaligus mengatasi seluruh tantangan ketersediaan dan perlindungan data untuk organisasi dari semua ukuran dan lini bisnis.

    Artikel ini membahas secara mendetail setiap arsitektur referensi dan tingkat layanan terkait yang dapat dicapai. Artikel ini ditujukan terutama bagi para profesional teknis: arsitek, CIO, dan administrator database yang bertanggung jawab untuk merancang dan mengimplementasikan pendekatan DBaaS. Praktik terbaik yang direkomendasikan berlaku sama untuk platform apa pun yang didukung oleh Oracle Database, kecuali dinyatakan secara spesifik bahwa pengoptimalan tersebut hanya untuk Oracle Engineered Systems.

    1 | ARSITEKTUR REFERENSI MAA - DASAR PENDEKATAN DBAAS (DATABASE SEBAGAI LAYANAN)

    Ikhtisar Arsitektur Referensi Ketersediaan Tinggi Praktik Terbaik Oracle MAA mendefinisikan empat arsitektur referensi ketersediaan tinggi untuk menyediakan ketersediaan sistem lengkap dan perlindungan data untuk organisasi dari semua ukuran dan lini bisnis. Arsitektur atau tingkat ketersediaan tinggi ini disebut PLATINUM, EMAS, PERAK, dan PERUNGGU.

    Mereka menyediakan tingkat layanan yang dijelaskan pada Gambar. 1.

    –  –  –

    Beras. 1. Tingkat Layanan untuk Ketersediaan Tinggi dan Perlindungan Data Setiap tingkat menggunakan arsitektur referensi MAA-nya sendiri untuk menerapkan rangkaian optimal kemampuan ketersediaan tinggi Oracle yang dapat diandalkan untuk memberikan tingkat layanan tertentu sekaligus meminimalkan biaya dan kompleksitas. Mereka mengatasi pemadaman yang tidak direncanakan, termasuk kerusakan data, kegagalan komponen, kegagalan sistem atau pemadaman pusat data, serta pemadaman yang direncanakan untuk pemeliharaan, migrasi, atau tujuan lainnya. gambaran umum setiap arsitektur ditunjukkan pada Gambar. 2.

    Beras. 2. Arsitektur referensi untuk ketersediaan tinggi dan perlindungan data

    Tingkat perunggu berkaitan dengan database yang memulai ulang atau memulihkan dari cadangan dianggap sebagai “ketersediaan yang cukup tinggi.” Bronze didasarkan pada satu instans Oracle Database dan memanfaatkan praktik terbaik MAA, yang mencakup banyak fitur perlindungan data dan ketersediaan tinggi yang termasuk dalam lisensi Oracle Enterprise Edition.

    Cadangan yang dioptimalkan oleh Oracle menggunakan Oracle Recovery Manager (RMAN) menyediakan

    2 | ARSITEKTUR REFERENSI ORACLE MAA - DASAR PENDEKATAN DBAAS (DATABASE AS A SERVICE)

    perlindungan data dan digunakan untuk pemulihan jika memulai ulang database tidak memungkinkan.

    Silver memberikan tingkat tambahan ketersediaan tinggi untuk database yang memerlukan sedikit atau tanpa waktu henti ketika instans database atau server gagal, dan untuk sebagian besar jenis waktu henti pemeliharaan terencana. Tingkat Silver dilengkapi dengan teknologi clustering - Oracle RAC atau RAC One Node. RMAN menyediakan cadangan basis data untuk melindungi data dan memulihkan ketersediaan jika pemadaman listrik membuat cluster tidak dapat dimulai ulang.

    Tingkat emas secara signifikan meningkatkan tingkat layanan untuk aplikasi bisnis penting di mana kegagalan salah satu komponen tidak mengakibatkan kegagalan seluruh sistem. Tingkat Emas dilengkapi dengan teknologi replikasi basis data: Active Data Guard dan Oracle GoldenGate. Teknologi ini menyinkronkan satu atau lebih replika database produksi untuk memberikan perlindungan data waktu nyata dan ketersediaan tinggi. Replikasi database memberikan tingkat ketersediaan dan perlindungan data yang jauh lebih tinggi dibandingkan teknologi replikasi tingkat penyimpanan. Hal ini juga mengurangi biaya dan meningkatkan laba atas investasi dengan menjaga semua replika tetap aktif setiap saat.

    Level Platinum menyediakan beberapa fitur baru di Oracle Database 12c, serta produk yang tersedia sebelumnya yang ditingkatkan di versi baru. Ini mencakup teknologi Kontinuitas Aplikasi untuk pemutaran ulang transaksi yang sedang berlangsung secara andal, Active Data Guard Far Sync untuk perlindungan lengkap terhadap kehilangan data setiap kali replika dihapus dari database utama, ekstensi GoldenGate baru untuk pembaruan dan migrasi tanpa downtime, dan Layanan Data Global untuk manajemen otomatis dan penyeimbangan beban untuk replikasi database. Meskipun setiap teknologi memerlukan upaya yang signifikan untuk diterapkan, teknologi ini memberikan manfaat yang signifikan untuk aplikasi yang sangat penting di mana waktu henti (downtime) dan kehilangan data tidak dapat diterima.

    Tabel berikut merangkum atribut ketersediaan tinggi (HA) dan perlindungan data yang dibangun dalam setiap arsitektur referensi.

    KETERSEDIAAN TINGGI DAN PERLINDUNGAN DATA

    –  –  –

    Arsitektur referensi MAA secara inheren dirancang untuk memecahkan masalah yang kontradiktif.

    Di satu sisi, tidak semua aplikasi memiliki persyaratan ketersediaan dan perlindungan data yang tinggi. Di sisi lain, arsitektur standar merupakan persyaratan operasional dan keharusan bisnis jika kompleksitas dan biaya ingin dikurangi.

    Arsitektur referensi MAA memperhitungkan kedua realitas dan menyediakan infrastruktur yang dioptimalkan untuk Oracle Database dan memungkinkan Anda mengatur tingkat HA yang tepat untuk kebutuhan tingkat layanan yang berbeda. Hal ini memudahkan untuk memindahkan database Anda ke tingkat berikutnya jika persyaratan bisnis berubah atau

    3 | ARSITEKTUR REFERENSI ORACLE MAA - DASAR PENDEKATAN DBAAS (DATABASE AS A SERVICE)

    berpindah dari satu platform perangkat keras ke platform perangkat keras lainnya.

    Bagian berikut menjelaskan setiap arsitektur referensi secara lebih rinci.

    Perunggu: Instance Tunggal Tingkat perunggu menyediakan layanan basis data dasar dengan biaya terendah. Biaya dan kompleksitas implementasi berkurang karena rendahnya tingkat ketersediaan dan perlindungan data. Pada Gambar. 3 menunjukkan gambaran umum level Perunggu.

    Tingkat perunggu menggunakan satu instance Oracle Database; tidak ada teknologi pengelompokan yang digunakan jika terjadi kegagalan server untuk secara otomatis melakukan failover ke cadangan yang memiliki instance Oracle Database yang sedang berjalan. Jika server atau database gagal, tujuan waktu pemulihan (RTO) bergantung pada seberapa cepat perangkat keras pengganti dapat disediakan atau dipulihkan dari cadangan. Dalam skenario terburuk penghentian situs secara menyeluruh, waktu tambahan akan diperlukan untuk menyelesaikan tugas-tugas ini pada node cadangan, dan dalam beberapa kasus, hal ini mungkin memerlukan waktu berhari-hari.

    Tingkat perunggu: RTO instan tunggal dalam hitungan menit hingga hari, RPO sejak pencadangan terakhir. 3. Arsitektur referensi ketersediaan tinggi Bronze Oracle Recovery Manager (RMAN) digunakan untuk pencadangan reguler Oracle Database.

    Potensi kehilangan data, disebut tujuan titik pemulihan (RPO), adalah semua data yang dihasilkan sejak pencadangan terakhir. Salinan cadangan basis data juga disimpan di pusat data jarak jauh atau cloud untuk keperluan pengarsipan dan pemulihan bencana jika terjadi bencana di pusat data utama.

    Level Perunggu terdiri dari komponen utama yang dijelaskan pada bagian berikut.

    Ketersediaan Tinggi dan Perlindungan Data di Oracle Database Tingkat Bronze memanfaatkan fitur ketersediaan tinggi dan perlindungan data berikut yang disertakan dengan Oracle Database Enterprise Edition tanpa biaya tambahan.

    Oracle Restart secara otomatis me-restart database, Listener, dan komponen lainnya"

    Oracle setelah kegagalan perangkat keras atau perangkat lunak atau setiap kali komputer database dihidupkan ulang.

    Perlindungan kerusakan Oracle memeriksa fisik »

    kerusakan dan kerusakan intra-blok logis. Kerusakan data di memori akses acak terdeteksi dan tidak berakhir di disk. Dalam banyak kasus masalah ini dapat diselesaikan secara otomatis. Untuk informasi lebih lanjut, lihat Mencegah, Mendeteksi, dan Memperbaiki Korupsi Blok untuk Oracle Database.

    Manajemen Penyimpanan Otomatis (ASM) - sistem file terintegrasi Oracle »

    4 | ARSITEKTUR REFERENSI ORACLE MAA - DASAR PENDEKATAN DBAAS (DATABASE AS A SERVICE)

    dan manajer volume dengan mirroring otomatis untuk melindungi dari kegagalan disk.

    Oracle Flashback Technologies - sekelompok fungsi yang menyediakan perbaikan cepat »

    kesalahan berbagai jenis, diperlukan untuk memulihkan transaksi, tabel, atau seluruh database tertentu.

    Oracle Recovery Manager (RMAN) menyediakan cadangan yang hemat biaya dan andal »

    pencadangan dan pemulihan yang dioptimalkan untuk Oracle Database.

    Pemeliharaan Online adalah fitur yang mencakup override dan reorganisasi"

    data tanpa henti untuk pemeliharaan basis data, transfer file, dan patching.

    Konsolidasi Basis Data di Tingkat Perunggu Basis data yang diterapkan di tingkat Perunggu mencakup basis data untuk pengembangan dan pengujian, serta untuk kelompok kerja kecil dan aplikasi departemen, yang sering kali merupakan kandidat utama untuk konsolidasi basis data dan basis data sebagai layanan (DBaaS) ).

    Oracle Multitenant adalah metodologi MAA untuk konsolidasi dan virtualisasi database, dimulai dengan Oracle Database 12c. Opsi konsolidasi lainnya adalah sebagai berikut.

    Virtualisasi sistem operasi - beberapa mesin virtual pada satu mesin host fisik »

    Konsolidasi skema - skema aplikasi berbeda dalam satu database »

    Konsolidasi platform - beberapa database terpisah pada satu mesin fisik atau dalam satu »

    Klaster Oracle RAC Pertukaran antara Oracle Multitenant dan metode konsolidasi lainnya dibahas dalam buku putih Arsitektur Ketersediaan Maksimum Oracle, “Praktik Terbaik Ketersediaan Tinggi untuk Konsolidasi Basis Data.”

    Manajemen siklus hidup dan penyediaan database sebagai layanan (DBaaS) Oracle Enterprise Manager Cloud Control - memastikan penerapan sumber daya TI oleh pengguna sesuai dengan model kumpulan sumber daya untuk arsitektur multi-penyewa yang berbeda. Kemampuan ini diperlukan untuk mengimplementasikan pendekatan DBaaS (database as a service) - sebuah paradigma di mana pengguna akhir (DBA, pengembang aplikasi, insinyur kualitas layanan, manajer proyek, dll.) dapat meminta layanan database, menggunakannya untuk proyek seumur hidup siklus, lalu lepaskan dan kembalikan ke kumpulan sumber daya. Cloud Control Database as a Service (DBaaS) menyediakan hal berikut:

    Platform konsolidasi umum untuk menyediakan layanan database »

    Model layanan mandiri untuk menyebarkan sumber daya ini"

    Peningkatan dan penurunan sumber daya basis data yang fleksibel »

    Hanya mengenakan biaya untuk sumber daya database yang digunakan »

    Oracle Engineered Systems Oracle Engineered Systems mengurangi biaya siklus hidup dengan melakukan standarisasi pada platform yang sudah terintegrasi dan dioptimalkan untuk Oracle Database dan aplikasi. Suite Oracle Engineered Systems mencakup yang berikut ini.

    Oracle Virtual Compute Appliance - menyederhanakan instalasi dan penerapan secara signifikan bagi pelanggan »

    infrastruktur virtual untuk aplikasi Linux, Oracle Solaris atau Microsoft Windows, serta pengelolaannya.

    Oracle Database Appliance - paket perangkat lunak dan sistem penyimpanan yang murah dan komprehensif »

    alat data, server, dan jaringan yang mengurangi kompleksitas dan menghemat waktu dan uang dengan menyederhanakan

    5 | ARSITEKTUR REFERENSI ORACLE MAA - DASAR PENDEKATAN DBAAS (DATABASE AS A SERVICE)

    penyebaran, pemeliharaan dan dukungan database dan aplikasi. Oracle Database Appliance mendukung penerapan fisik dan virtual.

    Kompleks perangkat keras dan perangkat lunak Oracle Exadata Database Machine - yang berkinerja paling tinggi, »

    platform yang skalabel dan dapat diakses untuk menjalankan Oracle Database. Mesin Basis Data Oracle Exadata bekerja dengan semua jenis aplikasi, termasuk pemrosesan transaksi online (OLTP), gudang data (DW), dan konsolidasi aplikasi beban campuran, menciptakan landasan ideal untuk konsolidasi basis data.

    Oracle SuperCluster - sistem khusus yang ideal untuk konsolidasi database dan »

    aplikasi, penerapan cloud pribadi, dan perangkat lunak Oracle pada satu platform terpadu. Oracle SuperCluster menggunakan prosesor tercepat di dunia berdasarkan arsitektur SPARC dan penyimpanan Exadata.

    Oracle ZFS Storage Appliance Menghadirkan Manfaat Penghematan Disk Langsung"

    ruang, manajemen, dan penghematan biaya bagi pelanggan yang menggunakan penyimpanan terpasang jaringan (NAS). Oracle ZFS menyertakan paket perangkat lunak kaya fitur untuk manajemen, pemantauan, pemecahan masalah, snapshot, kloning, replikasi, dan layanan penyimpanan tambahan, yang secara alami melengkapi semua Oracle Engineered Systems.

    Ringkasan Tingkat Perunggu: Perlindungan Data, RTO, dan RPO Tabel di bawah ini merangkum semua kemampuan perlindungan data tingkat Perunggu. Kolom pertama Tabel 2 menunjukkan kapan pemeriksaan dilakukan untuk kerusakan data fisik dan logis.

    Pemeriksaan manual dimulai oleh administrator atau secara berkala"

    tugas terjadwal yang melakukan pemeriksaan berkala.

    Pemeriksaan on-the-fly terus-menerus dilakukan oleh proses latar belakang saat database terbuka.

    Pemeriksaan latar belakang dilakukan secara berkala tertentu, namun hanya jika »

    periode ketika sumber daya tidak digunakan.

    Setiap pemeriksaan bersifat unik untuk Oracle Database dan menggunakan pengetahuan khusus tentang struktur blok data Oracle dan log database.

    PERLINDUNGAN DATA PERUNGGU

    –  –  –

    Harap dicatat bahwa fitur pemeriksaan HARD dan Penggosokan dan Perbaikan Hard Disk Otomatis bersifat unik untuk sistem penyimpanan Exadata. Berkat pemeriksaan HARD, Oracle Database tidak menulis blok yang rusak secara fisik ke disk. Penggosokan dan Perbaikan Hard Disk Otomatis secara berkala mengidentifikasi dan memperbaiki hard drive dengan sektor buruk atau usang (kluster penyimpanan), dan mendeteksi serta memperbaiki cacat fisik dan logis lainnya ketika sumber daya tersedia.

    Exadata mengirimkan permintaan ke ASM untuk memperbaiki bad sector dengan membaca data dari salinan mirror lain. Secara default, pembersihan disk (scrub) dilakukan setiap dua minggu.

    6 | ARSITEKTUR REFERENSI ORACLE MAA - DASAR PENDEKATAN DBAAS (DATABASE AS A SERVICE)

    Tabel berikut menunjukkan RTO dan RPO Perunggu untuk berbagai pemadaman terencana dan tidak terencana.

    WAKTU PEMULIHAN (RTO) DAN KEMUNGKINAN KEHILANGAN DATA (RPO) PADA TINGKAT PERUNGGU

    –  –  –

    Perak: Ketersediaan Tinggi dengan Failover Otomatis Perak dibangun di atas Perunggu tetapi mencakup teknologi pengelompokan untuk meningkatkan ketersediaan selama waktu henti yang tidak direncanakan dan pemeliharaan terjadwal (Gambar 4). Tingkat Silver menggunakan teknologi clustering Oracle RAC atau Oracle RAC One Node untuk menyediakan ketersediaan tinggi di pusat data. Hal ini dicapai dengan secara otomatis beralih ke cadangan jika salah satu instance database dimatikan atau jika terjadi kegagalan total pada server tempat instance database berjalan. Oracle RAC memberikan keuntungan signifikan lainnya - ini menghilangkan berbagai jenis downtime yang direncanakan karena kemampuan untuk memelihara node cluster Oracle RAC satu per satu. Tingkat Silver: ketersediaan tinggi dengan RTO failover yang cepat dalam hitungan detik jika terjadi kegagalan server, RPO sejak pencadangan terakhir Ara. 4. Arsitektur Referensi Ketersediaan Tinggi Perak

    7 | ARSITEKTUR REFERENSI ORACLE MAA - DASAR PENDEKATAN DBAAS (DATABASE AS A SERVICE)

    Tingkat Perak mencakup komponen ketersediaan tinggi yang dijelaskan di bagian berikut.

    Oracle Real Application Clusters (Oracle RAC) Oracle RAC meningkatkan ketersediaan aplikasi dalam pusat data jika terjadi kegagalan pada instance database atau server tempat instance tersebut berjalan. Beralih ke server cadangan dengan Oracle RAC terjadi secara instan. Waktu yang diperlukan untuk memulihkan layanan pada instance yang tersisa dan menghubungkan kembali pengguna dari node yang gagal hampir tidak terlihat.

    Juga tidak ada waktu henti untuk tugas pemeliharaan terjadwal, yang dapat dilakukan satu per satu di seluruh node Oracle RAC. Pengguna menyelesaikan pekerjaannya dan menutup sesi mereka di node tempat layanan akan dilakukan. Saat terhubung kembali, mereka mendapatkan akses ke instance database yang sudah berjalan di node lain.

    Tinjauan singkat tentang cara kerja cluster Oracle RAC membantu Anda memahami manfaatnya. Ada dua komponen: instance Oracle Database dan Oracle Database itu sendiri.

    Sebuah instance database didefinisikan sebagai kumpulan proses server dan struktur memori yang berjalan"

    pada satu node (atau server) dan membuat database spesifik tersedia untuk klien.

    Basis data - kumpulan file tertentu dengan akses bersama (file data, file indeks, »

    file kontrol dan file inisialisasi) yang disimpan pada disk dan bersama-sama dapat dibuka dan digunakan untuk membaca dan menulis data.

    Oracle RAC menggunakan arsitektur aktif-aktif di mana terdapat beberapa instance database"

    data berjalan node yang berbeda, untuk membaca dan menulis data secara bersamaan dalam database yang sama.

    Arsitektur aktif-aktif cluster Oracle RAC memberikan manfaat berikut.

    Meningkatkan ketersediaan tinggi. Kegagalan server atau database tidak mempengaruhi »

    koneksi ke instance yang tersisa, dan koneksi ke instance yang gagal dengan cepat ditransfer ke instance lain yang sudah berjalan dan terbuka di server lain di cluster.

    Skalabilitas. Oracle RAC Cluster sangat ideal untuk aplikasi dan lingkungan konsolidasi di mana »

    Diperlukan skalabilitas dan kemampuan untuk menambah dan memprioritaskan daya komputasi secara dinamis di lebih dari satu server. Sebuah database tunggal dapat menjalankan instance pada satu atau lebih node cluster. Demikian pula, layanan database yang sama dapat tersedia pada satu atau lebih contoh database. Node tambahan, instans database, dan layanan database dapat didefinisikan ulang tanpa menghentikan cluster. Kemampuan untuk mendistribusikan beban kerja dengan mudah ke seluruh cluster menjadikan Oracle RAC pelengkap ideal untuk Oracle Multitenant.

    Performa yang andal. Oracle Quality of Service (QoS) dapat digunakan untuk menetapkan »

    sumber daya untuk layanan basis data prioritas tinggi dan memastikan kinerja tinggi yang konsisten dalam lingkungan basis data terkonsolidasi. Kekuatan komputasi dapat dialokasikan kembali secara dinamis untuk beradaptasi dengan cepat terhadap perubahan kebutuhan.

    Ketersediaan tinggi selama pemeliharaan terjadwal. Ketersediaan tinggi terjamin berkat »

    membuat perubahan pada node Oracle RAC satu per satu. Hal ini mencakup pemeliharaan perangkat keras, OS, atau jaringan ketika server perlu dibuat offline, melakukan patching tumpukan perangkat lunak atau database Oracle Grid Infrastructure, dan pemeliharaan ketika instance database perlu dipindahkan ke server lain untuk meningkatkan daya pemrosesan atau penyeimbangan beban.

    Oracle RAC adalah praktik terbaik MAA untuk ketersediaan server yang tinggi.

    Oracle RAC One Node Oracle RAC One Node memberikan alternatif terhadap cluster Oracle RAC Silver ketika ketersediaan server yang tinggi diperlukan namun skalabilitas dan failover instan tidak diperlukan. Lisensi Oracle RAC One Node berharga setengah harga Oracle RAC dan merupakan alternatif yang lebih murah jika menit RTO mencukupi jika terjadi kegagalan server.

    8 | ARSITEKTUR REFERENSI ORACLE MAA - DASAR PENDEKATAN DBAAS (DATABASE AS A SERVICE)

    Oracle RAC One Node - teknologi peralihan aktif-pasif. Ini didasarkan pada infrastruktur yang sama dengan Oracle RAC, tetapi dalam kasus Oracle RAC One Node, hanya satu instance database yang dibuka pada satu waktu selama operasi normal.

    Jika server yang menghosting database terbuka gagal, Oracle RAC One Node secara otomatis menjalankan instance database baru pada node kedua untuk memulihkan layanan dengan cepat.

    Oracle RAC One Node memiliki sejumlah keunggulan dibandingkan teknologi clustering aktif-pasif lainnya.

    Dalam konfigurasi Oracle RAC One Node, Oracle Database HA Services, Infrastruktur Grid, dan pendengar database selalu berjalan di node kedua. Selama failover, hanya instans database dan layanan database yang diperlukan untuk memulai, sehingga mempercepat pemulihan layanan dan memungkinkan layanan dimulai ulang dalam hitungan menit.

    Untuk pemeliharaan terjadwal, Oracle RAC One Node memberikan manfaat yang sama seperti Oracle RAC. Dalam cluster RAC One Node, selama pemeliharaan terjadwal, dua instance database aktif dapat memastikan kelancaran migrasi pengguna dari satu node ke node lainnya tanpa downtime. Pemeliharaan node dilakukan dalam mode bergulir, dan selama ini layanan database tetap tersedia bagi pengguna.

    Kesimpulan pada level Silver: perlindungan data, RTO dan RPO Tingkat perlindungan data sama dengan pada level Bronze. Peningkatan pada level Silver dibandingkan dengan level Bronze berkaitan dengan RTO jika terjadi kegagalan server dan aktivitas pemeliharaan terjadwal tertentu yang sering dilakukan. Area peningkatan dibandingkan dengan level Perunggu ditunjukkan dengan huruf tebal pada tabel berikut.

    WAKTU PEMULIHAN (RTO) DAN KEMUNGKINAN KEHILANGAN DATA (RPO) PADA TINGKAT PERAK

    –  –  –

    Emas: Ketersediaan Tinggi yang Komprehensif dan Perlindungan Failover Gold dibangun di atas Perak namun menggunakan teknologi replikasi basis data untuk menghilangkan satu titik kegagalan yang dapat melumpuhkan seluruh sistem, dan secara signifikan meningkatkan perlindungan dan ketersediaan data untuk semua jenis kegagalan yang tidak direncanakan, termasuk kerusakan data, kegagalan basis data dan kegagalan pusat data. Memiliki salinan yang direplikasi juga secara signifikan mengurangi waktu henti selama periode pemeliharaan terjadwal. Gambaran umum level Emas ditunjukkan pada Gambar. 5.

    9 | ARSITEKTUR REFERENSI ORACLE MAA - DASAR PENDEKATAN DBAAS (DATABASE AS A SERVICE)

    RTO dikurangi menjadi detik atau menit, dan RPO dikurangi menjadi nol atau mendekati nol tergantung pada konfigurasinya.

    Emas: Ketersediaan tinggi yang komprehensif dan kemampuan failover RTO dari detik ke menit, RPO hingga nol atau mendekati nol. 5. Arsitektur Referensi Ketersediaan Tinggi Emas Perhatikan bahwa tingkat Emas menggunakan Oracle RAC sebagai standar untuk ketersediaan tinggi server, bukan Oracle RAC One Node yang kurang berkemampuan yang tersedia di tingkat Perak.

    Tingkat Emas menambahkan komponen untuk tingkat layanan yang lebih tinggi yang dijelaskan di bagian berikut.

    Oracle Active Data Guard - Perlindungan Data Real-Time dan Ketersediaan Tinggi Oracle Active Data Guard memelihara satu atau lebih replika fisik yang tersinkronisasi (database siaga) pada node jarak jauh untuk menghilangkan satu titik kegagalan yang dapat menyebabkan kegagalan database utama. Berdasarkan praktik terbaik MAA, disarankan untuk menggunakan konfigurasi yang sama untuk database utama dan database standby (CPU, memori, I/O, dll.) sehingga database standby, ketika dilakukan failover, dapat memberikan kinerja yang sama seperti dan yang utama asli.

    Active Data Guard menambahkan kemampuan berikut pada level Gold.

    Pilih perlindungan untuk kehilangan data nol atau mendekati nol. Kinerja Penjaga Data Aktif »

    replikasi perubahan dari database utama ke database cadangan secara real time. Perubahan didorong langsung dari buffer log database utama untuk meminimalkan latensi replikasi dan dampaknya pada database utama, dan untuk sepenuhnya mengisolasi proses replikasi dari kerusakan yang mungkin terjadi di tumpukan I/O database produksi.

    Administrator dapat memilih transmisi sinkron dalam mode keamanan Ketersediaan Maksimum.

    ketersediaan) untuk memastikan tidak ada kehilangan data. Atau mereka dapat memilih transfer asinkron dalam mode Performa Maksimum dengan kehilangan data hampir nol. Mode Performa Maksimum dapat membatasi kemungkinan kehilangan data hingga kurang dari satu detik jika bandwidth jaringan mencukupi untuk ukuran data yang direplikasi.

    Data Guard dan Active Data Guard adalah satu-satunya teknologi replikasi Oracle yang memberikan perlindungan"

    tanpa kehilangan data.

    Basis data siaga Oracle Active Data Guard dapat dengan cepat mengambil alih beban produksi"

    dan memulihkan layanan jika kegagalan basis data atau penghentian situs komputasi membuat basis data utama tidak tersedia. Oracle Database selalu berjalan, tidak perlu di-restart, dan transfer peran database utama dapat diselesaikan dalam waktu kurang dari 60 detik, bahkan pada sistem dengan beban berat.

    10 | ARSITEKTUR REFERENSI ORACLE MAA - DASAR PENDEKATAN DBAAS (DATABASE AS A SERVICE)

    Level emas menggunakan Fast-Start Failover Data Guard untuk failover otomatis"

    database untuk cadangan. Hal ini mempercepat pemulihan dengan menghilangkan penundaan dalam memberi tahu administrator sehingga mereka dapat bereaksi terhadap kegagalan. Fast Start Failover menggunakan layanan database berbasis peran dan teknologi pemberitahuan klien Oracle untuk memungkinkan aplikasi dengan cepat memutuskan sambungan dari database utama yang gagal dan secara otomatis terhubung ke database utama baru. Mentransfer peran database dapat dilakukan secara manual melalui antarmuka baris perintah atau Oracle Enterprise Manager.

    Replikasi transparan. Data Guard dan Active Data Guard berfungsi penuh, fisik satu arah"

    replikasi Oracle Database dengan karakteristik sebagai berikut: kinerja tinggi, kemudahan pengelolaan, dukungan untuk semua jenis data, aplikasi dan jenis beban kerja, seperti DML, DDL, OLTP, pemrosesan batch dan gudang data, serta database konsolidasi. Data Guard dan Active Data Guard terintegrasi erat dengan teknologi Oracle RAC, ASM, RMAN, dan Oracle Flashback.

    Alihkan beban kerja dari database produksi untuk laba atas investasi yang lebih besar. Basis Data Cadangan Oracle »

    Active Data Guard dapat dibuka hanya-baca saat replikasi sedang berjalan. Basis data siaga aktif yang diperbarui sangat ideal untuk memigrasikan kueri SQL berat dan pelaporan dari basis data utama.

    Hal ini meningkatkan ROI sistem siaga dan kinerja database utama dengan memanfaatkan daya komputasi yang seharusnya tidak digunakan. Aplikasi juga terus dipantau untuk memastikan bahwa database siaga siap mengambil alih beban jika database utama down.

    Membebaskan database utama dari tugas cadangan. Sistem utama dan cadangan adalah »

    salinan fisik yang tepat satu sama lain, yang memungkinkan Anda mentransfer tugas cadangan dari database utama ke database cadangan. Cadangan yang dibuat pada database siaga dapat digunakan untuk memulihkan database utama atau siaga. Hal ini memberikan fleksibilitas kepada administrator dalam proses pemulihan tanpa mengharuskan sistem produksi menanggung beban pencadangan.

    Mengurangi waktu henti untuk pemeliharaan terjadwal. Basis data cadangan dapat digunakan untuk memperbarui ke »

    patchset baru (misalnya, patch untuk migrasi dari versi 11.2.0.2 ke 11.2.0.4) atau untuk migrasi ke versi baru Oracle (misalnya, dari 11.2 ke 12.1) satu per satu: pertama database cadangan diperbarui, setelah itu menjadi produksi dengan versi baru. Waktu henti keseluruhan dikurangi menjadi waktu peran database utama ditransfer ke database siaga dan waktu pengguna beralih ke database utama baru setelah pemutakhiran selesai.

    Basis data siaga Oracle Active Data Guard terus-menerus memeriksa data untuk memastikan bahwa tidak ada »

    kerusakan tidak dapat disalin dari database sumber. Oracle Active Data Guard mendeteksi kerusakan blok fisik dan logis yang mungkin terjadi di database utama atau siaga. Ia juga unik dalam mendeteksi kerusakan penulisan blok (penulisan yang hilang atau terbuang dianggap berhasil oleh subsistem I/O). Informasi tambahan tersedia di Catatan Dukungan Oracle Saya 1302539.1 - Praktik Terbaik untuk Deteksi Korupsi, Pencegahan, dan Perbaikan Otomatis.

    Pemulihan blok otomatis. Oracle Active Data Guard secara otomatis memperbaiki kerusakan pada »

    tingkat blok, disebabkan oleh kesalahan I/O acak yang dapat terjadi pada database primer dan standby. Hal ini dilakukan dengan mengambil salinan blok yang bagus dari database yang berlawanan. Tidak diperlukan perubahan aplikasi, dan perbaikannya lancar bagi pengguna.

    Hal di atas juga menjelaskan mengapa tingkat Gold menggunakan teknologi replikasi untuk memelihara salinan yang disinkronkan daripada produk pencerminan penyimpanan jarak jauh (SRDF, Hitachi TrueCopy, dll.). Untuk informasi selengkapnya tentang perbedaan ini, lihat Oracle Active Data Guard vs. Storage Remote Mirroring (Perbandingan Oracle Active Data Guard dan mirroring penyimpanan jarak jauh).

    Oracle GoldenGate Perangkat lunak Oracle GoldenGate menyediakan replikasi logis untuk memelihara salinan tersinkronisasi (database target) dari database master (database sumber). Oracle GoldenGate membaca perubahan dari disk database sumber, menerjemahkan data ke dalam format file platform-independen, memasukkan file ke database target, dan kemudian mengubah data menjadi pernyataan SQL (memperbarui, menyisipkan, dan menghapus) asli ke database target . Basis data target berisi data yang sama, namun bukan lagi basis data sumber, melainkan basis data yang berbeda (misalnya, salinan cadangan tidak dapat dipertukarkan). Replikasi logis lebih dari itu

    11 | ARSITEKTUR REFERENSI ORACLE MAA - DASAR PENDEKATAN DBAAS (DATABASE AS A SERVICE)

    lebih kompleks daripada replikasi fisik, namun memberikan lebih banyak fleksibilitas untuk skenario replikasi yang berbeda dan di seluruh platform yang heterogen.

    Dari perspektif distribusi data, replikasi logis dirancang agar hemat biaya"

    replikasi subset dari database sumber untuk mendistribusikan data ke database target lainnya. Ini juga dapat digunakan untuk menggabungkan data dari beberapa database sumber ke dalam satu database target (misalnya, Penyimpanan Data Operasional).

    Dari perspektif ketersediaan tinggi, replikasi logis dapat digunakan untuk memelihara »

    replika penuh database sumber untuk ketersediaan tinggi atau perlindungan failover, peralihan ke database siaga dapat segera dilakukan.

    Replikasi logis Oracle GoldenGate memungkinkan pemeliharaan yang fleksibel dan »

    migrasi satu per satu jika hal ini tidak memungkinkan dengan replikasi Data Guard. Misalnya, Oracle GoldenGate menyediakan replikasi dari database sumber pada platform big-endian ke database target pada platform little-endian (replikasi cross-endian). Hal ini memberi Anda manfaat tambahan dari migrasi platform-ke-platform: Anda dapat membalikkan arah replikasi untuk segera kembali ke versi sebelumnya setelah migrasi.

    Replikasi logis Oracle GoldenGate adalah proses yang lebih kompleks dengan lebih banyak prasyarat daripada Data Guard. Namun hal ini diimbangi dengan kemampuan unik Oracle GoldenGate dalam menyediakan jenis replikasi modern. Praktik Terbaik MAA: Oracle Active Data Guard dan Oracle GoldenGate memberikan informasi tambahan untuk memilih teknologi replikasi yang optimal atau menggunakan kedua teknologi tersebut sebagai pelengkap.

    Oracle Site Guard Oracle Site Guard memungkinkan administrator untuk mengoordinasikan peralihan terencana dan tidak terencana (jika terjadi pemadaman sumber daya utama yang tidak terduga) dari seluruh lingkungan Oracle (beberapa database dan aplikasi) antara lokasi produksi dan situs jarak jauh. Oracle Site Guard disertakan dalam Paket Manajemen Siklus Hidup Oracle Enterprise Manager.

    Oracle Site Guard memberikan manfaat sebagai berikut.

    Mengurangi jumlah kesalahan berkat respons yang siap terhadap kegagalan node. Penjaga Situs Oracle »

    mengurangi kemungkinan kesalahan manusia jika terjadi kecelakaan. Strategi pemulihan dikembangkan, diuji, dan diuji terhadap kegagalan dalam aplikasi. Jika administrator memulai operasi Penjaga Situs untuk memulihkan kegagalan yang sangat besar, intervensi manusia tidak diperlukan.

    Koordinasi beberapa aplikasi, database dan berbagai teknologi replikasi. Situs Oracle »

    Guard secara otomatis menangani ketergantungan antara berbagai komponen saat situs dimulai atau dihentikan.

    Site Guard terintegrasi dengan Oracle Active Data Guard untuk mengoordinasikan failover beberapa database secara bersamaan. Site Guard juga menyediakan mekanisme yang mudah untuk mengintegrasikan produk mirroring penyimpanan jarak jauh. Perangkat lunak ini terintegrasi dengan perangkat penyimpanan untuk failover terjadwal atau darurat. Untuk melakukan ini, skrip transfer peran tertentu untuk sistem penyimpanan dipanggil.

    Mempercepat pemulihan. Oracle Site Guard Automation Meminimalkan Manual »

    koordinasi operasi pemulihan. Ini mempercepat pemulihan bahkan dibandingkan dengan kasus ketika semua operasi manual berhasil diselesaikan. Site Guard juga menghemat waktu dengan menghilangkan kebutuhan untuk menangani kesalahan manusia yang sering terjadi saat melakukan prosedur rumit secara manual.

    12 | ARSITEKTUR REFERENSI ORACLE MAA - DASAR PENDEKATAN DBAAS (DATABASE AS A SERVICE)

    Ringkasan Tingkat Emas: Perlindungan Data, RTO, dan RPO Tabel berikut menunjukkan kemampuan perlindungan data, RTO, dan RPO tingkat Emas.

    Area perbaikan ditandai dengan huruf tebal.

    PERLINDUNGAN DATA TINGKAT EMAS

    –  –  –

    13 | ARSITEKTUR REFERENSI ORACLE MAA - DASAR PENDEKATAN DBAAS (DATABASE AS A SERVICE)

    Platinum: Tanpa Waktu Henti untuk Aplikasi Siap untuk Tingkat Layanan Platinum Platinum dibuat berdasarkan Gold dan memberikan ketersediaan tingkat tinggi serta perlindungan data untuk aplikasi di mana pemadaman atau kehilangan data benar-benar tidak dapat diterima. Level Platinum menyediakan beberapa fitur baru di Oracle Database 12c, serta produk yang tersedia sebelumnya yang ditingkatkan di versi baru.

    Platinum membuat pemadaman tidak terlihat oleh aplikasi dan pengguna, dan bahkan transaksi yang sedang berlangsung pada saat pemadaman akan diulangi dengan cepat setelah pemulihan. Tidak ada waktu henti untuk pemeliharaan, migrasi, dan pembaruan aplikasi. Kehilangan data nol dijamin jika database utama gagal karena alasan apa pun, terlepas dari jarak antara node utama dan cadangan. Tingkat Platinum juga secara otomatis mengelola ketersediaan layanan database dan penyeimbangan beban di seluruh replika di beberapa node. Gambaran umum level Platinum ditunjukkan pada Gambar. 6.

    Tingkat Platinum Tidak ada waktu henti untuk aplikasi yang mendukung Platinum

    –  –  –

    Beras. 6. Arsitektur Referensi Ketersediaan Tinggi Platinum Banyak aplikasi memerlukan perubahan kecil untuk sepenuhnya menghilangkan waktu henti di tingkat Platinum. Itu sebabnya kami mengatakan Platinum hanya memberikan waktu henti nol (zero downtime) pada aplikasi yang mendukung Platinum. Harap dicatat bahwa tidak diperlukan perubahan aplikasi agar tidak ada kehilangan data.

    Tingkat Platinum menggunakan fitur ketersediaan tinggi yang dijelaskan di bagian berikut.

    Teknologi Kontinuitas Aplikasi Teknologi Kontinuitas Aplikasi melindungi aplikasi dari gangguan sesi database karena kegagalan suatu instance, server, sistem penyimpanan, jaringan, komponen lain, atau bahkan seluruh database. Teknologi Kontinuitas Aplikasi memutar ulang transaksi yang sedang berlangsung pada saat pemutusan sambungan; untuk aplikasi, hanya ada sedikit penundaan dalam eksekusi, yang tidak terlihat oleh pengguna.

    Jika seluruh cluster Oracle RAC gagal dan database menjadi tidak tersedia, teknologi Kontinuitas Aplikasi memutar ulang sesi, termasuk transaksi yang diinginkan, setelah failover ke database siaga menggunakan Oracle Active Data Guard. Menggunakan Kontinuitas Aplikasi dengan database siaga memerlukan Ketersediaan Maksimum Data Guard dan Fast Start Failover Data Guard.

    14 | ARSITEKTUR REFERENSI ORACLE MAA - DASAR PENDEKATAN DBAAS (DATABASE AS A SERVICE)

    Oracle Active Data Guard Far Sync Data Guard dan Active Data Guard adalah satu-satunya teknologi replikasi Oracle yang menyediakan zero data loss failover untuk Oracle Database. Kehilangan data nol dicapai menggunakan transmisi sinkron dalam mode Ketersediaan Maksimum Data Guard. Jika transfer sinkron digunakan, latensi jaringan selama transfer data antara node utama dan cadangan memengaruhi performa database. Semakin besar jarak antar node maka semakin besar waktu tunggu dan dampaknya terhadap kinerja database. Karena pusat data utama dan cadangan sering kali berlokasi berjauhan, memilih nol kehilangan data tidak praktis untuk banyak database.

    Active Data Guard Far Sync menghilangkan keterbatasan di atas, memastikan tidak ada kehilangan data tanpa menurunkan kinerja database utama, bahkan ketika database utama dan database siaga terletak ratusan atau bahkan ribuan kilometer jauhnya. Hal ini dicapai melalui mekanisme transfer "ringan" yang mudah diterapkan dan transparan terhadap failover Oracle Active Data Guard atau operasi failover terjadwal. Ketika Far Sync digunakan dengan Oracle Advanced Compression Option, Far Sync juga memampatkan data untuk transmisi di luar situs utama guna menghemat bandwidth jaringan.

    Saat Kontinuitas Aplikasi digunakan dengan Far Sync dalam mode Fast-Start-Failover Data Guard, hal ini dapat membuat pemadaman tidak terlihat oleh transaksi yang berjalan pada saat itu, terlepas dari jarak antara node utama dan node siaga.

    Singkatnya, Far Sync memberikan dua manfaat tambahan utama dari tingkat Platinum: failover tanpa kehilangan data untuk database apa pun dan kemampuan untuk menggunakan teknologi Kontinuitas Aplikasi terlepas dari jarak antar node. Active Data Guard Far Sync adalah mode baru di Oracle Database 12c. Tidak diperlukan perubahan aplikasi untuk memanfaatkan Far Sync.

    Pemeliharaan Tanpa Waktu Henti dengan GoldenGate dan Replikasi Aktif-Aktif

    Tingkat Platinum memanfaatkan kemampuan replikasi tingkat lanjut Oracle GoldenGate untuk pemeliharaan dan migrasi tanpa waktu henti menggunakan replikasi dua arah. Pertimbangkan skenario berikut.

    Pemeliharaan pertama kali dilakukan pada database target.

    Basis data sumber dan target disinkronkan untuk versi basis data yang berbeda menggunakan replikasi logis"

    Oracle Gerbang Emas. Hal ini memungkinkan migrasi antar platform dengan langsung dan dalam urutan terbalik byte (lintas-endian). Hal ini juga memungkinkan pembaruan aplikasi kompleks yang mengubah objek server di mana mesin replikasi harus mengonversi data dari versi lama ke versi baru atau sebaliknya.

    Ketika versi baru platform distabilkan dan stabil, replikasi dua arah memungkinkan untuk "

    pengguna dapat secara bertahap dan tanpa waktu henti bermigrasi ke platform baru saat mereka menyelesaikan sesi mereka di versi sebelumnya dan terhubung ke platform baru. Replikasi dua arah Oracle GoldenGate menjaga versi lama dan baru tetap sinkron selama migrasi. Ini juga memungkinkan Anda dengan cepat kembali ke versi lama jika muncul masalah tak terduga dengan versi baru saat beban ditambahkan.

    Replikasi aktif-aktif dua arah juga dapat digunakan untuk meningkatkan tingkat ketersediaan layanan ketika beberapa salinan data yang sama perlu dihubungkan secara terus-menerus untuk membaca dan menulis.

    Replikasi dua arah tidak transparan bagi aplikasi. Penting untuk mendeteksi dan menyelesaikan konflik ketika perubahan dilakukan secara bersamaan pada catatan yang sama di beberapa database. Pengaruhnya juga perlu diperhitungkan jenis yang berbeda kegagalan dan penundaan replikasi. Jika replikasi dua arah GoldenGate digunakan untuk pembaruan aplikasi yang mengubah objek database sisi server, replikasi antara versi yang berbeda memerlukan pengetahuan tingkat pengembang tentang objek database yang diubah atau ditambahkan di versi baru. Setiap versi baru aplikasi memerlukan pemetaan versi.

    15 | ARSITEKTUR REFERENSI ORACLE MAA - DASAR PENDEKATAN DBAAS (DATABASE AS A SERVICE)

    Replikasi GoldenGate adalah proses asinkron dan tidak dapat mencapai nol kehilangan data. Oleh karena itu, tingkat Platinum tidak menggunakan Oracle GoldenGate untuk replikasi situs-ke-situs jika replika jarak jauh harus menghindari kehilangan data jika terjadi penghentian yang tidak direncanakan pada database utama atau situs utama.

    Untuk memenuhi persyaratan nihil kehilangan data, tingkat Platinum menggunakan replikasi dua arah GoldenGate yang dikombinasikan dengan Oracle Active Data Guard.

    Replika GoldenGate lokal digunakan untuk pemeliharaan terjadwal tanpa kehilangan data, dan Oracle Active Data Guard secara andal menghilangkan kehilangan data selama failover jika terjadi pemadaman yang tidak direncanakan selama pemeliharaan.

    Fitur Redefinition Berbasis Edisi (EBR) menghadirkan pembaruan aplikasi yang memodifikasi objek database back-end secara online tanpa mempengaruhi ketersediaan aplikasi. Ketika instalasi pembaruan selesai, versi aplikasi yang lama dan yang diperbarui dapat digunakan secara bersamaan. Sesi yang ada dapat terus menggunakan aplikasi seperti sebelum pembaruan hingga pengguna memutuskan untuk berhenti bekerja, dan sesi baru dapat menggunakan edisi baru. Jika tidak ada lagi sesi yang menggunakan aplikasi yang belum diperbarui, maka dapat dinonaktifkan.

    EBR memungkinkan Anda memperbarui aplikasi secara interaktif sebagai berikut.

    Perubahan pada kode program diperkenalkan pada edisi baru.

    Perubahan pada data dilakukan dengan cara yang aman dengan menulis hanya pada kolom baru atau baru »

    tabel tidak terlihat pada edisi lama. Dalam tampilan edisi khusus, tabel ditampilkan secara khusus untuk setiap edisi, sehingga setiap edisi hanya melihat kolomnya sendiri.

    Edisi silang menyebarkan perubahan data yang dibuat di aplikasi lama ke kolom »

    aplikasi yang diperbarui, dan sebaliknya.

    Sama seperti memutakhirkan aplikasi dengan lancar dari Oracle GoldenGate, penerapan dan penggunaan EBR memerlukan pengetahuan mendalam tentang aplikasi dan upaya pengembang yang signifikan. Berbeda dengan Oracle GoldenGate, penggunaan EBR memerlukan investasi satu kali. Anda kemudian dapat menggunakan EBR untuk versi aplikasi berikutnya dengan sedikit usaha. Kemungkinan penggunaan EBR untuk aplikasi yang paling kompleks telah terbukti dalam praktiknya. Misalnya, Oracle E-Business Suite 12.2 menggunakan EBR untuk patching tanpa henti. Kemampuan EBR telah ditambahkan ke Oracle Database tanpa biaya tambahan.

    Solusi Oracle Global Data Services Oracle Global Data Services (GDS) adalah solusi komprehensif untuk manajemen beban otomatis untuk database yang direplikasi menggunakan Oracle Active Data Guard atau Oracle GoldenGate. GDS memberikan pemanfaatan sistem yang lebih tinggi, serta tingkat kinerja, skalabilitas, dan ketersediaan yang lebih tinggi untuk database yang direplikasi.

    GDS menyediakan kemampuan berikut untuk sekumpulan database yang direplikasi:

    –  –  –

    16 | ARSITEKTUR REFERENSI ORACLE MAA - DASAR PENDEKATAN DBAAS (DATABASE AS A SERVICE)

    Kesimpulan Tingkat Platinum: Perlindungan Data, RTO, dan RPO Tingkat Platinum memberikan perlindungan kerusakan yang sama seperti tingkat Emas. Perbedaan antara Platinum dan Gold terkait dengan waktu pemulihan (RTO) dan potensi kerugian (RPO) untuk aplikasi yang mendukung Platinum.

    RTO dan RPO untuk level Platinum ditunjukkan pada tabel berikut.

    WAKTU PEMULIHAN (RTO) DAN KEMUNGKINAN KEHILANGAN DATA (RPO) PADA TINGKAT PLATINUM

    –  –  –

    Kesimpulan Organisasi memerlukan solusi untuk memenuhi seluruh persyaratan perlindungan dan ketersediaan data.

    Praktik terbaik Oracle MAA menentukan empat arsitektur referensi untuk ketersediaan tinggi:

    PERUNGGU, PERAK, EMAS dan PLATINUM. Setiap arsitektur referensi MAA memanfaatkan serangkaian fitur ketersediaan tinggi Oracle yang optimal untuk memberikan tingkat layanan yang diinginkan dengan biaya dan kompleksitas terendah secara andal. Penerapan perangkat lunak perlindungan data dan ketersediaan tinggi yang terintegrasi dengan Oracle menggunakan serangkaian standar arsitektur ketersediaan tinggi yang berbagi infrastruktur umum memberikan solusi unik untuk mendukung Database as a Service (DBaaS) di cloud publik atau pribadi.

    Dokumen disediakan oleh ConsultantPlus Terdaftar di Kementerian Kehakiman Federasi Rusia pada 29 Juli 1996 N 1136 KEMENTERIAN PERLINDUNGAN LINGKUNGAN DAN SUMBER DAYA ALAM permukaan penggorengan Kualitas dan pengalaman bekerja dengan baja tahan karat Instruksi…” digunakan dalam teks Langganan Perjanjian diungkapkan dalam Ketentuan Layanan "Tricolor TV" "dan penggunaan..." http://www.litres.ru/pages/biblio_book/?art=8954488 Sri Aurobindo. Surat tentang Yoga – II: Aditi; Saint Petersburg; ISBN 5-7938-0029-8 Abstrak Dalam ini...»

    “PROGRAM YAYASAN Amal “SAFMAR” 2014 Isi Tentang Yayasan 3 Sambutan Pendiri Yayasan 4 Badan Pengurus 5 Anggaran Yayasan Tahun 2014 6 Sasaran Program 6 Program Yayasan 7 Program…”

    2017 www.site - “Perpustakaan elektronik gratis - berbagai dokumen”

    Materi di situs ini diposting untuk tujuan informasi saja, semua hak milik penulisnya.
    Jika Anda tidak setuju bahwa materi Anda diposting di situs ini, silakan menulis kepada kami, kami akan menghapusnya dalam 1-2 hari kerja.



    Baru di situs

    >

    Paling populer