Bir önceki makalede vSphere Replication ve Site Recovery Manager kurulum ve yapılandırmasınının ardından sanal sunucularımızın replikasyon işlemini gerçekleştirmiştik.

bkz.: https://mutlubalik.com/vsphere-replication-site-recovery-manager-kurulum-yapilandirma-ve-replikasyon-islemi/

Bu makalede ise hizmet verilen ana site devre dışı kaldığında recovery site üzerinden hizmet sürekliliği nasıl sağlanır bunu inceliyor olacağız.

Peki replike edilen sanal sunucularımızın olası bir felaket anında recovery site üzerinde sorunsuz açılıp hizmet verebileceğinden nasıl emin olacağız ? Site Recovery Manager bizlere bu testi gerçekleştirme imkanı sunmaktadır.

Gerçekleştirilen bu testlerle beraber recovery site olası bir felaket anına hazır hale getirebilir.
İlk senaryomuzda mevcut sitemiz sağlıklı bir şekilde hizmet vermeye devam etmekte olup sadece recovery test işlemi yapılacaktır.

İkinci senaryomuzda mevcut sitemiz ayakta ancak biz kendi isteğimizle recovery siteye geçmek istemekteyiz.(Planned migration)

Son senaryomuzda ise hizmet veren mevcut sitemiz erişilemez durumdadır.(Disaster Recovery)

Replike edilen sanal sunucuların priority değeri değiştirilmek istenilirse Recovery Plans -> İşlem Yapılacak Recovery Plan -> Virtual Machines altında priority değeri değiştirilmek istenilen sunucu seçildikten sonra Priority Group kısmından değişiklik işlemi gerçekleştirilebilir. Varsayılan priority değeri 3 tür. Bu değer 1-5 arasında ayarlanabilir.

Test senaryosunda gerçekleştirilecek işlem adımları aşağıdaki gibidir;

Recovery planlar üzerinde test işlemi başlatmak için Recovery Plans sekmesi altında test edilecek recovery plan seçildikten sonra test seçeneği ile devam edilir.

Confirmayion options sekmesinde ;
Replicate recent changes to recovery site
: Bu seçeneğin seçilmesi durumunda replike edilen sunucuların en son kopyasına sahip olunur. Ancak senkronizasyon işlemi daha uzun sürer.
NOT: Replicate recent changes to recovery site özelliğinin kullanılabilmesi için Protect ve Recovery site arasındaki bağlantı devam ediyor olmalıdır.

Protect site erişilemez durumda olduğunda Replicate recent changes to recovery site seçeneği aşağıdaki gibi pasif olarak gelmektedir.

Ready to complete penceresinde test işlemi için yapılan konfigürasyonun bir önizlemesi sunulmaktadır. Finish ile test işlemi başlatılır.

Recovery site üzerinde işlemler devam etmektedir.

Test işlemi başarılı bir şekilde tamamlanmış olarak görünmektedir. Test süresi recovery plan içindeki sunucu sayısına bağlı olmakla beraber değişkenlik gösterebilir.

Recovery site üzerinde replike edilen sunucumuz Protect sitede bulunduğu klasör altında aynı hostname ve ip bilgisi ile açılmıştır.

Test işlemlerini tamamladıktan sonra cleanup adımını çalıştırmalıyız. Cleanup adımının yaptığı işlemler aşağıdaki gibidir;

Cleanup adımını çalıştırmak için Recovery Plans -> Test işlemi yapılan recovery plan seçildikten sonra Cleanup seçilerek devam edilir.

Confirmation options sekmesinde bir işlem yapılmadan devam edilir
NOT: Cleanup işlemi hata alırsa Force cleanup seeçeneği seçilerek alınan hatalar yok sayılabilir.

Finish ile cleanup işlemi başlatılır.

Cleanup işlemi başarılı bir şekilde tamamlanmıştır.

Test sırasında açılan sunucumuz clenaup akışıyla beraber kapatılmıştır.

Recovery planın test edilmesinin ardından ikinci senaryomuza geçebiliriz. Bu senaryoda her iki siteninde erişilebilir olduğu planned migration geçişini test edeceğiz.
NOT: Recovery plan çalıştırılmadan önce mutlaka test edilmiş olmalıdır. Bu işlem her iki site üzerinde de önemli değişiklikler yapar ve replikasyonu durdurur.
Recovery işlemininin gerçekleştireceği adımlar aşağıdaki gibidir;

Geçiş işlemini başlatmak için Recovery Plans -> İşlem Yapılacak Recovery Plan seçildikten sonra Run ile başlatılır.

Confirmation options sekmesinde;
Planned migration: Hem protect site hemde recovery site çalışırken geçiş yapılır.
NOT: Planned migration yapılırken protect sitede herhangi bir sorun yaşanırsa planlanan geçiş başarısız olur.
Disaster recovery:
Protect site herhangi bir sebepten dolayı erişilemez hale gelirse kullanılacak seçenektir. Böyle bir durumda geçiş işlemi sırasında hata alınsa bile işleme devam edilir.

Planned migration ve I understand that this process will permanently alter the virtual machines and infrastructure of both the protected and recovery datacenters seçeneği seçilerek bir sonraki aşamaya geçiş yapılır.

Ready to complete penceresinde yapılan konfigürasyonlara ait bir önizleme görülmektedir.
Mevcut site erişilebilir durumda olduğundan Server connection durumu Connected olarak görüntülenmektedir.
Finish ile geçiş işlemi başlatılır.

Geçiş işlemine ait süreçler Recent Task kısmından takip edilebilir.

Geçiş işlemi başarılı bir şekilde tamamlandı. Artık sanal sunucularımız recovery site üzerinden hizmet sağlamaktadır. Eğer geçiş yapılan protect site erişilebilir durumdaysa replikasyonun yönü recovery siteden protect siteye olacak şekilde ayarlanabilir.

NOT: Reprotect işlemininin yapılabilmesi için recovery işlemininin herhangi bir hata almadan tamamlanması gerekmektedir. Aksi taktirde reprotect adımına geçiş yapılamaz.
Bizim geçiş işlemimizde herhangi bir hata alınmadığından reprotect yapılabilir durumdadır. Your workloads are not protected. Run reprotect uyarısı görüntülenmektedir.

Reprotect işlemini başlatmak için Recovery Plans -> İşlem Yapılacak Recovery Plan seçildikten sonra reprotect ile işlem başlatılır.

Reprotect işlemininin gerçekleştireceği adımlar aşağıdaki gibidir;

Confirmation options sekmesinde yapılacak bu işlemin geri alınamayacağına dair I understand that this operation cannot be undone seçeneği işaretlenir ve devam edilir.

NOT: Force cleanup seçeneği, daha önce hata almış bir reprotect işlemi gerçekleştirdikten sonra kullanılabilir.

Ready to complete sekmesinde yapılan konfigürasyona ait bir önizleme görüntülenmektedir. Finish ile reprotect işlemi başlatılır.

Reprotect işlemi başarılı bir şekilde tamamlanmıştır. Artık protect sitemiz Ankara, recovery sitemiz İstanbul olmuştur.

Ankara(B) sitesi protect site İstanbul(A) sitesi recovery site olacak şekilde yapılandırılmıştır.

Planned migration ve ardından reprotect adımlarını başarılı bir şekilde gerçekleştirdik.

Sırada son senaryomuz olan disaster recovery bulunmaktadır. Bu aşamada hizmet veren mevcut site tamamen erişelemez durumdadır.

Hizmet veren siteye erişim sağlayamadığımız için SRM server unreachable uyarısı görüntülenmektedir.
Disaster recovery işlemini başlatmak için Recovery Plans -> İşlem Yapılacak Recovery Plan seçildikten sonra run ile devam edilir.

Confirmation options sekmesinde;
Planned migration: Hem protect site hemde recovery site çalışırken geçiş yapılır.
NOT: Planned migration yapılırken protect sitede herhangi bir sorun yaşanırsa planlanan geçiş başarısız olur.
Disaster recovery:
 Protect site herhangi bir sebepten dolayı erişilemez hale gelirse kullanılacak seçenektir. Böyle bir durumda geçiş işlemi sırasında hata alınsa bile işleme devam edilir.
Disaster recovery planını çalıştırdığımızda  Site Recovery Manager protect sitedeki sanal makineleri kapatmaya çalışır. Bu işlem başarılı olmasa bile recovery site üzerindeki sunucular açılmaya devam eder. Protect site olağanüstü durum sonrası tekrar erişilebilir olduğunda her iki site üzerinde bulunan sanal sunucuların çalıştığı tutarsız bir durum ortaya çıkabilir. Böyle bir durumda protect sitedeki sanal sunucuları kapatmak için recovery planın bir kez daha çalıştırılması gerekebilir.

Mevcut site erişilemez durumda olduğundan Planned migration seçeneği pasif ve seçilemez durumdadır. Disaster recovery ve I understand that this process will permanently alter the virtual machines and infrastructure of both the protected and recovery datacenters seçeneği seçilerek bir sonraki aşamaya geçiş yapılır.

Ready to complete penceresinde yapılan konfigürasyonlara ait bir önizleme görülmektedir. 
Mevcut site erişilemez durumda olduğundan Server connection durumu Not Connected olarak görüntülenmektedir.
Finish ile disaster recovery işlemi başlatılır.

Disaster recovery işlemi devam etmektedir. Recent Task kısmından takip edilebilir.

Disaster recovery işlemi hatalarla beraber tamamlandı. Artık sanal sunucularımız recovery site üzerinden hizmet sağlamaktadır. Ancak Protect site erişilemez durumda olduğundan SRM, protect sitede bulunan sanal sunucuları kapatamadı. Protect site erişilebilir duruma geldiğinde recovery plan bir kez daha çalıştırılmalıdır.

Belirli bir süre sonra mevcut siteyi tekrar erişilebilir duruma getirdiğimde Recovery required uyarısı görüntülenmektedir. Run ile recovery plan tekrar çalıştırılır.

Confirmation options penceresinde herhangi bir işlem yapmadan devam edilir.

Ready to complete penceresinde recovery konfigürasyonu için bir önizlemesi sunulmaktadır. Finish ile recovery işlemi başlatılır.

Recovery işlemi başarılı bir şekilde tamamlandı. Bu işlemin ardından Your workloads are not protected. Run reprotect uyarısı görüntülenmektedir.

Reprotect işlemini başlatmak için Recovery Plans -> İşlem Yapılacak Recovery Plan seçildikten sonra reprotect ile işlem başlatılır.

Confirmation options sekmesinde yapılacak bu işlemin geri alınamayacağına dair I understand that this operation cannot be undone seçeneği işaretlenir ve devam edilir.

NOT: Force cleanup seçeneği, daha önce hata almış bir reprotect işlemi gerçekleştirdikten sonra kullanılabilir.

Ready to complete sekmesinde yapılan konfigürasyona ait bir önizleme görüntülenmektedir. Finish ile reprotect işlemi başlatılır.

Reprotect işlemi başarılı bir şekilde tamamlanmıştır. Artık protect sitemiz Ankara, recovery sitemiz İstanbul olmuştur.

Bu makalede hizmet verilen ana site devre dışı kaldığında recovery site üzerinden hizmet sürekliliğinin nasıl sağlanabileceğini inceledik. Sağlıkla kalın…

reference: https://docs.vmware.com/en/Site-Recovery-Manager/8.6/com.vmware.srm.admin.doc/GUID-9794F585-C168-48D6-8866-E8519E768278.html

Yazar: Mutlu BALIK