Disaster recovery planlegging

Proaktive forslag til din katastrofeplan

Disaster recovery planlegging er en utfordrende prosess. Under planleggingsfasen, vil man naturligvis konsentrere seg om konkrete katastrofer som brann, innbrudd og naturkatastrofer. Men datahavarier og tapte data bør også betraktes som en del av din recovery plan.

Her er noen proaktive forslag for hva som bør inkluderes i din katastrofe plan:

Dokumentasjon

En gjennomgang av nødprosedyrer hvert kvartal er en proaktiv tilnærming til katastrofegjenoppretting. Nøkkelpersoner bør være oppdatert på teknisk dokumentasjon av primære forretningssystemer. Detaljert dokumentasjon som beskriver individuelle maskinkonfigurasjoner og programvareinnstillinger skal være tilgjengelig i serverrommet.

Microsoft Exchange Server Redundans

For eksempel, i en bedrift som kjører Microsoft Exchange Message Server, er det en sekundær restore server på plass for å håndtere gjenoppretting av serverens «Information store» under strømbrudd? Alle nåværende versjoner av Exchange Server lagrer loggfiler i «Information Store» databasen. Mens "Circular Logging" kan spare lagringsplass, trenger man under en katastrofe et komplett sett med loggfiler for å få til restore av «Information Store» og å få brukerne tilbake til sine data.

Arkiverte data på tapemedia

Katastrofeplanlegging bør ha planer for off-site lagring av sikkerhetskopier og andre medier. Tape backup krever mer testvalidering i planen. Det er god praksis å teste sikkerhetskopier med jevne mellomrom. Tape rotasjon bør være regelmessig og konsekvent og man må stadig sikre god kvalitet på mediene for å feil.

RAID Systems

Når det er katastrofer som involverer RAID lagringssystemer, SAN-systemer, JBOD systemer, og NAS-systemer, tar katastrofe planlegging en annen vending. Disse lagringssystemer har redundans arkitektur for å forhindre strømbrudd og katastrofer. Men dette kan gi en falsk følelse av trygghet.

For eksempel, Ibas hadde en kunde med 40TB lagringsplass fordelt på 20 servere. Disse systemene hadde hardware RAID 1 + 0 konfigurasjoner. Problemene begynte å skje på en server når en harddisk ville gå off-line for et øyeblikk. Kontrollerkortet bytter til speilet kopi som en del av redundancy prosessen. På et tidspunkt, går den første disken tilbake på nettet. Kontrollerkortet bytter tilbake til den opprinnelige disken, og resultatet blir inkonsekvente data fra et volum og filsystemperspektiv. Etter at systemet slås av og re-startes, resettes også maskinvaren. Operativsystemets automatisk volumreparasjonsprogram starter å kjøre reparasjonsprosesser. Dermed skapes ytterligere problemer i filsystemet integritet og de kritiske data var ikke lenger tilgjengelig.

Ibas løser problemene ved hjelp av vår Remote Data Recovery tjeneste.

Denne saken er interessant på grunn av rekke feil som skjedde i rask rekkefølge. Denne klienten behandler store datamengder fra tre skift per dag. Å arkivere en slik datamengde i endring hver kveld var ikke mulig. Klienten hadde vært overbevist om at lagringskonfigurasjon var "bullet-proof" på grunn av speiling.

Disse konfigurasjonene kan lykkes når flere harddisker havarerer. I dette tilfellet, derimot, sviket aldri harddisken, den bare gikk off-line. Når harddisken kom tilbake på nettet, oppstod det et feil i filsystemet. Som et resultat, ble dataene utilgjengelig når den automatiske reparasjonsverktøyet begynte å lage reparasjoner.

Sjekk ut hva som skjedde når IT-sjefen på sykehuset forsøkte å utvide kapasiteten på en filserver som støtter hundrevis av brukere.

Det er vesentlig at man planlegger for det verste, og øver på riktig førstehjelp. Ibas bistår gjerne med vår kompetanse i en slik planlegging. Er man forberedt gjør man riktige tiltak når en katastrofe inntreffer.