출처: http://www.dbguide.net/know/know101003.jsp?IDX=205&catenum=14
백업과 리스토어의 중요성을 간과하지 말라우리는 일반적으로 친숙한 것을 간과하는 경향이 있다. 이러한 경향은 비즈니스에서도 종종 발견되곤 하는데, 그 쉬운 예가 데이터 백업과 백업된 데이터를 리스토어하는 과정이다. 백업이 스케줄대로 이루어지지 않고, 리스토어도 제대로 되지 않는다고 가정한다면 그야말로 그 조직은 혼란 속에 빠져들고 말 것이다. 자기(磁氣) 스토리지가 컴퓨팅 시스템에 사용된 이후에 신뢰성 있는 백업과 리스토어 성능의 필요성이 대두되기 시작했다. 자기 테이프와 디스크 스토리지의 대두는 데이터의 저장을 보장해 주면서 동시에 데이터가 손실될 가능성이 증가했기 때문이다. 컴퓨터와 스토리지 시스템이 버추얼 방식으로 모든 조직에 사용되고 있기 때문에 신뢰성 있는 백업과 리스토어 기능의 필요성은 조직에서 행하고 있는 컴퓨팅 관련 업무 중에서 그 무엇보다 중요한 것으로 대두되었다. 이번 회에서는 다양한 방법의 백업과 리스토어에 대해 알아보고, 이어 기업 정보보호의 최종 단계인 재해복구에 대해서 검토해 보고자 한다.
1. 스토리지 전략
스토리지 전략이 필요한 이유, 데이터 양이 기하급수적으로 증가하고 있는 오늘날 스토리지 매니저의 역할
2. 스토리지 테크놀러지 리뷰
디스크 스토리지, 테이프 스토리지, 자동화 테이프 라이브러리, NAS/SAN 등 스토리지 관련 주요 기술에 대한 개괄적인 소개
3. 백업과 리스토어, 재해복구(이번회)
백업/리스토어, 재해복구의 개념, 자동화 백업 및 리스토어, 데이터베이스 백업/리스토어 기술, 전략적 백업 및 리스토어를 위한 기술, DR을 위한 플랜 및 재해를 당한 경우의 대처 방안
4. 성능 분석
성능분석의 개념 및 스토리지 성능 분석을 위한 과제
5. 용량 계획
스토리지 용량 계획의 개념 및 스토리지 용량 플랜과 일반적인 오류들
백업과 리스토어는 장·단기적으로 데이터 보전을 포함한 스토리지 관리의 한 업무라고 할 수 있다. 백업을 단순하게 본다면 데이터 복제본을 스토리지에 저장하는 것을 말하며, 리스토어는 스토리지에 백업된 데이터를 다시 꺼내는 일련의 업무를 의미한다. 이 둘은 밀접하게 연관되어 있어서, 만약 백업이 되고 리스토어가 되지 않거나, 백업된 데이터를 리스토어 하는데 오랜 시간이 걸리게 된다면 백업과 리스토어 작업이 무의미해지게 된다. 따라서, 백업에서 가장 중요한 것은 백업 방식이고 리스토어에서 가장 중요한 것은 신뢰성과 속도이다.
백업과 리스토어를 위한 기술
1. 매뉴얼 방식의 백업과 리스토어
매뉴얼 방식의 백업은 사용자가 직접 테이프를 드라이브에 마운트해서 버튼을 누른 후 드라이브에서 테이프를 꺼내어 제 3의 장소에 보관하는 방식이다. 리스토어 방식 역시 사용자가 직접 작업을 하는 것으로 리스토어가 필요한 테이프를 찾아내고 드라이브에서 테이프를 마운트 한 후 버튼을 누르는 순서로 작업을 실시하여, 리스토어 후에 다시 사람이 이전에 보관해 두었던 장소에 테이프를 놓는 방식이다.
2. 자동화 방식의 백업과 리스토어
현재 매뉴얼 방식의 백업과 리스토어가 자동화 방식으로 전환되고 있다. 이것은 몇 개의 테이프에서 수천 개 이상의 테이프를 보관하는 자동화 테이프 라이브러리를 이용하여 백업과 리스토어를 하는 방식이다. 이러한 백업과 리스토어 방식의 변화는 시간과 비용을 획기적으로 절감할 수 있게 해 준다. 수작업이 줄어들었고, 물리적인 손상과 비정상적인 배치로 인해 시스템 전반이 불안정해질 수 있는 위험이 줄어든다.
3. 자동화 네트워크 백업과 리스토어
자동화 네트워크 백업은 하나 이상의 대형 자동화 테이프 라이브러리를 네트워크로 공유하여 사용하는 방식이다. 이것은 스토리지 관리 소프트웨어를 통해 백업과 리스토어 담당자, 시간, 이용된 디바이스를 컨트롤하는 것이다. 네트워크 백업의 가장 큰 장점은 중앙 집중식 백업 관리, 사용자 중심의 리스토어, 리포팅과 예산 조절을 가능케 한다는 것이다.
4. LAN-less 네트워크 백업과 리스토어
SAN 개념과 밀접하게 연관된 LAN-less 네트워크 백업은 백업 구조의 성능을 향상시킬 목적으로 백업 전용 네트워크를 사용하는 것이다. 연관된 LAN-less 네트워크 백업을 위해 관련 하드웨어는 파이버채널 호스트 버스 어댑터(HBA : Host Bus Adapter) 또는 파이버채널 허브나 스위치를 사용하여 연결되어 있어야 한다.
5. 데이터베이스 백업과 리스토어
많은 스토리지 관리자들은 데이터베이스를 백업하기 위해 몇 가지 문제점들과 직면하게 된다. 즉 어떤 파일은 항상 오픈되어 있어 데이터베이스의 레코드를 업데이트하는 중에도 끊임없이 작업을 기록하고 있기 때문이다. 만약 사전에 특별한 어떤 작업을 하지 않은 채 현재 작동 중에 있는 데이터베이스를 백업할 경우, 백업은 모든 홀을 다 사용하여 리스토어를 할 수 없게 될 수 있다. 그렇기 때문에 데이터베이스를 백업하기 위해서는 특별한 주의가 필요하다. 이러한 상황과 문제점을 해결할 수 있는 가장 좋은 방법은 그저 데이터베이스를 중단하고 백업 업무를 시작하는 콜드 백업(Cold Backup)을 수행하는 것이다. 그러나 일반적인 경우 데이터베이스를 지속적으로 운영하면서 백업해야 하기 때문에 웜백업(Warm Backup) 형태의 유틸리티 백업, 미러 백업, 스냅샷 카피 백업을 사용할 수 있다.
백업과 리스토어 전략
백업과 리스토어는 어떠한 사고나 예상치 못했던 데이터의 삭제 또는 손상으로부터 회사의 가장 중요한 자산인 데이터를 보호하기 위해 반드시 수행해야 할 업무이기 때문에 수행하는 방식을 분명하게 이해하고 계획을 세워서 동시에 순차적으로 진행해야 한다. 백업과 리스토어 전략에는 그림 1에서 보여지는 것처럼 크게 세 가지로 구분할 수 있다.
1. 풀 백업 전략(Full Backup Strategy)
이 전략은 단순히 백업하는 시간에 풀 리스토어를 위해서 필요한 모든 데이터를 백업하는 것이다. 이것은 백업 시간으로 할당된 시간에 완전하게 백업할 수 있을 만큼의 데이터 양이 적을 경우에 가능한 것으로, 풀 백업으로부터 리스토어는 일반적으로 속도가 가장 빠르다. 왜냐하면 모든 데이터가 하나의 테이프 안에 백업되어 있기 때문이다.
2. 차별적 백업 전략(Differential Backup Strategy)
차별적 백업 전략은 일주일에 한번 풀 백업을 위해 매일매일 차별적으로 증가분의 데이터를 연속적으로 백업하는 방식으로, 이 경우에는 데이터의 백업 양이 점차로 증가되어 마지막 백업을 받는 날에 풀 백업을 할 수 있게 되는 것이다. 풀 백업에서 리스토어는 풀 백업 속도에 비해서는 느리나 매우 빠른 편에 속한다. 그것은 풀 백업 데이터와 증가된 데이터를 백업한 차별적 테이프만을 읽으면 되기 때문이다.
3. 증분 백업 전략(Incremental Backup Strategy)
이 백업 전략은 마지막에 증가된 만큼의 백업을 받은 이후에 변화된 데이터만을 백업하는 방식으로 보통 주별 백업 과정으로 본다면 그리 많은 양의 데이터를 백업하는 것은 아니다. 증분 백업의 규모는 마지막 백업을 한 이후에 변화되는 데이터의 양이 얼마나 많은가에 따라 달라질 수 있다. 증분 백업으로부터 리스토어를 할 경우 속도는 그리 빠르지 않다. 왜냐하면 풀 백업한 테이프와 모든 증분 백업을 한 테이프를 모두 읽어야 하기 때문이다.
재해복구의 올바른 정의
우리가 흔히 재해복구라고 할 때, 장애복구와 재해복구와의 차이점을 분명히 파악하는 것이 중요하다. 장애복구라고 하는 것은 시스템의 오류나 다운으로 인한 데이터의 손실에 초점을 두고 있고, 재해복구라고 하는 것은 인력으로 막을 수 없는 천재지변이나 재앙 또는 뜻하지 않은 사고로 인한 데이터와 시스템의 붕괴에 중점을 두고 있다.
장애복구의 경우에는 디스크 솔루션을 이용해 실시간 온라인 리모트 데이터 복제를 통한 시스템의 이중화로 구축이 가능하다. 그러나 재해복구의 경우에는 데이터를 안전하게 영구 보관해야 하는 것에 초점을 두고 시스템을 구축해야 한다. 가령, 전산 시스템이 있는 근거리 지역에 재해복구시스템을 구축한다는 것은 무의미한 비용의 투자가 될 것이다.
대개의 스토리지 관리자는 재해복구를 단순히 기술적인 관점에서 파악하는 경향이 있다. 즉 데이터를 보호하기 위해 데이터를 이동시키거나 원격지에 이중화 시스템을 구축하는 것에만 관심을 가진다. 그러나 이것만으로 재해복구시스템을 완벽하게 구축했다고 볼 수는 없다.
재해대책의 성공여부, 즉 계속적인 업무 연속성의 가장 핵심적인 요소는 BIA (Business Impact Analysis)의 분석에 있다.
BIA 분석 내용은 첫째 주요 업무의 기능 및 진행 사항 파악, 즉 △사업 기능 및 진행 사항 문서화 △각 사업의 손실 영향력 결정 △재해 기간 중의 업무손실 평가이다. 둘째 우선순위 결정 및 기능 설정인데, 업무의 중요도, 신속도 등을 고려하여 어떤 업무부터 적용할 것인지 업무의 우선 순위를 정하고 이에 따라 시행 계획을 세워야 한다. 셋째, 주요 기능을 수행하기 위한 필요 자원을 파악하는 것이다. 즉 재해대책에 따라 조직되거나 동원되는 조직원, 오프라인 백업 파일, 데이터 백업 및 운영 복구, 하드웨어 장비 및 부대시설, 시스템 완전 복구 시점까지 필요한 대체처리 용량 확보 및 백업 지침 등이 그것이다.
1. 재해복구 계획 작성 요령
그림 2는 테이프를 기반으로 하는 재해복구 계획을 작성하기 위한 일련의 절차를 보여주고 있다. 재해복구 계획을 작성하기 위해서는 가장 우선적으로 발생할 수 있는 모든 재해를 구분하고 그 다음 단계로 재해복구시스템 구축에 소요되는 총 비용을 산정해야 할 것이다.
먼저, 재해복구 계획을 작성하기 위한 순서로 재해를 구분한다. 스토리지 장비에 나쁜 영향을 주는 요소와 재해의 종류는 정전, 홍수, 화재, 고의적인 파괴, 폭탄 테러, 토네이도, 폭동, 지진, 허리케인, 폭풍, 케이블 고장, 전쟁에 이르기까지 일일이 열거할 수 없을 정도로 많다. 그러나 모든 재해에 대해서 똑같은 비중을 두어 대책을 마련할 수는 없을 것이다. 따라서 다양한 재해를 그 회사의 컴퓨팅 시스템에 영향을 미치는 정도와 중요도에 따라 재해의 순서를 나누어 관리하는 계획을 작성해야 한다.
다음은 비용과 재해복구의 관계이다. 대개의 경우에 재해복구시스템을 구축하기 위해서 무한정으로 예산을 들일 수 없다. 즉, 스토리지 매니저는 한번에 모든 시스템을 구축하기 위해 필요한 모든 장비를 구매할 수 없는 것이다. 가령, 원격지에 미러링된 재해복구 사이트를 구축하기 전에 현재 보유하고 있는 테이프 아카이브 시스템을 사용하여 일차적인 시스템을 구축한다면, 해당 조직이 강력한 재해복구시스템을 구축할 수 있는 재정적 여력을 파악해 두어야 한다.
마지막으로 재해복구 계획에 반드시 들어가야 할 내용은 시스템 구축의 아웃소싱 활용 여부를 결정하는 것이다. 기업이 자체적으로 시스템을 구축하는 것에 비해 아웃소싱은 다른 회사가 그 조직의 재해복구시스템 전체 또는 일부를 관리해주는 것이다. 아웃소싱은 인하우스(In-House)에 비해 상대적으로 비용이 적게 들기 때문에 많은 기업들이 재해복구시스템 구축을 위해 아웃소싱을 적극 활용하고 있다.
2. 재해복구 계획의 문서화
공식적인 재해복구 계획의 문서화는 업무 분장과 책임 영역을 명확히 해주고, 재해 발생 시 행동 요령을 알려준다. 따라서 계획을 잘 작성하는 것만으로도 훌륭한 재해복구시스템을 절반은 완성한 것이라 할 수 있다. 다음은 재해복구 계획 문서의 필수 기재 사항이다.
-재해복구시스템을 복구하는 항목별로 책임자를 정한다 : 작은 규모의 조직은 보통 2~3명 인력이 모든 시스템을 관리하기도 하지만, 대규모 조직의 경우에는 시스템 운영, 애플리케이션, 그리고 네트워크 등으로 업무 부서와 책임자를 나누어 정한다. 이 경우 각 부서에 해당하는 재해복구 항목에 대한 책임을 부여하여 재해발생 시 분야별로 전문적인 관리를 할 수 있게 된다.
-재해복구를 시작하기 전에 재해복구팀이 어디에서 어떻게 모여야 할 것인가를 정한다 : 이것은 주로 물리적인 장소 또는 컨퍼런스 콜 등이 될 수 있다. 이것에 대해 분명히 규정해 놓는다면 시간을 낭비하거나 시작부터 혼란에 빠지지 않게 된다.
-벤더들과 같은 서드파티 업체의 연락처를 파악해 두어야 한다 : 재해복구시스템을 아웃소싱으로 구축했다면, 아웃소싱 업체에서 그 조직을 담당하고 있는 책임자 및 부책임자의 이름과 연락처를 반드시 계획에 기입하고 쉽게 눈에 띄는 곳에 비치해 두어야 한다. 또한 이러한 책임자들에게 그 조직에서 누가 연락을 담당할 것인가를 정해 두어야 한다.
-재해복구 업무는 무엇이며, 재해복구 절차를 일목요연하게 규정해 두어야 한다 : 재해복구 업무 역시 일의 순서가 있다. 하나의 특정 업무 이후에 다른 업무가 수행되어야 순조롭게 재해복구를 할 수 있다. 즉 일련의 업무 절차를 기록해 두어야 한다.
-재해복구 완료 이후에 필요한 업무를 규정해 두어야 한다 : 재해복구 계획 문서에는 사용자 주의, 시스템 모니터링, 재해복구 사후 분석과 문서 등 관리적인 업무가 기재되어 있어야 한다.
-우발 상황에 대비한다 : 우발 상황은 전 계획을 한 순간에 물거품으로 만들어 버리기도 한다. 이럴 경우를 대비해 재해복구 계획에는 예상치 못한 일이 발생했을 경우 대비책에 대해서도 규정지어져야 한다. 재해복구 최고 책임자를 선정하며 그 책임자 하에 각 부서의 팀장을 위원으로 하는 위원회를 조직해 두어 상황에 대비해야 한다.
3. 재해복구시스템의 성격
이제는 재해복구에 대한 필요성에서 한발 더 나아가 재해복구센터 구축을 시스템 통합 프로젝트로 이해하는 관점이 필요하다. 즉 호스트·서버·스토리지·네트워크·DB 및 업무 운영까지 종합적으로 분석해 디자인, 구축, 운영해야 하는 광범위한 프로젝트라는 의미다. 재해복구센터 구축은 기업 내 IT 인프라에만 한정되는 프로젝트가 아니라 전사적으로 재해복구 체계의 준비, 재해의 정의(언제 재해복구 체계로 돌입할 것인지), 재해 시 업무 절차의 정의, 각 직원들의 행동 지침, 원상복구의 기준 등을 모든 직원들이 익숙해질 수 있는 전체적인 관점에서 도입해야 한다.
따라서 기업 IT 환경에서 재해복구센터 구축은 장기적 관점으로 볼 때 모든 IT 처리 과정과 이를 위한 자원통합 및 관리라는 측면에서 재해복구시스템을 구축하는 것이 타당하다. 관련 컨설팅 업체는 이러한 고객의 장기적인 관점에서 경험과 노하우, 구축의 우선순위, 선결 과제 등을 짚어 나가야 할 것이다. 특히 일과성 구축이 아닌 지속적으로 업무 변화, 시스템 변화에 능동적으로 대처하는 체계를 정립하는 것도 필수적이다.
재해복구시스템을 위한 제언
가트너 그룹의 2003년 컴퓨팅 하드웨어 시장 전망에 따르면, 스토리지 부문은 재해복구의 기능이 강화된다고 한다. 이러한 시장의 변화는 9.11 테러에서 인터넷 대란에 이르는 대규모의 위기 상황이 기업들에게 데이터 백업과 재해복구에 대한 새로운 개념을 심어준 것으로 보인다.
보통 재해복구시스템 구축에 가장 어려운 부분으로 내부의 공감대 형성을 꼽는다. 그 다음이 비용과 인력의 문제다. 재해복구시스템 구축을 비용의 소모라는 측면에서만 볼 것이 아니라 회사의 핵심 자원을 지킨다는 관점에서 최고 경영진의 적극적인 지원이 필수적이며, 아울러 이러한 투자를 보험으로만 간주해 비용만 소모하는 시설이 아닌 업무 분산 등에 적극적으로 활용하는 사고가 필요한 때다.
': H/W' 카테고리의 다른 글
스토리지 컨설팅 (5) - 효과적인 IT 자원 관리를 위한 스토리지 용량 계획 (0) | 2008.04.30 |
---|---|
스토리지 컨설팅 (4) - 성능 분석의 개념과 분석 과정 (0) | 2008.04.30 |
스토리지 컨설팅 (2) - 스토리지 테크놀로지 이해의 필요성 (0) | 2008.04.30 |
스토리지 컨설팅 (1) - 스토리지 전략과 스토리지 매니저의 중요성 (0) | 2008.04.30 |
UPS 개요 (0) | 2008.04.30 |