출처: http://www.dbguide.net/know/know101003.jsp?IDX=202&catenum=14



현재의 환경에 적합한 스토리지가 무엇인가
스토리지 매니저들은 하드웨어와 소프트웨어를 다양한 방법으로 구성, 통합하여 사용하고 있다. 이것은 수년 동안 스토리지 매니저에게 매우 어렵고도 해결하기 힘든 과제이기도 하다. 그러나 이러한 어려운 문제들은 새로운 아키텍처와 표준, 새로운 기술들의 빠른 등장으로 더욱 복잡해지고 있다. 그렇다면 이러한 문제의 해결 방법은 과연 무엇일까? 그것은 바로 어느 한 벤더사의 솔루션과 제안을 거르지 않고 받아들이기보다는 현재 시장에 나와 있는 스토리지와 여러 솔루션에 대해서 보다 명확하게 개념을 파악하고, 과연 현 시스템과 환경에 적합한 것이 무엇인지를 인지한 후 도입하는 것이 그 무엇보다 중요하다는 것이다. 이번 회에서는 스토리지(디스크, 테이프, 테이프 라이브러리)의 개념과 그 종류에 대해서 알아보고 이러한 스토리지가 어떠한 방식으로 연결되어 사용될 수 있는지, 그리고 그 방식의 장단점을 파악하여 현재 우리의 환경에 적합한 것이 어떤 방식인지 파악하여 적용하는 방안을 모색해 보고자 한다.


연재목차

1. 스토리지 전략
스토리지 전략이 필요한 이유, 데이터 양이 기하급수적으로 증가하고 있는 오늘날 스토리지 매니저의 역할

2. 스토리지 테크놀러지 리뷰 (이번회)
디스크 스토리지, 테이프 스토리지, 자동화 테이프 라이브러리, NAS/SAN 등 스토리지 관련 주요 기술에 대한 개괄적인 소개


3. 백업과 리스토어, 재해복구
백업/리스토어, 재해복구의 개념, 자동화 백업 및 리스토어, 데이터베이스 백업/리스토어 기술, 전략적 백업 및 리스토어를 위한 기술, DR을 위한 플랜 및 재해를 당한 경우의 대처 방안

4. 성능 분석
성능분석의 개념 및 스토리지 성능 분석을 위한 과제

5. 용량 계획
스토리지 용량 계획의 개념 및 스토리지 용량 플랜과 일반적인 오류들



스토리지 테크놀로지는 오래된 것과 새로운 것이 혼합되어 왔다. 테이프는 그 역사가 1940년대, 디스크는 1950년대로 거슬러 올라가며, 옵티컬 디스크, 자동화 라이브러리, RAID는 1980년대로 상당히 최근의 것이며, 자동화 테이프 라이브러리 기술 및 SAN과 NAS는 1990년대에 등장한 테크놀로지이다. 먼저, 테이프 스토리지 테크놀로지에 대해 살펴본 후, 디스크 스토리지, RAID, 그리고 SAN과 NAS에 대해서 살펴보도록 하겠다.


테이프 스토리지 기술 연구

자기 테이프는 1940년대에 개발되어 1980년대에 이르기까지 사람의 손으로 오픈 릴(reel)에 감고 마운트하여 사용했다. 1986년 IBM이 최초로 3480 테이프 카트리지를 출시했다. 이 카트리지는 얇은 소설책 만한 크기의 직사각형 케이스 안에 단일 릴 테이프를 넣은 것으로, 자동화 테이프 라이브러리에 보관되어 2개의 팔이 달린 로보틱으로 카트리지를 손쉽게 꺼내고 넣는 방식으로 이루어져 사용이 매우 간편하고 안전해졌다. 이후 기술의 발전으로 로보틱스와 테이프 스토리지의 비용이 낮아지면서 널리 상용화되었다.

테이프 스토리지 산업은 writing과 handling 테이프에서 몇 개의 표준이 개발되었다. 이러한 방식은 3가지 증가를 이루어냈다. 그것은 바로 단일 테이프에 데이터를 저장할 수 있는 양의 증가, 테이프에 데이터를 기록하고 읽는 속도의 증가, 마지막으로 테이프 스토리지의 신뢰성 증가이다. 테이프 스토리지의 표준으로는 현재 크게 LTO와 DLT로 나눌 수 있다.


1. LTO(Linear Tape-Open)

LTO 기술은 HP, IBM과 씨게이트 세 회사가 협력하여 개발한 것으로, 오픈 기술이기 때문에 어떤 벤더사들도 LTO 테이프를 배포하고 라이선스할 수 있다. 1세대 LTO는 1998년에 라이선스 되어 2000년부터 사용되기 시작했다. LTO는 두 개의 릴로 구성되어 테이프의 중간부터 데이터를 검색할 수 있는 액셀리(Acceli)와 하나의 릴로 구성되어 대용량의 데이터를 저장할 수 있는 울트리엄(Ultrium)이 있다.

LTO의 장점은 오픈 기술로 되어 많은 벤더사들이 개발하고 사용할 수 있으며, 각 카트리지가 대용량의 데이터를 저장할 수 있고 안정성이 뛰어나다는 점이다. 반면 이전에 사용했던 테이프 기술로부터 마이그레이션이 필요하다. 비록 LTO 차세대 드라이브가 그 이전의 LTO 테이프를 읽을 수 있게 될지라도 LTO 드라이브 상에 있는 데이터만을 읽을 수 있고 마이그레이션해야 하기 때문에 다른 종류의 드라이브를 사용하고 있는 경우에는 문제가 생길 수 있다.


2. DLT(Digital Linear Tape)

DLT는 리니어 트랙 테이프의 대표적인 드라이브로 트랙수가 128개부터 208개까지 매우 다양하다. SuperDLT는 가장 최근에 개발된 것으로 용량이 최대 100GB까지 저장 가능하다. DLT는 서펜타인(Serpentine: 뱀 모양의) 레코딩으로 중앙에서 가장자리로 리니어 트랙 테이프에 데이터를 기록하는 기술로, 물리적으로 테이프의 중심이 매우 안정적이라는 장점이 있다. 이 외에도 나선형 스캔(Helical scan) 방식의 테이프는 대표적 드라이브로 압축 시 최대 용량이 65GB정도 된다.



디스크 스토리지의 발전


스토리지는 CPU에 직접적으로 어드레스 되어 있지 않은 데이터를 가지고 있는 주 메모리와는 다른 개념이다. 데이터는 사용되기 전에 직접적으로 어드레스 되는 메모리에 로드되어야 한다. 초기 스토리지 디바이스는 이러한 데이터를 순차적으로 복구했다. 만약 프로그래머가 데이터를 액세스하거나 프로그램을 로드할 때 그 데이터가 순차상으로 맨 뒤에 있다면 상당한 시간을 기다려야 하는 수고를 감수해야 했다. 그 후 디스크 스토리지는 경이로울 정도로 많은 발전이 있었다.


1. DASD

DASD(Magnetic Direct Access Storage Device)는 순차적으로 데이터를 검색하는 초기 단계에서 Read/Write 헤드를 이동시켜 검색하고자 하는 데이터를 찾는 기술을 통해 상당히 빠른 랜덤 액세스가 가능한 자기 디스크이다. 최초의 DASD는 데이터를 저장하기 위해 자기(Mag- netism)를 사용하였다. 이 기술은 오늘날 매우 보편화됐다. 최초로 사용된 DASD는 1956년 IBM에서 출시한 RAMAC (Random Access Method of Accounting and Control)이다. 현재 기준으로 보았을 때, RAMAC의 속도는 데이터 액세스 속도가 약 600ms 또는 1/1,000초로, 현재 평균 데이터 검색 시간이 4~10ms 정도인 것을 감안한다면 상당히 늦은 기록이다. 1956년 RAMAC 이후, 1963년 리무버블 디스크 팩(Removable Disk Pack), 1970년 플로피디스크, 1973년 윈체스터 디스크 드라이브 순으로 지속적인 발전이 되어 왔다.


2. 옵티컬 디스크

옵티컬 디스크가 자기 디스크 기술과 가장 다른 점은 Read/Write 헤드를 사용하지 않고 레이저를 사용한다는 것이다. 또 다른 차이점은 데이터를 검색하는 방법으로, 옵티컬 디스크는 일련의 지속적인 나선형 모양으로 데이터를 기록하는 반면, 자기 디스크는 여러 개의 원으로 그것을 기록하는 것인데, 만약 데이터 액세스의 요소를 잃어버렸을 경우, 옵티컬 디스크는 순차적인 액세스 스토리지 기술을 사용하게 된다. 자기 디스크에 비해 성능이 다소 늦기 때문에 옵티컬 디스크는 백업, 아카이브, 니어라인 스토리지와 같은 데이터를 저장하는 테이프로 간주되기도 한다. 현재 옵티컬 디스크는 테이프 기술의 발전으로 속도가 급속하게 빨라지고 저장 용량이 증가하면서 업계에서 많이 사용되고 있지는 않지만 하나의 디스크에 최고 17GB이상 저장할 수 있는 DVD가 개발되면서 새로운 시장을 모색해 나가고 있다.


3. RAID

RAID(Redundant Array of Inde- pendent Disk) 디스크는 크게 6개(RAID 0, RAID 1, RAID 2, RAID 3, RAID 4, RAID 5)로 나눌 수 있다. RAID 0을 제외한 모든 레벨은 미러링을 사용하는 폴트 톨러런트(장애극복), 에러감지와 교정 또는 패리티의 기능을 가지고 있다.

- RAID 0은 스트라이핑으로 되어 있으며 데이터는 하나의 블록을 기반으로 하여 멀티 디스크 드라이브에 걸쳐 기록된다. 비록 RAID 0은 폴트 톨러런트 기능은 가지고 있지 않지만 읽고 쓰는 것이 매우 빠르다.

- RAID 1은 미러가 가능하며 하나 또는 그 이상의 디스크 드라이브가 액티브 카피를 하여 만약 하나의 드라이브가 고장이 났을 때 다른 드라이브에 데이터가 남아 있어 데이터를 보존할 수 있다. 또한 각각의 디스크가 미러가 되기 때문에 Read/Write 기능은 단일 디스크에 비해 뛰어나다. RAID 1은 매우 안전한 반면 고가의 디스크이다.

- RAID 2는 ECC(Error-correction code) 레벨이어서 저장된 데이터는 데이터에 대한 기록이 되어 있는 별도의 비트를 가지고 있다. 만약 데이터를 읽는 도중에 에러가 발생했을 때 ECC 정보를 통해서 데이터를 복구할 수 있게 된다. RAID 2도 RAID 0과 같이 스트라이핑으로 되어 있으나 드라이브가 ECC를 가지고 있다는 것에서 차이가 있다.

- RAID 3는 정교한 패리티 드라이브를 가지고 있으며 스트라이핑 특성을 지닌다. 따라서 데이터는 비트 레벨상에 스트라이핑되며 어레이의 하나의 드라이브는 패리티가 된다. RAID 3는 매우 안전한 반면 데이터 쓰기 속도가 상대적으로 느리다.

- RAID 4는 RAID 3와 같이 정교한 패리티 드라이브를 가지고 있으나 동기식 드라이브상에서 블록 레벨에 데이터가 스트라이핑된다. RAID 4의 특징은 매우 안전하며 RAID 3에 비해 성능이 뛰어나다.

- RAID 5는 데이터와 패리티 레벨에 스트라이핑되며, 패리티는 데이터와 같이 어레이의 모든 드라이브에 스트라이핑된다. RAID 5는 RAID 3/4에 비해 쓰기 기능에 있어 매우 안전하며 속도도 빠른 반면 데이터를 읽는 속도가 느리다.


(그림1)스토리지텍 자동화 테이프 라이브러리



자동화 테이프 라이브러리로 확산

직접 손으로 테이프를 로드하고 마운트할 경우 아무리 빠르게 작업을 한다고 해도 테이프를 찾아서 드라이브에 장착하는 데 걸리는 시간이 적어도 수 분은 걸릴 것이다. 자동화 테이프 라이브러리는 단 몇 초만에 이 작업을 완료시킬 수 있으며 매우 안정적이고 신뢰성 있게 업무를 처리해준다.

스토리지텍이 업계 최초로 1987년에 자동화 테이프 라이브러리를 출시하여 오늘날 매우 폭넓게 사용되고 있다. 이 라이브러리는 용량에 따라 작은 랙 마운트 형식으로 되어 있거나, 캐비닛 사이즈만한 것에서부터 PTP(Pass-Through ports)로 연결되어 대용량의 테이프 라이브러리가 수십 대까지 연결할 수 있는 것 등 그 종류도 매우 다양하다. 디스크 스토리지가 TB급의 데이터를 저장할 수 있다면 테이프 스토리지는 멀티 백업과 니어라인 스토리지로 되어 있어 PB에서 EB까지 저장할 수 있는 대용량의 스토리지이다(그림 1).


1. 니어라인 스토리지

니어라인 스토리지는 자동화 테이프 라이브러리에 있는 테이프를 사용하지 않는 데이터를 말한다. 즉 이 데이터는 오프라인이며 디스크로 로딩되기 전까지 액세스할 수 없다. 그러나 애플리케이션과 사용자는 데이터가 마치 디스크에 있는 것처럼 사용한다. 그것은 바로 자동화 테이프 로더의 속도가 빠르기 때문에 데이터가 오프라인 상에 있다는 것을 감지하지 못하기 때문이다. 니어라인 스토리지 이후 HSM (Hierarchical Storage Management)이 개발되었다. HSM은 값비싼 디스크를 보다 효율적으로 사용하기 위해 메인프레임 환경에 맞도록 개발되었다. 즉 디스크에 있는 데이터를 어느 시간동안 사용하지 않으면 자동적으로 더 값이 싼 미디어에 마이그레이션 되도록 하거나 상당히 오랫동안 그 데이터를 사용하지 않는다면 자동 파기시키거나 테이프에 저장되도록 하는 관리 툴이다. 오늘날 HSM은 스토리지 전략의 중요한 역할을 하는 것으로써 옵티컬 스토리지로 간주되기도 한다.



네트워크 스토리지 기술로 진화

점차 스토리지 환경이 복잡해지면서 관리 자체가 어려워지고 이에 따른 비용이 증가함에 따라 어떻게 하면 스토리지 관리를 효과적으로, 그리고 비용을 감소할 수 있을까 하는 방법을 찾기 시작했다. 즉 정보산업의 급속한 성장으로 관련 업체들의 데이터 용량이 급속하게 증가하고 있고 기존의 데이터 저장관리 방식(DAS, Direct Attached Storage)으로는 이를 수용할 수 없는 상황에 이르렀다. 이를 극복하기 위해 두 가지 새로운 데이터 기술이 진화해 왔는데, 그것이 NAS와 SAN이다. 이 두 가지 새로운 형태의 기술은 나름대로의 장점을 내세워 미래의 데이터 저장관리 방식의 주인으로 자리잡고자 치열한 경쟁을 벌이고 있다. 스토리지 연결방식이 따른 DAS, NAS, SAN에 대해 알아보기로 하자.


1. DAS

DAS는 스토리지 매니저에게 가장 익숙한 스토리지의 한 종류이다. 이 방식은 스토리지 디바이스 컨트롤러와 스토리지 어댑터 카드 사이에 짧은 케이블을 연결해 서버의 I/O 버스에 직접 연결된 모든 종류의 스토리지 디바이스를 말한다. 여기서 디스크는 DAS의 유일한 스토리지가 아니다. 자동화 테이프 라이브러리, 옵티컬 디스크 주크박스와 어떠한 종류의 스토리지 디바이스도 직접적으로 연결이 가능하다.

DAS는 상당히 오래 전에 개발되어 현재까지도 사용되고 있는 방식이다. DAS의 가장 큰 장점은 바로 매우 친숙한 테크놀로지라는 것. 또 다른 장점은 클러스트된 서버상에 디스크 드라이브를 공유할 수 있다는 것이다. 서버 클러스터링은 하나의 서버에 페일오버가 발생해도 다른 서버로 사용할 수 있다.

반면 DAS의 가장 큰 약점은 한 회사의 스토리지가 어느 정도 증가하게 되었을 때 확장에 대한 유연성이 떨어진다는 것이다. DAS의 스토리지 용량은 스토리지 캐비닛을 물리적으로 이동시키거나 케이블링 작업을 해야 하기 때문에 서버상에서 스토리지를 이동시키는 것이 상당히 어렵다. 때문에 용량의 확장이 쉽지 않다.

이러한 DAS의 단점을 보완하기 위해 스토리지 벤더사들은 이를 해결하기 위한 방안으로 네트워크상에서의 스토리지 공유 솔루션을 모색하기 시작했다. 즉 서버상에 네트워크 인터페이스를 가지고 있으면 더욱 빠른 네트워크와 지능형 스토리지 디바이스, 그리고 서버로 네트워크상에서 스토리지를 사용할 수 있다는 것이다. 네트워크 속도의 발전으로 스토리지의 유연성이 확장될 수 있기 때문이다. 이것이 바로 ‘Net work-Connected Storage"이며, 크게 NAS와 SAN으로 구분할 수 있다.


2. NAS와 SAN

NAS는 기존의 네트워크 기술에 데이터관리 기술을 접목한 것으로, NFS (Network File System)나 CIFS (Common Internet File System)와 같은 네트워크 프로토콜을 사용한다. 따라서 설치 및 관리가 용이하고 업체 간 표준화가 비교적 많이 진척되어 있다는 장점이 있다.

이에 비해 SAN은 서버와 스토리지 사이의 채널접속 기술에 네트워크 기술을 접목한 채널의 고속전송 기능과 네트워크의 장점을 결합했다. 이는 새로운 아키텍처로 SAN에 접속할 수 있도록 개발된 스토리지 또는 기존의 SCSI 스토리지 시스템이다.

NAS가 네트워크 중심의 데이터 저장관리 방식이라면 SAN은 채널 중심의 데이터 저장관리 방식이다. NAS가 기반으로 하고 있는 기가비트 이더넷과 SAN이 기반으로 하고 있는 파이버 채널을 비교해 보면 표 1과 같다.

NAS 업체에서는 SAN이 업체들 간에 표준화가 되어 있지 않다는 점을 공격하고 있다. 그러나, SAN과 NAS 모두 현재 진화 과정에 있는 기술이다. 즉, SAN과 NAS 모두 장점을 갖고 있고 나름대로의 응용 분야를 가지고 있다.

NAS의 응용분야는
▲유닉스와 NT의 파일 공유
▲분산환경에서 파일의 집중관리
▲CAD 같은 엔지니어링 그룹작업에서 파일그룹 관리
▲인터넷과 인트라넷
▲DSS(Decision Support System) 애플리케이션 등이며,


SAN의 응용분야는
△스토리지(디스크 및 테이프 저장 장치)의 전체 비용절감 △복수 서버에서 스토리지 공유
△대용량 디스크의 온라인 관리
△대용량 데이터의 백업 및 복구 관리
△복수 서버의 클러스터링
△물리적인 스토리지의 버추얼화
△스토리지로의 복수 경로 설정으로 가용성 확보
△스토리지 관리의 자동화 등이다.

구분 파이버 채널 기가비트 이더넷
테크놀러지 애플리케이션 스토리지, 네트워크, 비디오, 클러스터 네트워크
토폴로지 포인트-to-포인트, 루프 허브, 스위치드 포인트-to-포인트 허브, 스위치드
보드 레이트(Baud rate) 1.06Gbps 1.25Gbps
상위 데이터 레이트로의 확장성 2.12Gbps, 4.24Gbps 규정되어 있지 않음
딜리버리 보증 아니오
밀집 데이터 손실 없음 있음
프레임 크기 가변적, 0~2KB 가변적, 0~1.5KB
플로우 컨트롤 크레딧 기반 레이트 기반
물리적 미디어 구리와 섬유(Fiber) 구리와 섬유
지원되는 프로토콜 네트워크, SCSI, 비디오 네트워크


(표 1) 기가비트 이더넷과 파이버 채널의 비교



스토리지 테크놀로지의 활용과 미래

Storage Research(www.sresearch. com)는 SAN이 이미 주요 데이터베이스, 데이터 및 정보의 공유, 백업과 같은 데이터 보호 시스템에 주로 사용되고 있는, 중앙집중화 및 주요업무 환경을 위한 솔루션이고, NAS는 분산 워크그룹을 위한 솔루션이라고 밝히고 있다. 즉, SAN은 중대 규모의 데이터 저장관리와 대용량 데이터베이스, 그리고 비디오/오디오와 같은 특수 목적의 파일관리에, NAS는 중소 규모의 데이터 저장관리와 일반 애플리케이션의 파일관리에 적합하다고 할 수 있다.

한편, SAN 표준화를 진행하고 있는 대표적인 기구인 SNIA(www.snia.org) 내에 9개의 소그룹에는 NAS 그룹이 구성되어 있다. NAS 그룹은 NAS를 위한 공통용어의 정의, NAS 관리 전략의 정의, NAS를 정확하게 표현할 수 있는 기준의 개발, CIFS의 표준화 및 문서화, 그리고 이기종 환경에서 NAS 지원 등을 주요 목적으로 하고 있다.

NAS는 디스크 및 그와 관련된 관리 기술을 중심으로 발전하고 있고, SAN은 디스크뿐만 아니라 테이프 저장장치를 포함해서 파일시스템 및 보안 등의 컴퓨터 아키텍처 전반에 걸쳐 변화를 일으키고 있다. 즉, NAS는 앞으로 전체적인 SAN 아키텍처 내에서 SAN을 보완하는 기술로 발전할 것으로 보인다.

+ Recent posts