블로그 상세 정보

집 블로그

X67의 NAS 특징: RAID 기술의 개념, 원칙 및 응용

2025-01-07

RAID(Redundant Array of Independent Disks)는 원래 Redundant Array of Inexpensive Disks로 알려져 있으며, 1988년 캘리포니아대학교 버클리캠퍼스의 DA Patterson 교수가 "A Case of Redundant Array of Inexpensive Disks"라는 논문에서 처음 제안했습니다. 당시 대용량 디스크는 가격이 비싸므로, 소용량, 상대적으로 저렴한 디스크 여러 개를 유기적으로 결합하여 용량을 얻는 것이 RAID의 기본 개념이었습니다. 저렴한 비용으로 고가의 대용량 디스크와 동등한 성능과 안정성을 제공합니다. 디스크 비용과 가격이 계속 낮아지면서 '저렴하다'라는 말은 의미가 없어졌고, RAID 자문위원회(RAB)는 '저렴하다'를 '독립적'으로 바꾸기로 결정했다.

이러한 RAID 설계 아이디어는 업계에서 빠르게 채택되었습니다. RAID 기술은 고성능, 고신뢰성 스토리지 기술로 널리 적용되고 있습니다. RAID는 주로 데이터 스트라이핑, 미러링 및 데이터 패리티 기술을 사용하여 고성능, 신뢰성, 내결함성 및 확장성을 달성합니다. 이 세 가지 기술을 사용하거나 결합하는 전략 및 아키텍처에 따라 RAID는 다양한 데이터 애플리케이션의 요구 사항을 충족하기 위해 다양한 수준으로 나눌 수 있습니다. 원래 RAID 레벨인 RAID1-RAID5는 DA Patterson et al.의 논문에서 정의되었으며, RAID0과 RAID6은 1988년 이후 확장되었습니다. 최근 몇 년 동안 스토리지 공급업체는 RAID7, RAID10/01, RAID50, RAID53 및 RAID100과 같은 RAID 레벨을 지속적으로 도입했지만 통일된 표준은 없습니다. 현재 업계에서 인정하는 표준은 RAID0-RAID5이며, RAID2를 제외한 4개 레벨이 산업 표준으로 설정되었습니다. 실제 응용 분야에서 가장 일반적으로 사용되는 RAID 레벨은 RAID0, RAID1, RAID3, RAID5, RAID6 및 RAID10입니다.

구현 관점에서 RAID는 주로 소프트웨어 RAID, 하드웨어 RAID 및 하이브리드 RAID의 세 가지 유형으로 나뉩니다. 소프트웨어 RAID의 경우 모든 기능은 운영 체제와 CPU에 의해 완료되며 독립적인 RAID 제어/처리 칩과 I/O 처리 칩이 없으므로 효율성이 가장 낮습니다. 하드웨어 RAID는 특수한 RAID 제어/처리 칩과 I/O 처리 칩, 어레이 버퍼 등을 탑재하고 있어 CPU 자원을 점유하지 않지만 비용이 매우 높다. 하이브리드 RAID는 RAID 제어/처리 칩은 있지만 I/O 처리 칩이 부족하고 CPU와 드라이버 프로그램이 있어야 완성되며 성능과 비용은 소프트웨어 RAID와 하드웨어 RAID 사이에 있습니다.

각 RAID 레벨은 구현 방법과 기술을 나타내며, 높은 레벨과 낮은 레벨의 구분은 없습니다. 실제 응용에서는 사용자 데이터 응용의 특성에 따라 적절한 RAID 수준과 구체적인 구현 방법을 선택해야 하며 가용성, 성능 및 비용을 종합적으로 고려해야 합니다.

기본원리

RAID, 즉 독립 디스크의 중복 배열은 일반적으로 디스크 배열로 축약됩니다. 간단히 말하면, RAID는 여러 개의 독립적인 고성능 디스크 드라이브로 구성된 디스크 하위 시스템으로, 단일 디스크보다 더 높은 저장 성능과 데이터 중복 기술을 제공합니다. RAID는 호스트 환경에 비용 효율적이고 높은 데이터 신뢰성과 고성능 스토리지를 제공하는 다중 디스크 관리 기술입니다. SNIA의 RAID 정의는 물리적 저장 공간의 일부를 사용하여 나머지 공간에 저장된 사용자 데이터의 중복 정보를 기록하는 디스크 어레이입니다. 디스크나 액세스 경로에 오류가 발생하면 중복 정보를 사용하여 사용자 데이터를 재구성할 수 있습니다. 디스크 스트라이핑은 RAID의 정의를 따르지 않지만 일반적으로 RAID(예: RAID0)라고도 합니다.

RAID의 원래 의도는 대규모 서버에 고급 스토리지 기능과 중복 데이터 보안을 제공하는 것이었습니다. 전체 시스템에서 RAID는 두 개 이상의 디스크로 구성된 저장 공간으로 간주되며, 여러 디스크의 데이터를 동시에 읽고 쓰므로 저장 시스템의 I/O 성능이 향상됩니다. 대부분의 RAID 레벨에는 완전한 데이터 확인 및 수정 조치, 심지어 미러링 방법까지 포함되어 있어 시스템의 신뢰성을 크게 향상시키며, 여기서 "중복"이 유래됩니다.

여기서는 JBOD(Just a Bunch of Disks)를 언급해야 합니다. 처음에 JBOD는 조정된 제어를 제공하기 위해 제어 소프트웨어 없이 디스크 모음을 나타내는 데 사용되었으며, 이는 RAID와 JBOD를 구별하는 주요 요소입니다. 현재 JBOD는 RAID 기능 제공 여부에 관계없이 디스크 인클로저를 가리키는 경우가 많습니다.

RAID의 두 가지 주요 목표는 데이터 신뢰성과 I/O 성능을 향상시키는 것입니다. 디스크 어레이에서는 데이터가 여러 디스크에 분산되어 있지만 컴퓨터 시스템에서는 단일 디스크처럼 보입니다. 중복성은 동일한 데이터를 여러 디스크에 쓰거나(일반적으로 미러링) 계산된 패리티 데이터를 어레이에 쓰는 방식으로 이루어지므로 단일 디스크에 장애가 발생하더라도 데이터 손실이 발생하지 않습니다. 일부 RAID 레벨에서는 동시에 두 개의 디스크가 손상될 수 있는 RAID6과 같이 더 많은 디스크가 동시에 실패할 수 있습니다. 이러한 중복 메커니즘에서는 오류가 발생한 디스크를 새 디스크로 교체할 수 있으며, RAID는 나머지 디스크의 데이터 및 패리티 데이터에 따라 손실된 데이터를 자동으로 재구성하여 데이터 일관성과 무결성을 보장합니다. 데이터는 RAID의 여러 다른 디스크에 분산되어 저장되며, 단일 디스크보다 동시 데이터 읽기 및 쓰기가 훨씬 우수하므로 더 높은 집계 I/O 대역폭을 얻을 수 있습니다. 물론 디스크 어레이는 모든 디스크의 사용 가능한 총 저장 공간을 줄여서 더 높은 안정성과 성능을 제공하는 대신 공간을 희생합니다. 예를 들어 RAID1의 저장 공간 활용도는 50%에 불과하고 RAID5는 디스크 한 개의 저장 용량을 잃게 되며 공간 활용도는 (n-1)/n입니다.

디스크 어레이는 일부 디스크(구현에 따라 단일 또는 다중)가 손상된 경우 중단 없이 시스템의 지속적인 작동을 보장할 수 있습니다. 장애가 발생한 디스크의 데이터를 새 디스크로 재구성하는 과정에서 시스템은 계속해서 정상적으로 작동할 수 있지만 성능이 어느 정도 저하됩니다. 일부 디스크 어레이는 디스크를 추가하거나 삭제할 때 종료해야 하는 반면, 일부는 핫 스와핑을 지원하므로 종료하지 않고도 디스크 드라이브를 교체할 수 있습니다. 이 고급 디스크 어레이는 신뢰성에 대한 요구가 높은 응용 시스템에 주로 사용되며 시스템을 종료할 수 없거나 종료 시간을 최대한 줄여야 합니다. 일반적으로 RAID는 데이터 백업을 대체할 수 없습니다. 바이러스, 인적 파괴, 실수로 인한 삭제 등 디스크 이외의 오류로 인한 데이터 손실에는 무력합니다. 이때 데이터 손실은 운영 체제, 파일 시스템, 볼륨 관리자 또는 응용 프로그램 시스템과 관련됩니다. RAID 시스템 자체의 경우 데이터가 그대로 유지되며 손실이 발생하지 않습니다. 따라서 데이터 손실을 방지하기 위해 RAID를 보완하고 다양한 수준에서 데이터 보안을 보호하는 데이터 백업, 재해 복구 및 기타 데이터 보호 조치가 매우 필요합니다.

RAID에는 미러링, 데이터 스트라이핑, 데이터 패리티라는 세 가지 주요 개념과 기술이 있습니다. 미러링은 데이터를 여러 디스크에 복사합니다. 한편으로는 신뢰성을 향상시킬 수 있고, 다른 한편으로는 두 개 이상의 복사본에서 동시에 데이터를 읽어 읽기 성능을 향상시킬 수 있습니다. 분명히 미러링의 쓰기 성능은 약간 낮으며 데이터가 여러 디스크에 올바르게 기록되는지 확인하는 데 더 많은 시간이 걸립니다. 데이터 스트라이핑은 여러 개의 서로 다른 디스크에 데이터 조각을 저장하고 여러 데이터 조각이 함께 완전한 데이터 복사본을 형성합니다. 이는 미러링의 여러 복사본과 다르며 일반적으로 성능 고려 사항에 사용됩니다. 데이터 스트라이핑은 동시성 세분성이 더 높습니다. 데이터에 액세스할 때 동시에 다른 디스크에 있는 데이터를 읽고 쓸 수 있으므로 I/O 성능이 크게 향상됩니다. 데이터 패리티는 데이터 오류 감지 및 복구를 위해 중복 데이터를 사용합니다. 중복된 데이터는 일반적으로 Hamming 코드 및 XOR 연산과 같은 알고리즘을 통해 계산됩니다. 패리티 기능을 사용하면 디스크 어레이의 신뢰성, 견고성 및 내결함성을 크게 향상시킬 수 있습니다. 그러나 데이터 패리티는 여러 위치에서 데이터를 읽고 계산 및 비교를 수행해야 하며 이는 시스템 성능에 영향을 미칩니다. 다양한 수준의 RAID는 위의 세 가지 기술 중 하나 이상을 채택하여 다양한 데이터 신뢰성, 가용성 및 I/O 성능을 얻습니다. 어떤 종류의 RAID(새로운 레벨이나 유형이라도)를 설계할지, 어떤 RAID 모드를 채택할지에 대해서는 시스템 요구 사항을 깊이 이해하고 신뢰성, 성능, 비용을 종합적으로 평가하여 절충적인 선택을 한다는 전제 하에 합리적인 선택이 필요합니다.

RAID의 장점

대용량: 이는 RAID의 분명한 장점입니다. 디스크 용량을 확장하며, 여러 개의 디스크로 구성된 RAID 시스템은 거대한 저장 공간을 갖습니다. 이제 단일 디스크의 용량이 1TB 이상에 도달할 수 있으므로 RAID의 스토리지 용량이 PB 수준에 도달할 수 있으며 대부분의 스토리지 요구 사항을 충족할 수 있습니다. 일반적으로 RAID의 사용 가능한 용량은 모든 구성원 디스크의 총 용량보다 적습니다. 다양한 수준의 RAID 알고리즘에는 특정 중복 오버헤드가 필요하며 특정 용량 오버헤드는 채택된 알고리즘과 관련됩니다. RAID 알고리즘과 용량을 알면 RAID의 사용 가능한 용량을 계산할 수 있습니다. 일반적으로 RAID의 용량 활용도는 50%에서 90% 사이입니다.
고성능: RAID의 고성능은 데이터 스트라이핑 기술의 이점을 활용합니다. 단일 디스크의 I/O 성능은 인터페이스, 대역폭 등 컴퓨터 기술에 의해 제한되며 시스템 성능의 병목 현상이 되는 경우가 많습니다. RAID는 데이터 스트라이핑을 통해 데이터 I/O를 각 구성원 디스크에 분산시켜 단일 디스크보다 몇 배 더 높은 통합 I/O 성능을 얻습니다.
신뢰할 수 있음: 가용성과 안정성은 RAID의 또 다른 중요한 기능입니다. 이론적으로 여러 개의 디스크로 구성된 RAID 시스템의 신뢰성은 단일 디스크의 신뢰성보다 떨어집니다. 여기에는 암묵적인 가정이 있습니다. 단일 디스크 오류로 인해 전체 RAID를 사용할 수 없게 된다는 것입니다. RAID는 미러링 및 데이터 패리티와 같은 데이터 중복 기술을 사용하여 이러한 가정을 깨뜨립니다. 미러링은 가장 원시적인 중복 기술로, 특정 디스크 드라이브 그룹의 데이터를 다른 디스크 드라이브 그룹에 완전히 복사하여 항상 데이터 복사본을 사용할 수 있도록 합니다. 미러링의 50% 중복 오버헤드와 비교하면 데이터 패리티는 훨씬 작으며 패리티 중복 정보를 사용하여 데이터를 확인하고 수정합니다. RAID의 중복 기술은 데이터 가용성과 신뢰성을 크게 향상시키며, 여러 디스크에 장애가 발생하더라도 데이터가 손실되지 않고 시스템의 지속적인 작동이 영향을 받지 않도록 보장합니다.
관리 용이성: 실제로 RAID는 여러 개의 물리적 디스크 드라이브를 대용량 논리 드라이브로 가상화하는 가상화 기술입니다. 외부 호스트 시스템의 경우 RAID는 빠르고 안정적인 단일 대용량 디스크 드라이브입니다. 이러한 방식으로 사용자는 이 가상 드라이브에 애플리케이션 시스템 데이터를 구성하고 저장할 수 있습니다. 사용자 애플리케이션 관점에서 보면 스토리지 시스템을 간단하고 사용 및 관리하기 쉽게 만들 수 있습니다. RAID는 내부적으로 많은 양의 스토리지 관리 작업을 완료했기 때문에 관리자는 단일 가상 드라이브만 관리하면 되므로 많은 관리 작업을 줄일 수 있습니다. RAID는 디스크 드라이브를 동적으로 추가하거나 삭제하고 자동으로 데이터 확인 및 데이터 재구성을 수행하여 관리 작업을 크게 단순화할 수 있습니다.

블로그 상세 정보

집 블로그

X67의 NAS 특징: RAID 기술의 개념, 원칙 및 응용

기본원리

RAID의 장점

대용량: 이는 RAID의 분명한 장점입니다. 디스크 용량을 확장하며, 여러 개의 디스크로 구성된 RAID 시스템은 거대한 저장 공간을 갖습니다. 이제 단일 디스크의 용량이 1TB 이상에 도달할 수 있으므로 RAID의 스토리지 용량이 PB 수준에 도달할 수 있으며 대부분의 스토리지 요구 사항을 충족할 수 있습니다. 일반적으로 RAID의 사용 가능한 용량은 모든 구성원 디스크의 총 용량보다 적습니다. 다양한 수준의 RAID 알고리즘에는 특정 중복 오버헤드가 필요하며 특정 용량 오버헤드는 채택된 알고리즘과 관련됩니다. RAID 알고리즘과 용량을 알면 RAID의 사용 가능한 용량을 계산할 수 있습니다. 일반적으로 RAID의 용량 활용도는 50%에서 90% 사이입니다.
고성능: RAID의 고성능은 데이터 스트라이핑 기술의 이점을 활용합니다. 단일 디스크의 I/O 성능은 인터페이스, 대역폭 등 컴퓨터 기술에 의해 제한되며 시스템 성능의 병목 현상이 되는 경우가 많습니다. RAID는 데이터 스트라이핑을 통해 데이터 I/O를 각 구성원 디스크에 분산시켜 단일 디스크보다 몇 배 더 높은 통합 I/O 성능을 얻습니다.
신뢰할 수 있음: 가용성과 안정성은 RAID의 또 다른 중요한 기능입니다. 이론적으로 여러 개의 디스크로 구성된 RAID 시스템의 신뢰성은 단일 디스크의 신뢰성보다 떨어집니다. 여기에는 암묵적인 가정이 있습니다. 단일 디스크 오류로 인해 전체 RAID를 사용할 수 없게 된다는 것입니다. RAID는 미러링 및 데이터 패리티와 같은 데이터 중복 기술을 사용하여 이러한 가정을 깨뜨립니다. 미러링은 가장 원시적인 중복 기술로, 특정 디스크 드라이브 그룹의 데이터를 다른 디스크 드라이브 그룹에 완전히 복사하여 항상 데이터 복사본을 사용할 수 있도록 합니다. 미러링의 50% 중복 오버헤드와 비교하면 데이터 패리티는 훨씬 작으며 패리티 중복 정보를 사용하여 데이터를 확인하고 수정합니다. RAID의 중복 기술은 데이터 가용성과 신뢰성을 크게 향상시키며, 여러 디스크에 장애가 발생하더라도 데이터가 손실되지 않고 시스템의 지속적인 작동이 영향을 받지 않도록 보장합니다.
관리 용이성: 실제로 RAID는 여러 개의 물리적 디스크 드라이브를 대용량 논리 드라이브로 가상화하는 가상화 기술입니다. 외부 호스트 시스템의 경우 RAID는 빠르고 안정적인 단일 대용량 디스크 드라이브입니다. 이러한 방식으로 사용자는 이 가상 드라이브에 애플리케이션 시스템 데이터를 구성하고 저장할 수 있습니다. 사용자 애플리케이션 관점에서 보면 스토리지 시스템을 간단하고 사용 및 관리하기 쉽게 만들 수 있습니다. RAID는 내부적으로 많은 양의 스토리지 관리 작업을 완료했기 때문에 관리자는 단일 가상 드라이브만 관리하면 되므로 많은 관리 작업을 줄일 수 있습니다. RAID는 디스크 드라이브를 동적으로 추가하거나 삭제하고 자동으로 데이터 확인 및 데이터 재구성을 수행하여 관리 작업을 크게 단순화할 수 있습니다.

미니 PC

팬 없는 PC

방화벽 미니 PC

산업용 PC

소프트 라우터

pc를 게임하기

미니컴퓨터

인텔 미니 PC

amd 미니 pc

터치 패널

X86 미니 메인보드

1U 2U 3U 서버

사용자 지정 미니 PC

DVD 드라이브

미니 PC

팬 없는 PC

방화벽 미니 PC

산업용 PC

소프트 라우터

pc를 게임하기

미니컴퓨터

인텔 미니 PC

amd 미니 pc

터치 패널

X86 미니 메인보드

1U 2U 3U 서버

사용자 지정 미니 PC

DVD 드라이브

블로그 상세 정보

X67의 NAS 특징: RAID 기술의 개념, 원칙 및 응용

X67의 NAS 특징: RAID 기술의 개념, 원칙 및 응용

X67의 NAS 특징: RAID 기술의 개념, 원칙 및 응용

X67의 NAS 특징: RAID 기술의 개념, 원칙 및 응용