データの保全技術について

概要

ストレージについて

ストレージとは、長期間に大容量のでデータを保存できる場所である。

ストレージシステム

HDDやSSDを大量に接続した、外部ストレージのことである。
データの保全や高速化、大容量化の機能を持つ。

ネットワークストレージ

DAS

DASとは、Direct Attached Storageのことであり、各サーバにストレージが直結しているもの。

	flowchart TD
	DAS-->SAN & NAS
SAN

SANとは、Storage Area Networkのことであり、大容量、高速な、iSCSIやFibre Channelなどによる専用ネットワークのこと。

NAS

NASとは、Network Attached Storageのことであり、ファイル提供に特化したサーバである。

SANとNASの比較
種別プロトコルや規格アクセスの単位パフォーマンスコスト
SANFC-SANSCSI, FCブロック
SANIP-SANiSCSI,TCP/IPブロック
SANFCoEFCoE Ethernetブロック
NASNASNFS,CIFS,TCP/IPファイル

RAID

別ノート参照

RAIDの種類とその概要

RAIDの種類とその概要

概要

RAIDとは、複数台の物理ディスクを1台の論理ディスクとして利用する技術。

  • 冗長構成による耐障害性の向上
  • 入出力の向上

RAIDの種類

種類利用技術ディスク数特徴
RAID 0ストライピング2 台以上大容量、高速、低耐障害性
RAID 1ミラーリング2 台以上高耐障害性
RAID 2ストライピング
ECC
5 台以上高コスト
RAID 3ストライピング
パリティチェック
3 台以上
RAID 4ストライピング
パリティチェック
3 台以上
RAID 5ストライピング
パリティチェック
3 台以上パリティを複数に分散
高速、大容量、高耐障害性
RAID 6ストライピング
パリティチェック
4 台以上パリティを複数ドライブに分散
RAID 5よりも高耐障害性

RAID詳細説明

RAID 0

入出力性能の向上のため、データを分割して別々のディスクに書き込みする。
信頼性は向上しない。
一台でもディスクが故障すると読み書き不能となる。

RAID 1

信頼性向上のため、同じでデータを2台のディスクに同時に書きこむ。
どちらかのディスクが故障しても、データが残る。
入出力性能は向上しない。

RAID 4

エラー訂正符号(パリティ)の保全用に1台のディスクを占有。

  • データの更新時にパリティの更新が必要。(write penalty)
  • パリティ保存用ディスクにアクセスが集中する。
    2台のディスクが同時に故障すると読み書き不能

RAID 5

RAID 5はRAID 4 とパリティの分散配置をしたもの
3台以上のディスクにデータをパリティを分散配置する。

  • パリティ保存用ディスクへのアクセス過多を軽減する。
  • write penaltyはRAID 4と同様
    2台のディスクが同時に故障すると読み書き不能
  • 同じ時期に製造されたディスクでシステムが構成されるこ とが多いため,この構成は避けたほうが良い

RAID 6

RAID 6はRAID 5とパリティを二重化したもの。

  • 4台以上のディスクを利用し、2種類生成した パリティを分散配置
  • 2台のディスクに同時に障害が発生しても2種類の パリティ情報からデータの復旧が可能
  • 容量効率や書き込み性能はRAID5に劣る

RAIDシステムの障害

システム構築時に、ハードディスクはまとめて購入するのでHDDは同じ時期に壊れることが多い。

RAIDを構成するハードディスクが壊れた際に、自動的に呼びに切り替えるホットスペアを併用することが多い。

各ストレージメーカの独自の高信頼化技術を実装していることが多い。

ストライピングとは

ストライピングとは、データを複数に分散して保存して、アクセスの高速化を図る技術である。

ミラーリングとは

ミラーリングとは、データを多重保存することで、ディスクが1台故障しても別のディスクを使うことで、データが無くならないようにする技術である。

パリティチェックとは

パリティチェックとは、パリティを使用して欠損しているデータをチェックすることが出来る技術である。

元記事へのリンク