www.SAMURAJ-cz.com 

02.05.2024 Zikmund Translate to English by Google     VÍTEJTE V MÉM SVĚTĚ

Články

Storage technologie a SAN sítě aneb připojení serverů k diskovému poli

Neděle, 04.06.2017 21:49 | Samuraj - Petr Bouška |
Článek se snaží komplexně, přehledně, ale stručně, popsat oblast ukládání dat se zaměřením na disková pole. A síťové komunikace a protokoly, které se k tomu používají, primárně v oblasti SAN sítí, tedy iSCSI a Fibre Channel Protocol (FCP). Jde o obecný popis, jak server získá disk z úložného systému. Následovaný popisem realizace a rozdílů v iSCSI a FCP. Článek by měl poskytnout určité srovnání obou protokolů, jejichž obecný princip je velmi podobný.

Důležitá věc, v celé této oblasti, je terminologie. Nejen, že tu máme anglické termíny a k nim české (budeme si uvádět oboje), ale ještě se často v rámci různých technologií nebo výrobců používá pro stejnou věc jiné označení. Článek je psán trochu netradičně. V popisných odstavcích v jednotlivých kapitolách jsou zmíněny odborné termíny a na různých místech článku se nachází odrážkou uvedený popis těchto termínů.

V  článku se snažím dát do souvislostí řadu různých informací a technologií, které jsem popisoval ve starších příspěvcích. Zde se jedná více o obecný a teoretický popis, pro více praktické informace je možno nahlédnout do jednotlivých článků:

Storage

Disková pole

SAN Fibre Channel

SAN iSCSI

LAN a sítě obecně

Storage - ukládání dat a disková pole

Nejprve si určíme celou oblast, do které tento článek spadá, a kterou bych asi nejobecněji označil jako počítačové ukládání dat, tedy Computer Data Storage. Často se (i v češtině) používá krátké označení Storage. Zde se nebudeme věnovat vlastním médiím pro ukládání dat, pamětem ani technologiím přímého připojení úložiště (DAS - Directly Attached Storage). Ale obecně diskovým polím a komunikačnímu přístupu k nim.

Diskové pole je externí zařízení, které centralizovaně poskytuje úložnou kapacitu (diskový prostor). Standardně obsahuje diskové řadiče (controller), fyzické disky, cache a různá rozhraní. Je stavěno s důrazem na vysokou dostupnost, odolnost a jednoduchou údržbu, takže komponenty jsou standardně redundantní a vyměnitelné za chodu. Data se ukládají přes více disků s nějakou technikou ochrany proti výpadku fyzického disku.

Diskové pole NetApp E-Series 5600

Celý termín diskové pole souvisí s nejpoužívanější  technologií pro ukládání dat na více disků, což je RAID (Redundant Array of Independent Disks). Technologie RAID spojí více fyzických disků do jedné logické jednotky s možností zajištění redundance dat a zvýšení výkonu. Většina diskových polí podporuje různé stupně (typy) RAIDu. Technologii RAID můžeme použít i na serverech, kdy se používá buď softwarový RAID, nebo spíše hardwarový RAID k čemuž potřebujeme RAID řadič.

V češtině se používají termíny diskové pole, úložný systém nebo pouze úložiště či pole. V angličtině je nyní asi nejpoužívanější Storage System, dále Data Storage System, Storage Array, Disk Array či pouze Storage nebo Array.

Dělení diskových polí (úložišť)

Hlavní rozdělení diskových polí je podle přístupu k datům (úložnému prostoru). Může se jednat o

  • blokový přístup (Block Level) - přistupuje se přímo k médiu pomocí protokolů jako iSCSI a Fibre Channel a přenáší se datové bloky. Prostor se na serveru tváří jako lokální disk.
  • souborový přístup (File Level) - získávají se soubory pomocí protokolů jako NFS a CIFS/SMB. Pole tohoto typu nám nahrazuje souborový server. Prostor můžeme namapovat jako síťovou jednotku.
Storage podle přístupu

 Pole jsou pak standardně dvou rozdílných kategorií, i když se dnes stále více objevuje kombinace obojího.

  • NAS - Network Attached Storage - využívá souborový přístup (jde o File-based Data Storage), je připojen do LAN sítě, pracuje přímo se soubory, takže na nich může provádět nějaké nadstandardní funkce a optimalizace, využívá protokoly pro sdílení souborů po síti, jako je NFS, CIFS/SMB
Network Attached Storage
  • SAN - Storage Area Network - termín SAN neoznačuje diskové pole, ale dedikovanou sít pro přenos dat, přesto mluvíme o diskových polích typu SAN, tato pole využívají blokový přístup (jde o Block-level Data Storage), nepřipojují se do LAN (pouze kvůli správě), ale právě do oddělené SAN sítě, k serveru (klientovi) se připojuje přímo diskový prostor a tam se teprve vytváří souborový systém a pracuje se soubory
Storage Area Network

V tomto článku se zaměřujeme na disková pole typ SAN.

Pozn.: V popisu zmiňuji sítě LAN, které označuji jako telekomunikační sítě, ale většinou je možno uvažovat libovolné Ethernetové sítě (různých velikostí). A sítě SAN, které označuji jako datové sítě (i když samozřejmě i v LAN sítích se přenáší data).

Disková pole typu SAN

Při globálním pohledu máme diskové pole, které je připojeno do speciální vyhrazené datové sítě SAN. Do této sítě jsou připojeny také servery, kterým chceme poskytnout diskový prostor (servery nemusí mít žádný lokální disk a mohou z pole i bootovat), případně další zařízení (třeba pro zálohování a archivaci).

Host - klient pro pole (server)

Z pohledu pole se v angličtině vždy používá termín Host pro zařízení, která se připojují na pole, a to jim poskytuje diskový prostor. Host znamená česky hostitel, což mi jako termín připadá dost zvláštní, protože bych řekl, že hostitel je pole a ten kdo se připojuje je spíš host (anglicky Guest) nebo klient. Ještě je zde to zmatení, že české a anglické slovo host má opačný význam.

Fyzické komponenty diskového pole

Diskové pole se standardně skládá ze dvou (možno i více) kontrolérů/řadičů (Disk Array Controller), ty často pracují v clusteru (aby zajistili vysokou dostupnost) a pak se o nich mluví jako o uzlech (Node). Kontroléry mají operační systém (Operating System - Firmware), který řídí fungování pole. Obsahují procesor, paměť, cache, různá rozhraní (Interface). Někdy se kontrolér diskového pole (nebo jeho část) označuje jako Storage Processor či Service Processor (SP).

Rozhraní slouží pro komunikaci interně s disky (nejčastěji pomocí SAS) a pro připojení do SAN sítě a komunikaci s Hosty (nejčastěji Ethernet pro iSCSI nebo Fibre Channel pro Fibre Channel Protocol). Často jsou rozhraní modulární (řadič má sloty, kam můžeme vložit rozhraní potřebného typu) a můžeme i kombinovat více typů. Kontroléry mají ještě Ethernetový port pro připojení do management LAN sítě, přes kterou se provádí správa pole.

Kontroléry se umísťují do skříně (Chassis), která také obsahuje napájecí zdroje a ventilátory. U některých polí se umisťují disky přímo do skříně s kontroléry, ale v každém případě je možno připojit další diskové police. Různí výrobci používají různé termíny pro označení skříní a polic. Častý termín je Enclosure, tedy třeba Controller Enclosure a Expansion Disk Enclosure. Dále se používá Disk Shelf, System Shelf, Cage, Tray.

NetApp AFF8040 zapojení 1

Diskové pole a virtualizace

Diskové pole vlastně provádí virtualizaci, protože vezme fyzické komponenty, nad nimi vytvoří komponenty logické (virtuální) a ty přiděluje různým konzumentům. Tedy diskové pole rozdělíme na virtuální části a k jednomu poli se připojuje řada serverů. Moderní úložné systémy podporují rozdělení pole na nezávislé administrační části (Virtual Storage Controller či Virtual Domains), kdy můžeme nějakému správcovskému účtu přiřadit určité vymezené HW prostředky a pro něj se tváří jako samostatné pole.

Logické komponenty diskového pole

Jak přesně se vytváří logická struktura, a z jakých vrstev se skládá, záleží na výrobci. Každý má svoji metodu, která je vždy lepší než konkurence. Obecně můžeme říci, že fyzické disky (Physical Disk Drive) seskupujeme do nějaké skupiny (Group; může jít i o více vrstev zapouzdřených do sebe) a na ní definujeme typ RAIDu (nebo podobné technologie). Další část je již víceméně jednotná. Uvnitř diskové skupiny vytváříme svazky (Volume), což je logický prostor, kam se již ukládají data. Svazky (Volume) spojujeme s klienty (Host) pomocí LUN - Logical Unit Number. Pro přiřazení svazku k serveru (Host) se používá mnoho termínů Presentation, Mapping, Assign, Export. Svazky (Volume) i klienty (Host) můžeme seskupovat do sad (Set) a provádět hromadné přiřazení.

Logické komponenty diskového pole NetApp Logické komponenty diskového pole HP 3PAR

SAN - Storage Area Network

Storage Area Network (SAN) je speciální síť, která poskytuje přístup ke konsolidovanému datovému úložišti (diskové prostory ze serverů jsou přesunuty na jedno centrální místo, což dovolí efektivnější využití, vyšší výkon, zajištění větší redundance a využití clusterových služeb). Do sítě připojujeme cíl (Target), což je primárně diskové pole (Storage Array) či nějaké zálohovací zařízení, a zdroj (Initiator), což jsou standardně servery. Běžně v SAN síti probíhá blokový přenos dat a serverům se připojuje disk z pole, který se chová stejně jako lokální (vypadá identicky jako disk připojený na SATA, přesněji SCSI, a můžeme s ním provádět stejné operace), komunikuje se pomocí SCSI protokolu. V SAN síti se primárně využívá transportních protokolů Fibre Channel Protocol (FCP) nebo Internet Small Computer System Interface (iSCSI).

Schéma počítačové sítě, kde je použita LAN i SAN

SAN síť se skládá z aktivních síťových prvků, kabeláže (pasivních síťových prvků) a připojených zařízení. Zařízení obecně označujeme jako (následující termíny jsou hojně využívány u iSCSI, ale používají se i pro FC, jde o obecné termíny pro SCSI):

  • Initiator (SCSI Initiator) - klient (ve většině případů jde o server), který posílá SCSI příkazy přes síť. Většinou se připojuje k LUNu, vyjednává připojení s Target. Může být softwarový (pak využívá běžnou síťovou kartu - NIC) nebo hardwarový (jedná se o speciální HBA), což poskytne větší výkon odlehčením procesoru. Pro FC existuje pouze HW Initiator.
  • Target (SCSI Target) - standardně cílová adresa diskového pole, přes kterou se Initiator připojuje k LUNu a posílá na něj vstupně/výstupní požadavky. Obecně jde o síťové úložiště, ale může jít i o počítač s odpovídajícím softwarem.

Pozn.: Software pro provozování iSCSI Initiator, stejně jako iSCSI Target, je součástí Windows Server a je běžně dostupný pro Linuxové distribuce. K dispozici jsou i aplikace, které poskytují FC Target. FC Initiator je součástí FC HBA, tedy je řešen v HW.

Primární účel SAN sítě je takový, že Initiator získá z Target diskový prostor (virtuální disk). Pro označení tohoto prostoru (logického disku) z pole se v praxi používají dva termíny (i když by mělo záležet na kontextu a význam těchto termínů je odlišný, tak se v praxi zaměňují). LUN a Volume mají obecně daný význam, ale různí výrobci pole jim dávají různé vlastnosti a různě je ve své terminologii používají.

  • Volume (svazek) - logický prostor na poli, který se vytváří uvnitř skupiny fyzických disků, a přiděluje klientovi. Do něj se ukládají vlastní data. Něco jako oddíl (partition) z pohledu pole. Z pohledu serveru (kterému jej přidělíme) je to disk a uvnitř můžeme vytvářet oddíly (dnes se i ve světě Windows používá spíše termín Volume). Definujeme základní parametry jako je velikost (můžeme ji dále měnit) a typ (například Thick a Thin).
  • LUN - Logical Unit Number - reprezentuje individuálně adresovatelné logické zařízení (jednotku). Je to číslo pro identifikaci svazku (pokud je jich více, jinak je 0). Zjednodušeně se říká, že LUN je logický disk. Když serveru přiřadíme více svazků (Volume), tak každý má jiné číslo LUN. Z pohledu SCSI je LUN logické (adresovatelné) zařízení, které je součástí fyzického zařízení (Target).

Pozn.: U některých výrobců můžeme uvnitř Volume vytvořit několik LUNů, které přiřazujeme serverům jako samostatné disky. Další řešení je, že uvnitř Volume vytvoříme menší LUN a volný prostor se může využít pro Snapshoty (pokud chceme využít Snapshoty, tak uvnitř Volume musí zůstat volné místo).

Aktivní a pasivní síťové prvky

SAN síť se dnes staví buď na technologii Fibre Channel nebo Ethernet, podle toho jaký přenosový protokol chceme použít, a tomu odpovídá použitá kabeláž a aktivní síťové prvky. iSCSI funguje nad Ethernetem a můžeme použít metalické (Copper) nebo optické (Optical Fiber) kabely a běžné Ethernetové přepínače (switch). FCP běží nad Fibre Channel a (převážně) používáme optické (Optical Fiber) kabely a speciální FC přepínače. Alternativa je využití FCoE, kdy se FC rámce zapouzdří do Ethernetových a pak můžeme použít klasické Ethernetové přepínače (efektivnější je přepínač s podporou FCoE).

SFP šachty na switchi s SFP 1000Base-T Transceiver SFP pro Fibre Channel s konektorem LC

Na straně serveru (Host) je důležitá fyzická komponenta, které jej připojuje do SAN sítě. Pro Ethernet se může jednat o běžnou síťovou kartu NIC nebo specializovaný HBA, což je v podstatě síťová karta, která různé časté operace provádí v HW. Pro Fibre Channel musíme použít speciální FC HBA (běžní výrobci jsou QLogic, Emulex, Brocade).

  • NIC - Network Interface Card - síťová karta. Komponenta, která připojuje zařízení do počítačové sítě.
  • HBA - Host Bus Adapter - obdoba síťové karty. Komponenta, která připojuje zařízení do SAN sítě. Obsahuje hardwarový Initiator. Různé časté operace provádí v HW a tak ulehčí procesoru na serveru (třeba off-load TCP/IP a iSCSI protokolu). Často se termín HBA používá pro FC interface card, ale třeba také pro specializovanou kartu pro iSCSI.

Ze srovnání tedy plyne, že iSCSI SAN můžeme budovat z relativně běžných komponent, kdežto pro FC SAN potřebujeme (speciální) kabeláž a určitě speciální aktivní síťové prvky. Ještě složitější je situace, kdy se SAN síť nebuduje pouze v rámci lokality (LAN), ale roztahuje se přes více datových center (WAN). Pro iSCSI můžeme teoreticky využít i Internet, i když musí být zajištěny určité požadavky na kvalitu spojení a bezpečnost. Pro FC SAN potřebujeme speciální spoje datových center.

Síťová topologie (zapojení)

Do celého IT prostředí se stále více prosazuje virtualizace, konsolidace a konvergence. Takže i v počítačových sítích se objevují možnosti konvergovaných sítí, kdy je spojený přenos LAN i SAN. Tradiční pohled přesto stále převládá a v něm se doporučuje oddělená SAN síť od LAN sítě, a to i v případě, kdy jsou obě postaveny na Ethernetu.

V popisech se rozděluje síťový design FC SAN nebo IP SAN (jiné označení Ethernet SAN), ale obecné principy jsou shodné. V rámci SAN běžně vytváříme dvě oddělené sítě, každá má jiný adresní rozsah a mezi sebou nejsou propojené (jsou uzavřené). Hlavní důvod je vysoká dostupnost a bezpečnost. Pokud tento požadavek nemáme, tak můžeme vystačit s jednou sítí. V praxi se také používá pouze jedna logická síť, do které je více redundantních připojení. Hlavně u Fibre Channel sítí se používá termín Fabric pro oddělenou síť, můžeme využít VLAN nebo VSAN.

Topologie SAN sítě s oddělenými Fabric
  • Fabric - Fibre Channel Fabric nebo Switched Fabric, jde o síťovou topologii používanou v FC sítích (nejpoužívanější z možných variant zapojení/topologie). Fabric je jedna uzavřená síť (SAN). Skládá se z jednoho nebo více přepínačů (Switch), do kterých jsou připojena koncová zařízení (servery a úložiště). Je to velice podobné klasické LAN síti, více zařízení může být aktivních najednou, médium není sdílené. Kvůli vysoké dostupnosti se SAN síť standardně buduje tak, že máme dvě samostatné fabricy (dvě navzájem nepropojené skupiny přepínačů, koncová zařízení jsou připojena do obou), tedy dvě nezávislé cesty.
  • VLAN - Virtual Local Area Network - (zjednodušeně) v základním konceptu se LAN síť skládá z jednoho nebo více fyzických přepínačů, pokud chceme vytvořit další LAN, tak musíme použít jiné přepínače. VLAN nám dovolí rozdělit fyzický přepínač na více virtuálních přepínačů. Jednotlivé VLAN jsou komunikačně izolované, i když se nachází na stejném přepínači, a pouze porty zařazené do stejné VLAN spolu komunikují.
  • VSAN - Virtual Storage Area Network je obdoba VLAN z Ethernetu. Pomocí VSAN spojíme porty a vytvoříme virtuální fabric. Jeden port může patřit do více VSAN a porty z různých switchů mohou být zařazeny do stejné VSAN. V rámci VSAN máme oddělený provoz, stejně jako security policy, zóny, členství, apod.

Komunikační cesty a Multipath

Docela běžné je zapojení, které znázorňuje obrázek výše. Máme dvě SAN fabricy (samostatné sítě). Diskové poledva kontroléry a na každém se využívají dva síťové porty, kdy je jeden připojen do jedné fabricy a druhý do druhé. Každý port využívá pro komunikaci svoji adresu, takže máme 4 adresy pole. Server má síťovou kartu (HBA) se dvěma porty (nebo dvě karty) a je připojen do obou fabric, má dvě adresy. Tím je zajištěna vysoká redundance/dostupnost (High Availability), může vypadnout řadič pole, přepínač, libovolný kabel či port. A také se zvyšuje výkon (Load Balancing).

Pozn.: V praxi můžeme použít ještě více cest, ať z důvodu vyšší dostupnosti nebo výkonu, ale když spojujeme dvě zařízení ve stejné fabrice více cestami (kabely), tak se často použije Link Agregation (vznikne virtuálně jeden spoj) a ten má jednu adresu (používá se u Ethernetu i FC).

Toto zapojení způsobí, že existují čtyři cesty mezi serverem (Initiator) a diskovým polem (Target). Server vidí v každé fabrice oba kontroléry pole (dvě adresy), tedy celkem 4 adresy pole. To způsobí, že když prezentujeme LUN na server, tak jej vidí přes všechny cesty, tedy se na serveru zobrazí čtyři stejné disky. Aby vše fungovalo správně a server viděl pouze jeden disk, rozvažoval komunikaci přes všechny cesty a při výpadku používal pouze ty dostupné, tak se využívá techniky Multipath I/O.

SAN síť se 4 cestami - Multipath
  • Multipath I/O - technika pro zajištění vysoké dostupnosti (High Availability či Fault Tolerance) a zvýšení výkonu pomocí rozvažování zátěže (Load Balancing), pokud existuje více cest mezi Hostem a Storage.
  • MPIO - Microsoft Multipath I/O - součástí Windows Server je Microsoft implementace Multipath I/O, která využívá DSM (Device Specific Module). Výrobci mohou vytvořit optimalizovaný modul pro své pole. Součástí Windows je obecný Microsoft DSM pro Fibre Channel, iSCSI nebo SAS.
  • ALUA - Asymmetric Logical Unit Access - vlastnost SCSI, označuje se také jako Target Port Groups Support (TPGS). Standardizovaný protokol pro identifikaci optimálních cest mezi Host a Storage (prioritizace cest, popisuje port status a přístupové charakteristiky). Využívá jej Multipath, je třeba, aby mohlo být více cest najednou aktivních (Active/Active).

SAN technologie a protokoly

V praxi používáme buď Ethernet SAN nebo Fibre Channel SAN, což nám určuje, jaká hlavní síťová technologie je použita. Dále potřebujeme protokol, který zajistí datový přenos po této síťové technologii. Nejpoužívanější je iSCSI pro Ethernet SAN a Fibre Channel Protocol (FCP) pro FC SAN. iSCSI a FCP zajišťují pouze komunikaci po síti, vlastní práci s daty (vstupně/výstupní operace s diskem) provádí standardní SCSI protokol (ten každý OS zná), který je zapouzdřen do iSCSI či FCP. Protokoly iSCSI a FCP zajistí rozhraní pro SCSI protokol (stejně jako rozhraní Parallel SCSI nebo SAS). Operační systém používá standardní SCSI příkazy a úložiště vidí jako lokální zařízení a pracuje s ním standardně jako s lokálním diskem. Transportní vrstva zajistí zabalení a rozbalení příkazů, aby mohly putovat po síti.

Srovnání protokolů iSCSI a FCP (vrstvy a zapouzdření)
  • SCSI - Small Computer System Interface - standard, který definuje příkazy, protokoly a elektrické a optické rozhraní pro výměnu dat. Paralelní SCSI rozhraní se dříve hojně využívalo (hlavně u serverů) pro připojení disků a dalších interních nebo externích zařízení. V dnešní době je nahrazeno pomocí SAS (Serial Attached SCSI) a SATA. SCSI příkazy zajišťují práci s datovými bloky, to se využívá v rámci SAN.
  • Ethernet - rodina síťových technologií, standard pro telekomunikační sítě IEEE 802.3. Definuje používanou kabeláž, přenosové rychlosti, přístup k síti, signály, L2 komunikaci, formát fyzických adres (MAC) - obecně vlastnosti na 1. a 2. vrstvě dle OSI modelu.
  • TCP/IP - Transmission Control Protocol / Internet Protocol - sada komunikačních protokolů Internet Protocol suite pro komunikaci mezi koncovými body, definuje, jak jsou data zabalena (packet), adresována, vysílána, směrována (routing) a přijímána. IP protokol je 3. vrstva OSI modelu, pro adresování používá logické IP adresy, popisuje určení cesty paketu (routing). TCP protokol je 4. vrstva OSI modelu, zajišťuje spolehlivé doručení dat bez chyb a v daném pořadí (používá potvrzování, segmentaci), využívá čísla portů pro určení aplikace (na jednom serveru, IP adrese, může běžet více služeb s různým číslem portu, kombinace zdrojová IP a port a cílová IP a port tvoří TCP Session). Pokud nepotřebujeme spolehlivost, tak můžeme použít nespojový UDP protokol.
  • iSCSI - Internet Small Computer System Interface - síťový transportní protokol, který běží nad TCP/IP a tedy využívá technologii Ethernet. Umožňuje blokový přístup k úložným zařízením díky přenosu SCSI příkazů přes síť (LAN, WAN). TCP sice není tak efektivní jako FCP, ale při dnešních rychlostech Ethernet sítí to již není problém. iSCSI vyžaduje minimálně rychlost 1 Gbps, dnes se standardně nasazuje na metalické sítě s rychlostí 10 Gbps.
  • FC - Fibre Channel - síťová technologie, která vznikla jako standard pro SAN sítě. Jde o fullduplexní, sériové, blokově orientované, bod-bod komunikační rozhraní, navržené pro vysokorychlostní přenos dat (pracuje v gigabitových rychlostech). FC přenos je bezeztrátový. Běžně se využívá pro připojení diskových polí k serverům v SAN sítích. Mohou se využít různá fyzická média pro přenos, standardně jde o optická vlákna (optical fibre) nebo metalické kabely (TP). Využívá se přenosový protokol Fibre Channel Protocol (FCP) nebo  Fibre Channel over Ethernet (FCoE), což je zapouzdření FC rámců do Ethernetových sítí.
  • FCP - Fibre Channel Protocol - přenosový protokol, který přenáší SCSI příkazy přes FC síť. FCP pracuje nad FC, jako TCP/IP nad Ethernetem. Jde o obdobu iSCSI, je speciálně navržen pro jeden účel, takže je optimálnější a hubenější (menší režie) a nepotřebuje vrstvy TCP/IP.

Používané adresy

SCSI adresování

Pro adresování SCSI zařízení se používá adresa (ID) několika zařízení Adapter ID, Target ID a LUN, případně rozšířené o Channel (když jeden adapter má více sběrnic - Bus) Adapter ID, Channel ID, Target ID a LUN, příklad 1-0-1-0. Když zapouzdříme SCSI do nějakého SAN protokolu, tak ten řeší komunikaci Initiator - Target, navíc při použití Multipath dostáváme přes různé adaptéry stejný disk, takže zůstává jako důležitý údaj pouze LUN. Přesněji potřebujeme unikátní identifikátor LUNu (LUN Network Address Authority (NAA) number), označuje se různě jako Serial Number, GUID, LUN/Volume WWN.

iSCSI protokol

Protokol iSCSI využívá TCP/IP, takže pro síťovou komunikaci slouží MAC adresy a IP adresy. iSCSI Target poslouchá na určitém TCP portu, což je běžně port 3260. Vlastní iSCSI protokol využívá IQN jména pro identifikaci a připojování mezi Initiator a Target.

  • MAC adresa (Media Access Control address) - fyzická adresa síťového rozhraní, unikátní identifikátor, který slouží pro komunikaci v rámci síťového segmentu (neříká nic o jeho umístění v síti). Standardně je přiřazena výrobcem zařízení (v praxi ji lze často měnit). Příklad 01:23:45:67:89:ab
  • IP adresa (Internet Protocol address) - logická adresa pro identifikaci uzlu v rámci počítačové sítě. IP adresy umožňují dělení sítí na podsítě (subnetting) a směrování (routing) mezi sítěmi. Příklad 193.100.10.1
  • IQN - iSCSI Qualified Name - unikátní iSCSI identifikátor Initiatoru nebo Targetu, příklad iqn.1991-05.com.microsoft:server.firma.local
iSCSI protokol (zapouzdření SCSI)

Fibre Channel Protocol

Protokol FCP využívá Fibre Channel, zde se pro komunikaci používají WWPN adresy (obecně WWN adresy), což je obdoba MAC adresy v Ethernetu, tedy unikátní identifikátor přiřazený síťovému interface. Dvouportová Ethernet NIC (síťová karta) má dvě MAC adresy (pro každý port jednu). Dvouportové FC HBAtři WWN adresy (jednu Node WWN a dvě Port WWN). Neexistuje nic jako alternativa k IP adresám, takže komunikace je více plochá.

Pro Fibre Channel existuje několik topologií, ale dnes se asi výhradně používá Switched Fabric, kdy se všechna zařízení připojují do přepínače (stejný princip jako u dnešního Ethernetu) a komunikují napřímo mezi sebou. V tom případě se také využívá Fibre Channel ID (či Port ID), které se přiděluje každému FC interface ve stavu up a používá se pro komunikaci v FC rámcích.

  • WWN - World Wide Name - obecný termín pro globálně unikátní identifikátor používaný ve světě Fibre Channel, obdoba MAC adresy v Ethernetu, délka 8 byte (64 bitů), tedy delší než MAC, příklad 01:23:45:67:89:ab:cd:ef
  • WWPN - World Wide Port Name - WWN přiřazené portu ve Fibre Channel Fabric, Cisco někde používá označení Port WWN
  • WWNN - World Wide Node Name - WWN přiřazené nodu (koncové zařízení, diskové pole, switch) ve Fibre Channel Fabric, na všech portech zařízení může být vidět stejné WWNN, ale pokaždé jiné WWPN
  • FCID - Fibre Channel ID - přesněji Fibre Channel Node Port Identifier, také se používá zkratka N Port ID, 24-bitové číslo, které se přiděluje koncovému zařízení (N Port) při FLOGI procesu. Switch používá FCID pro směrování (route) rámců z daného zdroje (initiator) na určitý cíl (target) v rámci SAN fabricy. Jde o unikátní identifikátor v rámci fabricy. Skládá se z Domain_ID, Area_ID a Port_ID. Příklad 0x5e0000
  • Name Server - služba, která běží na switchi a sbírá seznam WWN v celé Fabric (atributy všech zařízení ve VSAN). Vytváří databázi zvanou FCNS, kterou sdílí všechny přepínače v síti.

Pozn.: Stejně, jako v Ethernetové síti, se v FC síti používají rámce (frame). Pro adresování se v FC rámcích nepoužívá WWN adres, ale kratších FCID. Přiřazení FCID a WWN se dozvíme na Name Serveru.

Fibre Channel frame (rámec)

Host adresa

Na diskovém poli vždy definujeme objekt Host, což je klient, který se k němu připojuje a jemu pak přiřazujeme diskový prostor (Volume potažmo LUN). Host je definován buď pomocí Fibre Channel WWN (World Wide Name) nebo iSCSI IQN (iSCSI Qualified Name). Tento údaj tedy potřebujeme zjistit na klientovi, abychom mohli provést konfiguraci na diskovém poli. Pokud je správně povolena síťová komunikace, tak pole standardně detekuje dostupné adresy v síti a nabízí je při konfiguraci. Publikace virtuálního disku pro klienta je zároveň bezpečnostní opatření a označuje se také jako LUN Masking.

  • LUN Masking - LUN je poskytován (provisioned) určitému Host podle jeho (Initiator) adresy skrze určité (Target) porty pole. Řadič povolí příkazy na daný LUN pouze přicházející z daného Initiator. Samozřejmě adresu Initiatoru lze podvrhnout (jednodušeji u iSCSI, celkově záleží na zabezpečení sítě).

Řízení komunikace (bezpečnost), aneb kdo s kým může komunikovat

iSCSI protokol

Ethernet SAN využívá běžné síťové technologie jako v LAN sítích, takže všechna zařízení ve stejném subnetu spolu mohou komunikovat, při použití směrování (routing) můžeme komunikovat i mezi sítěmi. Pro omezování komunikace můžeme použít třeba ACL (Access Control List).

Bezpečnost v iSCSI síti se řeší pomocí autentizace (využívá se ne zrovna bezpečný protokol CHAP). Obecná bezpečnost se řeší tím, že používáme oddělenou SAN síť, kam jsou připojeny pouze servery, které mohou komunikovat s diskovým polem, a nikdo z běžné LAN sítě by neměl mít přístup.

Další zabezpečení je na straně pole, kde využíváme LUN Masking, mapujeme svazky (Volume - Target LUN) a servery (Initiator), takže nikdo jiný ke svazku nemá přístup (bez použití autentizace to nelze považovat za extra bezpečnost).

Fibre Channel Protocol

Ve Fibre Channel SAN síti mohou standardně napřímo komunikovat všechna zařízení ve stejné Fabric (VSAN). V praxi se tato komunikace omezuje na úrovní sítě (FC přepínačů), aby se zajistila větší bezpečnost. Metoda, která se používá, se označuje jako zónování (Zoning). Vytváříme zóny (Zones) v rámci určité VSAN a pouze zařízení v dané zóně spolu mohou komunikovat (standardně vytváříme zónu pro každý server a k němu vždy přidáme pole). Zařízení, které není zařazené do žádné zóny, používá politiku defaultní zóny. Zařízení do zóny můžeme zařazovat pomocí WWPN, FC ID, interface kam je připojeno, apod.

  • Zoning (masking) - zónování VSAN/SAN, vytváříme zóny a pouze zařízení v dané zóně spolu mohou komunikovat. Nastavuje se na switchi. Není povinné použít, ale kvůli bezpečnosti se v praxi vždy používá.

Vytvořené zóny seskupujeme do zón setů (Zone Set), které jsou sdílené všemi přepínači v dané fabric. I další informace si mezi sebou vyměňují a sdílí všechny FC switch, například seznam všech zařízení přihlášených do Fabric topologie. Na každém přepínači tak můžeme získat informace o celé síti (fabric).

Ukázka konfigurace zónování (pomocí aliasů) na Cisco MDS:

SWITCH(config)#zone name Server1 vsan 10
SWITCH(config-zone)#member fcalias Server1-port-A
SWITCH(config-zone)#member fcalias Pole-port-1
SWITCH(config)#zoneset name SAN-VSAN10 vsan 10
SWITCH(config-zoneset)#member Server1

Jelikož je FC méně běžná technologie, než Ethernet, tak to také přispívá k bezpečnosti. Vždy se používá oddělená SAN síť. Na straně pole se také využívá LUN Masking.

Připojení serveru k poli

iSCSI protokol

Protokol iSCSI využívá TCP/IP, takže potřebujeme znát IP adresu (nebo všechny) a TCP port diskového pole. Server musí být připojen do SAN sítě a mít správně nastaveny IP adresy, aby mohl komunikovat s polem. Na serveru pak konfigurujeme iSCSI Initiator, kde zadáváme adresu a port pole, většinou v sekci Discovery, kdy se ostatní adresy automaticky detekují. Pokud proběhne iSCSI komunikace v pořádku, tak se nám zobrazí detekované pole (Target), jeho IQN jméno a detekované cesty. Jako další potřebujeme povolit/nastavit Multipath a jeho politiku pro výběr cest (nejčastěji Round Robin). Volitelně můžeme nastavovat zabezpečení pomocí autentizace.

Konfigurace iSCSI Initiator - Discover Portal

iSCSI SAN síti se doporučuje používat Jumbo Frames, pokud se k tomu rozhodneme, tak musíme provést shodné nastavení v celé síti na všech přepínačích, serverech (Initiator) a diskovém poli (Target).

  • Jumbo Frames - Ethernetové rámce, které mají větší velikost (MTU) než 1500B, často 9000B

Fibre Channel Protocol

Fibre Channel Protocol používá pro komunikaci World Wide Name (WWN), ale nepotřebujeme znát WWN diskového pole. Pokud je server správně připojen do SAN sítě a může komunikovat s polem (zónování), tak se s ním automaticky spojí. Pak již potřebujeme pouze povolit/nastavit Multipath, kde by se mělo nalézt naše diskové pole.

Rozdíl mezi iSCSI a FC

Určitý rozdíl mezi komunikací v iSCSI a FC je, že v rámci iSCSI musíme provést síťové propojení a pak ještě nakonfigurovat iSCSI Initiator, kde zadáme adresy diskového pole. Pak se teprve disk (Volume) přiřazený serveru na něm (automaticky) objeví. U FCP stačí, aby bylo nastaveno síťové propojení, pak již dojde k automatickému nalezení diskové pole a připojení přiřazených disků (musíme mít samozřejmě instalovaný ovladač pro FC HBA).

zobrazeno: 29095krát | Komentáře [9]

Autor:

Související články:

Computer Storage

Ukládání dat je v počítačovém světě rozsáhlá a komplexní problematika. Zde se nachází články, které se věnují sítím Storage Area Network (SAN), technologiím iSCSI, Fibre Channel, diskovým polím (Storage System, Disk Srray) i obecně ukládání dat a úložištím.

Pokud se chcete vyjádřit k tomuto článku, využijte komentáře níže.

Komentáře

  1. [1] Pavel

    Zdravim, vrta mi hlavou otazka: Mam cluster a vypadek uzlu A prevezme uzel B. Uzel A i B ma logicky data na nejakem takovem diskovem poli jako zde v clanku. Ale jak se resi ochrana ze selze toto pole kde jsou ma data? (napr. ho nekdo ukradne :))

    Pondělí, 11.09.2017 12:59 | odpovědět
  2. [2] Zagro

    Musím pochválit za pěkný článek. V tomto odvětví jsem se pohyboval 6 let a takto pěkně sepsané/popsané jsem to snad nikde nenašel. Pro začátečníka naprosto super, ikdyž samozřejmě četba několikasetstránkového redbooku, nebo jeho obdoby, ho nemine. Až se mi skoro zastesklo, ikdyž dávám přednost "NASu od NetAppu" :)

    Středa, 25.10.2017 15:09 | odpovědět
  3. [3] Václav

    odpověď na [1]Pavel: Napadají mne 3 řešení. Buď máš druhý pole v clusteru nebo častěji, máš druhý pole v nějaký geograficky oddělený lokalitě a máš mezi nimi nastavený replikace. Drahý řešení. Nebo prostě často zálohuješ na zálohovací server, který máš pro jistotu taky v clusteru, případně v geograficky oddělený lokalitě. A pro sichr to ještě hrneš na pásku. Levnější řešení s menší dostupností - samozřejmě zálohuješ data i v prvním případě s dvěma datovými úložišti. Nebo máš vše v cloudu a máš dobře nastavenou smlouvu. Nejlevnější řešení, ale prakticky nevíš, kde všude tvá data jsou :-)

    Pondělí, 19.03.2018 11:51 | odpovědět
  4. [4] Honza

    Skvěle napsáno, jako vždy. :-) Jen se chci zeptat, SW např. od NetAPP se tedy instaluje někam na server a přes něj se spravuje SAN uložiště, vytváři virtuální Volume atd. ?

    Nebo to chápu špatně a je to právě ten zmiňovaný kontroler?

    Předem díky a omlouvám se za hloupý dotaz. :-)

    Pátek, 23.03.2018 16:36 | odpovědět
  5. [5] Samuraj

    odpověď na [4]Honza: To záleží na poli :-).

    Například NetApp AFF8040 (všechny All Flash FAS) má instalovanou, jako součást systému, OnCommand System Manager. To je webové rozhraní pro správu. Takže se prohlížečem připojím přímo na pole (nebo napřímo pomocí SSH).

    Na druhou stranu NetApp E2760 (všechny E-Series Storage System) nabízí (asi) nějaké API pro konfiguraci a aby to bylo uživatelsky příjemné, tak je potřeba na server nebo stanici nainstalovat aplikaci SANtricity Storage Manager Client, pomocí které provádíme správu.

    Je to podobné jako jinde, některé systémy spravujeme pomocí webového rozhraní (třeba Exchange 2016) a někde potřebujeme aplikaci - bohatého klienta (třeba Exchange 2010).

    Pátek, 23.03.2018 18:24 | odpovědět
  6. [6] Honza

    odpověď na [5]Samuraj: Paráda, děkuju za vysvětlení. ;-)

    Pátek, 23.03.2018 20:14 | odpovědět
  7. [7] Honza

    Naprosto dokonale napsano. Muselo to dat spoustu prace. Obcas se pohybuji v okoli SANek a jako novacek jsem uplne marnej, kdyz se kolegove bavi o zminovane technologii. Zde cerpam rozumy :-)

    Ad terminologie: taky me neskutecne stve, obzvlast neustala zamena vyrazu pro stejnou vec a naopak, A zvlast pouzivani vyrazu "host" ve vyznamu zarizeni, pripojujici se k poli. Z toho jsem na prasky...

    Pátek, 03.08.2018 17:08 | odpovědět
  8. [8] Karel

    Díky za super článek. Zrovna se rozhoduji zda jít do FC nebo iSCSI. Co má budoucnost?

    Pátek, 28.09.2018 15:16 | odpovědět
  9. [9] Druid

    Teoretická otázka lze propojit mezi sebou dva servery pomocí SAN. Stím že by jeden poskytoval uložný prostor druhému - prostě by se ze serveru udělo uložiště. Něco jako pomocí LAN přímé propojení kabelem, jen taby to bylo optikou jak by to bylo z nastavením WWN?

    Pátek, 03.06.2022 22:59 | odpovědět
Přidat komentář

Vložit tag: strong em link

Vložit smajlík: :-) ;-) :-( :-O

Nápověda:
  • maximální délka komentáře je 2000 znaků
  • HTML tagy nejsou povoleny (budou odstraněny), použít se mohou pouze speciální tagy (jsou uvedeny nad vstupním polem)
  • nový řádek (ENTER) ukončí odstavec a začne nový
  • pokud odpovídáte na jiný komentář, vložte na začátek odstavce (řádku) číslo komentáře v hranatých závorkách