Pozn.: Popis v článku vychází z Veeam Backup & Replication 11a, licencováno pomocí Veeam Universal License (VUL), tedy obdoba Enterprise Plus.
Pozn.: Verze 12 částečně mění fungování Backup Copy Job, určité informace jsou v článku Veeam Backup & Replication 12 - upgrade formátu Backup Chain a Backup Copy.
Backup Copy
Zálohy a pravidlo 3-2-1
Hlavním účelem zálohování je ochrana dat před katastrofami a selháním virtuálních nebo fyzických strojů. Zálohování musí také nabídnout funkční, kvalitní a dostatečně rychlou obnovu dat.
Obecně se doporučuje využívat pravidlo 3-2-1. Produkční data zálohujeme ve stejné lokalitě (on-site), na jiné úložiště, aby byla možná rychlá obnova. Tuto zálohuje kopírujeme do jiné lokality (off-site), abychom měli data dostupná při závažné katastrofě, která by postihla celé datové centrum. Jako úložiště můžeme využít také cloud.
Stručně o Backup Copy
Pro vytvoření kopií záloh nabízí Veeam Backup & Replication úlohu Backup Copy. Ta umožňuje vytvořit několik instancí stejných zálohovaných dat na různých místech, buď ve stejné lokalitě nebo v jiné. Kopie záloh mají stejný formát jako zálohy vytvořené pomocí Backup Job. Zjednodušeně řečeno, data se z jednoho úložiště kopírují (synchronizují) do jiného podle nastavených pravidel.
Pro kopii záloh definujeme vlastní retenci (zásady uchování), abychom zachovali požadovaný počet bodu obnovení. A případně GFS retenci (zásady dlouhodobého uchovávání) uložení plných záloh pro účely archivace.
Princip fungování
- úlohy jsou děleny podle typu zdroje zálohování (platformy) a může obsahovat pouze objekty stejného typu (VM VMware, VM Hyper-V, Windows computer, Application apod.)
- pro přenos se využívá zdrojový a cílový Veeam Data Mover (buď na Repository nebo Gateway serveru), případně ještě WAN accelerator
- pro VM Backup Copy Job se připojuje k virtualizačním serverům a shromažďuje informace o VM, jejichž body obnovení chceme kopírovat
První Backup Copy běh
- vytvoří Full Backup, další jsou přírůstkové, využívá se Forever Forward Incremental
- poprvé se kopírují datové bloky, které jsou potřeba k vytvoření plné zálohy nejnovějšího stavu (mohou se tedy číst data z více souborů zálohovacího řetězce)
- data se přenáší do cílového úložiště (využívá se komprese, deduplikace, případně WAN akcelerace), kde se zapisují do záložního souboru (Backup File)
Každý další Backup Copy běh
- když se ve zdrojovém úložišti objeví nový Restore Point, tak se kopírují pouze přírůstkové změny (mezi předchozím a aktuálním během úlohy) z nejnovějšího Restore Point (může být Full nebo Incremental)
- pokud je poslední soubor přírůstkový, tedy využívá se metoda Forward Incremental nebo Forever Forward Incremental, tak Backup Copy Job pracuje výrazně rychleji
Režimy kopírování - Copy Mode
- Immediate copy (okamžitá kopie, zrcadlení) - pro zvolený zdrojový Backup Job kopíruje každý Restore Point hned, jak se objeví v úložišti, kopíruje všechny zálohy, včetně záloh transakčních logů
- Periodic copy (periodická kopie) - běžnější, kopíruje poslední dostupný Restore Point jednou v zadaném intervalu (Backup Copy Interval - na začátku intervalu se podívá, zda je k dispozici nový Restore Point, pokud ne, tak čeká až vznikne), můžeme zvolit pouze určité stroje (VM), které se kopírují
Počáteční synchronizace (úvodní přenos dat)
Pro vytvoření počáteční kopie dat (Full Backup) v cílovém úložišti můžeme využít offline přenos (Seeding). Pokud jsou data příliš velká, linka pomalá a nestihla by se přenést po síti. Data přeneseme na cílové úložiště a následně využijeme mapování (Backup Copy Job Mapping).
Pozn.: Oficiální návod uvádí níže popsaný postup, kdy pomocí Backup Copy Job vytvoříme kopii záloh, kterou následně přesuneme do cílového úložiště. Jiná část dokumentace uvádí, že úlohu můžeme mapovat na zálohu vzniklou pomocí Backup Job nebo Backup Copy Job. Mělo by tedy jít tuto část přeskočit a rovnou zkopírovat určitou zálohu (pokud má stejný obsah, který chceme mít kopírovaný).
- vytvoříme Backup Copy Job (musíme použít režim kopírování, který chceme cílově využívat)
- přidáme zdroje, které chceme kopírovat
- jako cílové úložiště zvolíme nějaké místní Backup Repository, kde se připraví soubory pro přenos (nemůže jít o stejné úložiště, kde jsou zdrojové zálohy)
- spustíme Backup Copy Job, aby se vytvořil soubor s Full Backup (mohou se vytvořit, a zkopírovat, i přírůstkové zálohy)
- přesuneme složku se zálohou (soubory VBK, VBM, případně VIB) do cílového úložiště záloh
- znovu naskenujeme cílové úložiště
- Backup Infrastructure - Backup Repositories - na úložišti volba Rescan
- namapujeme zálohu na Backup Copy Job
- Home - Jobs, na úloze vytvořené na začátku zvolíme Edit
- na záložce Target zvolíme Map backup
- vybereme zálohu, dokončíme průvodce (Next) a potvrdíme Apply
- nastartujeme kopírovací úlohu
- klikneme pravým tlačítkem na úlohu a zvolíme Sync Now
Pozn.: Na konec článku jsem doplnil svoji praktickou zkušenost.
Propojení Backup Job na Backup Copy Job
V nastavení Backup Job můžeme na záložce Storage využít volbu Configure secondary destination for this job. V kroku Secondary Target pak můžeme přidat určitý existující Backup Copy Job. Tím se automaticky upraví Backup Copy Job a jako zdroj dat se nastaví Backup Job. Zajistíme ukládání záloh v sekundárním úložišti.
Backup Copy Job - úloha kopie zálohy
Úlohu můžeme vytvořit z menu záložky Home volba Backup Copy Job. Volíme typ úlohy podle platformy. Jedna úloha může zpracovávat jeden nebo více strojů stejné platformy. Stroje se zpracovávají paralelně.
Při vytváření nebo editaci úlohy procházíme průvodce a na několika záložkách nastavujeme různé parametry. Stručný popis položek:
- Job
- Name - každá úloha musí mít unikátní název
- Copy Mode - volíme Immediate nebo Periodic
- Objects - vybíráme úlohy (workloads), jejichž body obnovení chceme kopírovat do cílového úložiště, možnosti se liší podle režimu kopírování, vybíráme zdrojový kontejner objektů (Source Object Container) z
- Infrastructure (Periodic) - (pouze pro VM Backup Copy Job) vybíráme VM nebo VM kontejner z celé virtuální infrastruktury, Restore Point se hledá mezi všemi zálohami (pokud VM zálohujeme více úlohami), použije se nejnovější, můžeme omezit na určitá úložiště záloh (Source)
- Backups (Periodic) - obdoba Infrastructure, ale vybíráme VM nebo stroj uvnitř určité existující zálohy
- Jobs (Periodic, Immediate) - vybíráme určitou úlohu, kopíruje se celý její Restore Point
- Repositories (Immediate) - vybíráme určité úložiště záloh, kopíruje všechny Restore Point stejné platformy jako je Backup Copy Job
- Target
- Backup repository - určujeme cílové úložiště záloh, (pomocí Map backup můžeme úlohu namapovat na existující zálohy)
- Retention Policy - nastavujeme politiky uchovávání (kolik bodů obnovy nebo dní chceme uchovat)
- GFS - můžeme nastavit zásady dlouhodobého uchovávání pro archivaci
- Advanced - Maintenance - můžeme naplánovat pravidelné provádění údržby, kontrolu posledního Restore Point - Perform backup files health check a údržbu Full Backup, pokud neprovádíme pravidelně aktivní plnou zálohu, jde o smazání odstraněného VM ze záloh (když bylo VM smazáno nebo vyjmuto ze zálohování) - Remove deleted items data after a defragmentaci a zhutnění (vytvoří novou plnou zálohu, do které kopíruje data, můžeme použít pouze, když nepoužíváme GFS) - Defragment and compact full backup file
- Advanced - Storage - nastavení redukce dat - deduplikace, komprese a šifrování záloh
- Advanced - Notifications - nastavení upozornění při dokončení úlohy (můžeme nastavit globálně nebo zde pro úlohu) - SNMP, email
- Advanced - Scripts - můžeme spouštět vlastní skripty před a/nebo po úloze
- Data Transfer - volíme, jak se přenáší zálohovaná data
- Direct - přímo ze zdrojového na cílové úložiště, vhodné pro kopie ve stejné lokalitě
- Through built-in WAN accelerators - musíme nejprve nasadit WAN akcelerátor do zdrojové i cílové lokality, ten se využije pro ušetření pásma při přenosu
- Schedule - definujeme časové okno pro kopírování (Backup Copy Window), můžeme určit zakázané hodiny, kdy se nesmí přenášet data mezi úložišti (transformace dat na úložišti probíhat může)
WAN Acceleration
- podrobná dokumentace WAN Accelerators
- Veeam technologie zaměřená na Veeam úlohy (zálohy), která optimalizuje přenos dat do vzdálených lokalit
- pro použití potřebujeme dva Windows servery (zdrojový a cílový), kde nasadíme WAN Accelerator
- provádí deduplikaci (Global data deduplication, Variable block size deduplication), kompresi, přenos ve více streamech, kešování
- optimalizuje využití sítě, ale využívá (zatěžuje) ostatní komponenty (CPU, RAM, disk)
High bandwidth mode
- pro linky o rychlosti 100 Mbps až 1 Gbps se doporučuje použít High bandwidth mode
- nepoužívá Global cache, využívá rychlejší kompresní metody, stále ušetří pásmo oproti přímému režimu (nad 1 Gbps již nemá význam)
- musí se zapnout na obou stranách
WAN Accelerator
- zdrojový Data Mover komunikuje se zdrojovým WAN Accelerator, který posílá data na cílový WAN Accelerator, ten je předává na cílový Data Mover
- více je zatěžován zdrojový akcelerátor, je podporováno připojení více zdrojových akcelerátorů (i z jedné lokality) k jednomu cílovému
- zdrojový akcelerátor zpracovává úlohy (VM disky) postupně po jednom
- na serveru se vytvoří složka
VeeamWAN
s podsložkamiDigests
aGlobalCache
- zdrojový akcelerátor vytváří a ukládá digest soubory (výběr) pro každý zpracovaný VM disk, uchovává 2 kopie těchto souborů, velikost souboru je cca 2 % velikosti disku pro Low bandwidth mode (5 TB = 100 GB) a 1 % High bandwidth mode (5 TB = 50 GB)
- pro Low bandwidth mode se vytváří Global Cache, na cílovém akcelerátoru bychom měli nastavit 10 GB pro každý typ operačního systému, na zdrojovém zabírá zhruba 2 % nastavené hodnoty pro cíl, detailní informace WAN Accelerator Sizing
Nasazení a konfigurace WAN Accelerator
Roli WAN Accelerator můžeme nasadit na fyzický nebo virtuální 64bitový Microsoft Windows server, který je přidaný mezi spravované servery (Managed Servers). Server již může mít jinou komponentu (roli), jako Backup Proxy či Backup Repository. WAN Accelerator přidáme z pohledu Backup Infrastructure, položka WAN Accelerators a volba Add WAN Accelerator.
- Server - jako hlavní volíme server, který se použije pro WAN Accelerator
- Traffic port - můžeme změnit defaultní TCP port 6165
- Streams - počet spojení pro přenos dat mezi akcelerátory, default je 5 TCP vláken, pro linky s vysokou latencí je výhodné zvýšit počet, aby se dosáhlo vyšší přenosové rychlosti (plného využití pásma)
- High bandwidth mode
- Cache - určujeme cestu ke složce, kde se ukládají soubory služby a Global Cache data, když jsou oba akcelerátory v High bandwidth mode, tak se Global Cache nepoužívá, přesto musíme zadat velikost a musíme počítat, aby byl na disku dostatek volného místa, zadaná velikost Cache size je pro každý zdrojový akcelerátor
- Review - pro WAN Accelerator jsou potřeba dvě komponenty (Veeam Data Mover - Transport a Veeam WAN Accelerator Service), vidíme, zda jsou již na serveru instalovány nebo se provede instalace v kroku Apply
Po nasazení cílového akcelerátoru, a přiřazení k Backup Copy Job, se doporučuje využít funkci Populate cache (klikneme na něj pravým tlačítkem). Následně zvolíme úložiště (Source Backup Repositories), doporučuje se volit úložiště ve stejné lokalitě jako je cílový akcelerátor. V něm se vyhledají různé typy OS a přenesou datové bloky do keše.
Praktická zkušenost vytvoření Backup Copy Job s offline přenosem úvodní plné zálohy (Seeding)
Potřeboval jsem do vzdálené lokality přenášet kopii zálohy souborového serveru, která má velikost 5TB. I po 200 Mbps lince by úvodní kopírování plné zálohy trvalo řadu dní. Rozhodl jsem se tedy využít Seeding a přenést úvodní data na externím disku.
Rozdělení souboru na externí disky
Pro přenos jsem měl k dispozici 2 externí SSD disky o velikosti 4 TB. První problém tedy je rozdělení souboru se zálohou na dva disky. Vyzkoušel jsem různé nástroje, ale všechny měli problém s velikostí v řádu TB, buď vůbec nefungovali nebo kopírování běželo velmi pomalu. Takže jsem nakonec použil Total Commander, s kterým jsem i začínal, ale také má jeden problém. Před spoustou let jsem jej používal pro rozdělování souborů na diskety, ale rozdělit TB soubor na externí disky se úplně nedařilo. Při rozdělování souboru vytvářel další díl, i když již na disku nebyl dostatek místa a pak skončil na chybu (místo, aby si řekl o další médium nebo cestu).
Musel jsem tedy nejprve rozdělit soubor přímo na serveru a uložit úložiště, kde byl dostatek místa. Nakonec jsem zvolil více dílů o velikosti 900 GB. Rozdělení běželo rychlostí asi 180 MB/s a trvalo více než 9 hodin. Pak jsem kopíroval na externí disky, kopírování probíhalo rychlostí asi 295 MB/s a trvalo málo přes 5 hodin.
Co je velmi důležité, na první i druhý disk musíme nahrát soubor s příponou CRC (který vytvoří Total Commander při rozdělování). Pokud to neuděláme, tak se při spojování použijí pouze soubory z prvního disku. Total Commander neví, že má chtít další soubory a skončí. Když má CRC soubor k dispozici, tak vidí, že má být výsledný soubor větší a řekne si o určení cesty k dalšímu souboru. Takže vyměníme externí disk a pokračujeme.
Celý proces vytvoření Backup Copy Job s mapováním
- provedeme Export Backup - abychom získali Full Backup, který obsahuje i poslední přírůstkové zálohy, díky Fast Clone to trvalo 7 minut
- soubor VBK rozdělíme a nahrajeme na externí disky, na oba disky nahrajeme soubor CRC, zkopírujeme také soubor VBM
- převezeme do vzdálené lokality
- na úložišti vytvoříme složku s názvem budoucí úlohy (Backup Copy Job) a nahrajeme (spojíme) soubory VBK a VBM (protože úložiště bylo připojeno pouze 1 Gbps linkou, tak se kopírovalo rychlostí 115 MB/s)
- VBM soubor můžeme přejmenovat podle názvu úlohy (Backup Copy Job)
- vytvoříme Backup Copy Job, namapujeme přenesenou zálohu a spustíme
Export Backup
Umožňuje syntetizovat úplný a nezávislý soubor plné zálohy z vybraných bodů obnovení, které se nachází v úložišti záloh. Vytvoří se tak VBK soubor k určitému datu (a odpovídající VBM). Záloha se ukládá na stejné úložiště, kde se nachází zdroj (do složky podle názvu VM a data).
- Home - Backups
- najdeme VM, které chceme exportovat, klikneme pravým tlačítkem a zvolíme Export backup
- můžeme vybrat Restore Point (defaultně je nejnovější) a dokončíme
Backup Copy Job
- naskenujeme cílové úložiště
- Backup Infrastructure - Backup Repositories - na úložišti volba Rescan
- záloha, kterou jsme přenesli, se objeví v Home - Backups - Disk (Imported)
- pokud jsme nekopírovali exportovanou zálohu, ale vzali jsem VBK a VBM soubory ze zálohovací úlohy, tak odstraníme chybějící zálohy - na záloze Properties a Forget - All unavailable backups
- vytvoříme Backup Copy Job
- Home - Backup Copy Job
- přidáme zdroje, které chceme kopírovat, zvolíme cílové úložiště ve vzdálené lokalitě, nastavíme další parametry
- namapujeme zálohu na Backup Copy Job
- na záložce Target zvolíme Map backup
- vybereme zálohu, kterou jsme přenesli do vzdálené lokality
- dokončíme průvodce Finish
- pokud jsme úlohu vytvořili vypnutou (Disabled), tak ji povolíme Enable
- úloha se nastartuje, pokud nejsme v čase, kdy není povoleno kopírování, tak začne probíhat
Synchronizace více Restore Point
Na jednu otázku jsem nenalezl odpověď, ale snad je Veeam dostatečně inteligentní a funguje správně.
Je pravděpodobné, že kopírování dat a přenos do vzdálené lokality nám bude trvat několik dní. Mezi tím vznikne v záloze, kterou chceme kopírovat, několik nových bodů obnovy (Restore Point). Oficiální dokumentace popisuje fungování Backup Copy tak, že se kopírují změny z nejnovějšího bodu obnovy.
Veeam Backup & Replication copies incremental changes from this most recent restore point …
Pouze při vytváření úvodní plné zálohy se mohou data kopírovat z více bodů obnovy, aby vznikla plná záloha.
Při prvním běhu úlohy s mapovanými soubory plné zálohy, se zaloguje několik událostí:
Missing restore points have been created Copying restore point 01.02.2023 19:31:29 from backup repository ScaleOutRepo
Uvádí se, že použil poslední bod obnovy, nikde není informace, jestli použil i další chybějící přírůstkové zálohy k existující plné záloze.
WAN Acceleration a Creating fingerprints
Pokud používáme WAN akcelerátory, tak můžeme narazit na další problém. Při prvním spuštění úlohy se v logu objeví událost Creating fingerprints for Hard disk
, která u mne nakonec trvala 21 hodin. Několikrát proto nestihla úloha proběhnout v rámci kopírovacího intervalu. Vždy se spustila znovu a začala od začátku vytvářet Fingerprints.
Fingerprints je patrně to, co se v dokumentaci označuje jako Digests. Akcelerátor analyzuje datové bloky souborů (VM disků), které se mají přenášet. A vytváří soubor s digests těchto datových bloků. Při dalším běhu vytvoří Digests nových souborů a porovnáním zjistí, zda se již dané datové bloky nepřenášely. Vytváření probíhá na cíli.
Tato operace na velkém disku trvá velmi dlouho. Obejít by mělo jít tím, že nepoužijeme WAN akceleraci (použijeme přenosový režim Direct). Nebo musíme zajistit, aby vytvoření Fingerprints proběhlo. To může znamenat dočasně povolit přenos dat úlohou kdykoliv a prodloužit interval periodického kopírování (třeba na 2 dny) či poladit start a spuštění úlohy.
Nakonec tedy proběhlo vytvoření Fingerprints, ty se zkopírovaly na zdroj. A došlo k přečtení a přenosu dat ze zdroje, jejichž velikost byla větší než jakákoliv přírůstková záloha. Snad tedy šlo o přírůstková data od plné zálohy přenesené do cíle.
Zdravím, chtěl bych se zeptat jestli je možné připojit záložní server pomocí veřejné IP adresy.
Chceme s kolegou zálohovat data na vzdálený server avšak nám to hází chyby.
odpověď na [1]Daniel: Určite je to možné, ale budete muset otevřít porty, které jsou potřeba pro kumunikaci Server <-> backup server(veeam port usage). Ale je to poměrně velké bezpečnostní riziko a myslete na kapacitu datové linky.