Automated storage tiering

From EIK wiki

Sissejuhatus

Andmete salvestamine ja andmekandjalt uuesti kättesaamine ning selle kiirus on arvutitehnoloogias väga olulised osad. Selleks ongi loodud "Automated storage tiering" (ATS) mis eesti keeles võiks olla tähenduselt umbes "automatiseeritud mitmekihiline salvestus". Ametlikku mõistet eesti keeles ei leia.


Veel alternatiivseid nimesid:
Fully automated storage tiering (FAST)[1][2]
Auto-Tiering[3][4][5]
Automated tiered storage [5]


"Automated storage tiering" on meetod, kus erinevat tüüpi andmed suunatakse ühendatud või võrgus olevas salvestussüsteemis erinevatesse salvestusruumi komponentidesse. Vähemkasutatavad/vähemtähtsad andmed (cold data) aeglasematesse kihtidesse ja sagedamini kasutatavad/tähtsamad(hot data) andmed kiirematesse kihtidesse. [3][5]


Sisu

AST abil on võimalik Delli andmetel saada ketaste jõudluse 8 korda paremaks ning hinna 80% madalamaks võrreldes tavaliste meetoditega.[1]

Andmete kättesaamisel on oluline nii kiirus kui ka hind. Kuna näiteks SSD kettad on kõige kiiremad ja kallimad ning SATA kettad on kõige odavamad ja aeglasemad, siis on kasulik ketaste mahtu kasutada nii, et kõige kiiremad (ja kallimad) kettad on kasutuses kõige sagedamini vajamineva info jaoks ning muu info vastavalt kasutussageduse järjekorras aeglasemate ja odavamate ketaste peal. Lisaks vähendab see ka nn "jalajälge", sest kasutab vähem energiat ning vajab vähem jahutamist. [6][1][4]

Andmete asukoha määrab ära nii andmete kasutamise sagedus kui ka kasutajate või IT spetsialistide määratud reeglid ning algoritmid. Näiteks või öelda reeglitega, et see osa peab olema SSD-s alati ja too SATA-s ning vastavalt sellele neid ka paigutatakse. Alati võib seda määrata portidega või LUN-ide (loogiliste üksuste numbrite) baasil päringusageduste alusel. Mida sagedamini mingit üksust päritakse, seda tõenäolisemalt on ta kiiremas kettakihis.[4] Kuna LUN-id võivad olla väga suured, siis tänapäeval toimetatakse pigem LUN-ide siseselt (sub-LUN). Nii saab ka määrata ära reeglitega, et mingil perioodil on mingid andmekogumid kõrgemas kihis. Nagu ka nimi ütleb, on tegu automaatse ja pideva monitoorimise ja tegevusega.[6][1][7] Konfigureerimine/optimeerimine on samas väga keeruline ja ajakulukas ning võib võtta mitmeid kuid andmete liikumise analüüsi. Lisaks võib iga väiksemgi viga valusalt hiljem tunda anda.[8] Lisaks on oluline ka andmekogumite suurus, mida kandma peab ehk andmete granuleeritus. Mida väiksemad andmehulgad ühes kogumis, seda vähem on igal ümberarvutusel vaja andmeid ümber tõsta ketaste vahel.[7] Dell Compellent kasutab 32KB ampse (varasemalt 512KB). HP EVA kasutab LUN taset, IBM DS8000 kasutab 1GB ampse, Dell EqualLogic 15MB. Storwize V7000 1GB samme. IBM XIV kihid puuduvad. [6]

AST-s võib olla mitu kihti kettaid: näiteks SSD, FC, SAS ja SATA. Lisaks on seal tavaliselt mitu erinevat RAID taset ning andmete paigutuse optimeerimist. Samas võib mõnes süsteemis piisata ka lihtsalt kahest kihist. Lisaks võib olla oluline, millisele kihile alguses andmed kirjutatakse. Ühe allika arvates on parim, kui alguses kirjutada andmed kiiremale kettale, kust need hiljem aeglasematele üle viiakse, mitte vastupidi.[7][9] Erinevatel ketastel kasutatakse erinevaid RAID-e andmete säilivuse ja ligipääsu tagamiseks.[9] Näiteks Infortrendi tooted kasutavad RAID 0, 1, 3, 5, 6 oma toodetes[10]

Üsna head seletused Automated storage tieringi kohta on toodud selles videos[11].



Näide

Infortrendi mitmetasemelise AST eelised on põhimõtteliselt ka teiste tootjate puhul samad: Saab peenhäälestada salvestamist erinevate kettatüüpide ja RAID-tasemete abil. Saab optimeerida salvestamise jõudlust. Efektiivne kasutamine parendab kasumit ja ka salvestusseadme eluiga. Paindlik mahtuvus, sest kasutatakse ka vahetasemeid. Väga efektiivne andmete migreerimine andmete kasutamise mustrite, mitmekihilise granulaarse andmete liigutamise, kasutuse alusel ajalise planeerimise ja SSD-l vajaliku mahu tagamise tõttu. Sobiva salvestuse kasutamine, mistõttu väheneb salvestuse jalajälg ja voolutarbimine. Lihtne haldamine, kus automatiseerimine vähendab IT töötajatel haldamisele kuluvat aega.[12]


AST-d toetavad järgmisi operatsioonisüsteeme, kuid võivad toetada ka muid vastavalt tootjale ja tootele: Windows Server 2003 / 2008 / 2008 R2 / 2012/ 2012R2 (ka Hyper-V), Windows 7 Enterprise SP1, MAC OS X,SUSE Linux Enterprise, Sun Solaris, IBM AIX, HP-UX, Debian, CentOS, VMware ja Citrix XenServer.[10]

Andmed jagatakse gruppidesse. Näiteks esimese taseme andmed on väga olulised ja sageli kasutatavad ning pannakse kõige kallimatele ketastele. Harvem kasutatavad andmed ja varundus on sageli teise taseme või vee madalamatel ketastel, mis on odavamad ja aeglasemad.[2] Näiteks OLTP andmebaasid, CRM, e-post ja virtuaalmasinad on 1. ja 2. taseme ketastel.[9] Väga harva kasutatavad pannakse 3. taseme või veel madalama taseme ketastele.[2]

Probleemid[9]
Jõudlus - soovitatakse teha pilvevarundamist ainult vähemtähtsatest ja harvem kasutatavatest andmetest ning olulisemad varundada kohapeal.
Turvalisus - kõiki andmeid ei tohi pilves salvestada.
Kasutusmustrid - oma andmete kasutussagedust ja mustreid teades on võimalik hoida kulud allalaadimisele minimaalsed.
Hind - pilves suure hulga andmete salvestamine ei pruugi olla majanduslikult mõistlik.

Kokkuvõte

Andmete salvestamine, haldamine ja kasutamine on IT üks aluseid ning selleks on vaja võimalikult ökonoomselt toimivaid seadmeid. Lihtsalt serverile või kõvakettale salvestamine pole tänapäev enam piisavalt efektiivne. Seetõttu ongi leitud lahendus automated storage tieringu (automatiseeritud mitmekihiline salvestus vmt) näol.

Autor

Annika Kask
AK21

Kasutatud materjalid