Automated storage tiering: Difference between revisions

From ICO wiki
Jump to navigationJump to search
Ankask (talk | contribs)
No edit summary
Ankask (talk | contribs)
 
(2 intermediate revisions by the same user not shown)
Line 17: Line 17:
AST abil on võimalik Delli andmetel saada ketaste jõudluse 8 korda paremaks ning hinna 80% madalamaks võrreldes tavaliste meetoditega.<ref name="Dell" />
AST abil on võimalik Delli andmetel saada ketaste jõudluse 8 korda paremaks ning hinna 80% madalamaks võrreldes tavaliste meetoditega.<ref name="Dell" />


Andmete kättesaamisel on oluline nii kiirus kui ka hind. Kuna näiteks SSD kettad on kõige kiiremad ja kallimad ning SATA kettad on kõige odavamad ja aeglasemad, siis on kasulik ketaste mahtu kasutada nii, et kõige kiiremad (ja kallimad) kettad on kasutuses kõige sagedamini vajamineva info jaoks ning muu info vastavalt kasutussageduse järjekorras aeglastemate ja odavamate ketaste peal. Lisaks vähendab see ka nn "jalajälge", sest kasutab vähem energiat ning vajab vähem jahutamist. <ref name="The Register">[https://www.theregister.co.uk/2011/11/02/auto_tiering_effectivenes/ Chris Mellor. Is Auto-tiering storage really as good as it sounds? The Register. Avaldatud: 02.11.2011]</ref><ref name="Dell" /><ref name="Gartner" />
Andmete kättesaamisel on oluline nii kiirus kui ka hind. Kuna näiteks SSD kettad on kõige kiiremad ja kallimad ning SATA kettad on kõige odavamad ja aeglasemad, siis on kasulik ketaste mahtu kasutada nii, et kõige kiiremad (ja kallimad) kettad on kasutuses kõige sagedamini vajamineva info jaoks ning muu info vastavalt kasutussageduse järjekorras aeglasemate ja odavamate ketaste peal. Lisaks vähendab see ka nn "jalajälge", sest kasutab vähem energiat ning vajab vähem jahutamist. <ref name="The Register">[https://www.theregister.co.uk/2011/11/02/auto_tiering_effectivenes/ Chris Mellor. Is Auto-tiering storage really as good as it sounds? The Register. Avaldatud: 02.11.2011]</ref><ref name="Dell" /><ref name="Gartner" />


Andmete asukoha määrab ära nii andmete kasutamise sagedus kui ka kasutajate või IT spetsialistide määratud reeglid ning algoritmid. Näiteks või öelda reeglitega, et see osa peab olema SSD-s alati ja too SATA-s ning vastavalt sellele neid ka paigutatakse. Alati võib seda määrata portidega või LUNide (loogiliste üksuste numbrite) baasil päringusageduste alusel. Mida sagedamini mingit üksust päritakse, seda tõenäolisemalt on ta kiiremas kettakihis.<ref name="Gartner" /> Kuna LUNid võivad olla väga suured, siis tänapäeval toimetatakse pigem LUNide siseselt (sub-LUN). Nii saab ka määrata ära reeglitega, et mingil perioodil on mingid andmekogumid kõrgemas kihis. Nagu ka nimi ütleb, on tegu automaatse ja pideva monitoorimise ja tegevusega.<ref name="The Register" /><ref name="Dell" /><ref name="register2">[https://www.theregister.co.uk/2011/03/14/automated_storage_tiering/ Enrico Signoretti. How to evaluate ... automated storage tiering 360° review. The Register. Avaldatud: 14.03.2011]</ref>  
Andmete asukoha määrab ära nii andmete kasutamise sagedus kui ka kasutajate või IT spetsialistide määratud reeglid ning algoritmid. Näiteks või öelda reeglitega, et see osa peab olema SSD-s alati ja too SATA-s ning vastavalt sellele neid ka paigutatakse. Alati võib seda määrata portidega või LUN-ide (loogiliste üksuste numbrite) baasil päringusageduste alusel. Mida sagedamini mingit üksust päritakse, seda tõenäolisemalt on ta kiiremas kettakihis.<ref name="Gartner" /> Kuna LUN-id võivad olla väga suured, siis tänapäeval toimetatakse pigem LUN-ide siseselt (sub-LUN). Nii saab ka määrata ära reeglitega, et mingil perioodil on mingid andmekogumid kõrgemas kihis. Nagu ka nimi ütleb, on tegu automaatse ja pideva monitoorimise ja tegevusega.<ref name="The Register" /><ref name="Dell" /><ref name="register2">[https://www.theregister.co.uk/2011/03/14/automated_storage_tiering/ Enrico Signoretti. How to evaluate ... automated storage tiering 360° review. The Register. Avaldatud: 14.03.2011]</ref>  
Konfigureerimine/optimeerimine on samas väga keeruline ja ajakulukas ning võib võtta mitmeid kuid andmete liikumise analüüsi. Lisaks võib iga väiksemgi viga valusalt hiljem tunda anda.<ref name="quora_fleeman">[https://www.quora.com/What-are-the-advantages-and-disadvantages-of-automated-storage-tiering C. Fleeman, T.Rush, B. Leach. What are the advantages and disadvantages of automated storage tiering? 5.1.2017]</ref>
Konfigureerimine/optimeerimine on samas väga keeruline ja ajakulukas ning võib võtta mitmeid kuid andmete liikumise analüüsi. Lisaks võib iga väiksemgi viga valusalt hiljem tunda anda.<ref name="quora_fleeman">[https://www.quora.com/What-are-the-advantages-and-disadvantages-of-automated-storage-tiering C. Fleeman, T.Rush, B. Leach. What are the advantages and disadvantages of automated storage tiering? 5.1.2017]</ref>
Lisaks on oluline ka andmekogumite suurus, mida kandma peab  ehk andmete granuleeritus. Mida väiksemad andmehulgad ühes kogumis, seda vähem on igal ümberarvutusel vaja andmeid ümber tõsta ketaste vahel.<ref name="register2" /> Dell Compellent kasutab 32KB ampse (varasemalt 512KB). HP EVA kasutab LUN taset. IBM DS8000 kasutab 1GB ampse, Dell EqualLogic 15MB. Storwize V7000 1GB samme. IBM XIV kihid puuduvad. <ref name="The Register" />
Lisaks on oluline ka andmekogumite suurus, mida kandma peab  ehk andmete granuleeritus. Mida väiksemad andmehulgad ühes kogumis, seda vähem on igal ümberarvutusel vaja andmeid ümber tõsta ketaste vahel.<ref name="register2" /> Dell Compellent kasutab 32KB ampse (varasemalt 512KB). HP EVA kasutab LUN taset, IBM DS8000 kasutab 1GB ampse, Dell EqualLogic 15MB. Storwize V7000 1GB samme. IBM XIV kihid puuduvad. <ref name="The Register" />


AST-s võib olla mitu kihti kettaid: näiteks SSD, FC, SAS ja SATA. Lisaks on seal tavaliselt mitu erinevat RAIDi taset ning andmete paigutuse optimeerimist. Samas võib mõnes süsteemis piisata ka lihtsalt kahest kihist. Lisaks võib olla oluline, millisele kihile alguses andmed kirjutatakse. Ühe allika arvates on parim, kui alguses kirjutada andmed kiiremale kettale, kust need hiljem aeglasematele üle viiakse, mitte vastupidi.<ref name="register2" /><ref name="cloudian">[https://cloudian.com/blog/introduction-data-tiering/ An Introduction to Data Tiering. Vaadatud: 12.06.2018]</ref>
AST-s võib olla mitu kihti kettaid: näiteks SSD, FC, SAS ja SATA. Lisaks on seal tavaliselt mitu erinevat RAID taset ning andmete paigutuse optimeerimist. Samas võib mõnes süsteemis piisata ka lihtsalt kahest kihist. Lisaks võib olla oluline, millisele kihile alguses andmed kirjutatakse. Ühe allika arvates on parim, kui alguses kirjutada andmed kiiremale kettale, kust need hiljem aeglasematele üle viiakse, mitte vastupidi.<ref name="register2" /><ref name="cloudian">[https://cloudian.com/blog/introduction-data-tiering/ An Introduction to Data Tiering. Vaadatud: 12.06.2018]</ref>
Erinevatel ketastel kasutatakse erinevaid RAIDe andmete säilivuse ja ligipääsu tagamiseks.<ref name="cloudian" /> Näiteks Infortrendi tooted kasutavad RAID 0, 1, 3, 5, 6 oma toodetes<ref name="Infor3">[https://www.infortrend.com/ImageLoader/LoadDoc/381 ESVA Automated Storage Tiering. Infortrend. Vaadatud: 12.06.2018]</ref>  
Erinevatel ketastel kasutatakse erinevaid RAID-e andmete säilivuse ja ligipääsu tagamiseks.<ref name="cloudian" /> Näiteks Infortrendi tooted kasutavad RAID 0, 1, 3, 5, 6 oma toodetes<ref name="Infor3">[https://www.infortrend.com/ImageLoader/LoadDoc/381 ESVA Automated Storage Tiering. Infortrend. Vaadatud: 12.06.2018]</ref>  


Üsna head seletused <i>Automated storage tiering</i>i kohta on toodud selles videos<ref name="youtube">[https://www.youtube.com/watch?v=yvK9o5NTFVk Automated Storage Tiering. Infortrend. Youtube. Vaadatud:11.06.2018]</ref>.  
Üsna head seletused <i>Automated storage tiering</i>i kohta on toodud selles videos<ref name="youtube">[https://www.youtube.com/watch?v=yvK9o5NTFVk Automated Storage Tiering. Infortrend. Youtube. Vaadatud:11.06.2018]</ref>.  
Line 53: Line 53:


=Kokkuvõte=
=Kokkuvõte=
Andmete salvestamine, haldamine ja kasutamine on IT üks aluseid ning selleks on vaja võimalikult ökonoomselt toimivaid seadmeid. Lihtsalt serverile või kõvakettale salvestamine pole tänapäev enam piisavalt efektiivne. Seetõttu ongi leitud lahendus automated storage tiering'u (automatiseeritud salvestuskihtide) näol.
Andmete salvestamine, haldamine ja kasutamine on IT üks aluseid ning selleks on vaja võimalikult ökonoomselt toimivaid seadmeid. Lihtsalt serverile või kõvakettale salvestamine pole tänapäev enam piisavalt efektiivne. Seetõttu ongi leitud lahendus automated storage tieringu (automatiseeritud mitmekihiline salvestus vmt) näol.
 
=Autor=
Annika Kask<br>
AK21


=Kasutatud materjalid=
=Kasutatud materjalid=


[[Category:Andmesalvestustehnoloogiad]]
[[Category:Andmesalvestustehnoloogiad]]

Latest revision as of 21:22, 13 June 2018

Sissejuhatus

Andmete salvestamine ja andmekandjalt uuesti kättesaamine ning selle kiirus on arvutitehnoloogias väga olulised osad. Selleks ongi loodud "Automated storage tiering" (ATS) mis eesti keeles võiks olla tähenduselt umbes "automatiseeritud mitmekihiline salvestus". Ametlikku mõistet eesti keeles ei leia.


Veel alternatiivseid nimesid:
Fully automated storage tiering (FAST)[1][2]
Auto-Tiering[3][4][5]
Automated tiered storage [5]


"Automated storage tiering" on meetod, kus erinevat tüüpi andmed suunatakse ühendatud või võrgus olevas salvestussüsteemis erinevatesse salvestusruumi komponentidesse. Vähemkasutatavad/vähemtähtsad andmed (cold data) aeglasematesse kihtidesse ja sagedamini kasutatavad/tähtsamad(hot data) andmed kiirematesse kihtidesse. [3][5]


Sisu

AST abil on võimalik Delli andmetel saada ketaste jõudluse 8 korda paremaks ning hinna 80% madalamaks võrreldes tavaliste meetoditega.[1]

Andmete kättesaamisel on oluline nii kiirus kui ka hind. Kuna näiteks SSD kettad on kõige kiiremad ja kallimad ning SATA kettad on kõige odavamad ja aeglasemad, siis on kasulik ketaste mahtu kasutada nii, et kõige kiiremad (ja kallimad) kettad on kasutuses kõige sagedamini vajamineva info jaoks ning muu info vastavalt kasutussageduse järjekorras aeglasemate ja odavamate ketaste peal. Lisaks vähendab see ka nn "jalajälge", sest kasutab vähem energiat ning vajab vähem jahutamist. [6][1][4]

Andmete asukoha määrab ära nii andmete kasutamise sagedus kui ka kasutajate või IT spetsialistide määratud reeglid ning algoritmid. Näiteks või öelda reeglitega, et see osa peab olema SSD-s alati ja too SATA-s ning vastavalt sellele neid ka paigutatakse. Alati võib seda määrata portidega või LUN-ide (loogiliste üksuste numbrite) baasil päringusageduste alusel. Mida sagedamini mingit üksust päritakse, seda tõenäolisemalt on ta kiiremas kettakihis.[4] Kuna LUN-id võivad olla väga suured, siis tänapäeval toimetatakse pigem LUN-ide siseselt (sub-LUN). Nii saab ka määrata ära reeglitega, et mingil perioodil on mingid andmekogumid kõrgemas kihis. Nagu ka nimi ütleb, on tegu automaatse ja pideva monitoorimise ja tegevusega.[6][1][7] Konfigureerimine/optimeerimine on samas väga keeruline ja ajakulukas ning võib võtta mitmeid kuid andmete liikumise analüüsi. Lisaks võib iga väiksemgi viga valusalt hiljem tunda anda.[8] Lisaks on oluline ka andmekogumite suurus, mida kandma peab ehk andmete granuleeritus. Mida väiksemad andmehulgad ühes kogumis, seda vähem on igal ümberarvutusel vaja andmeid ümber tõsta ketaste vahel.[7] Dell Compellent kasutab 32KB ampse (varasemalt 512KB). HP EVA kasutab LUN taset, IBM DS8000 kasutab 1GB ampse, Dell EqualLogic 15MB. Storwize V7000 1GB samme. IBM XIV kihid puuduvad. [6]

AST-s võib olla mitu kihti kettaid: näiteks SSD, FC, SAS ja SATA. Lisaks on seal tavaliselt mitu erinevat RAID taset ning andmete paigutuse optimeerimist. Samas võib mõnes süsteemis piisata ka lihtsalt kahest kihist. Lisaks võib olla oluline, millisele kihile alguses andmed kirjutatakse. Ühe allika arvates on parim, kui alguses kirjutada andmed kiiremale kettale, kust need hiljem aeglasematele üle viiakse, mitte vastupidi.[7][9] Erinevatel ketastel kasutatakse erinevaid RAID-e andmete säilivuse ja ligipääsu tagamiseks.[9] Näiteks Infortrendi tooted kasutavad RAID 0, 1, 3, 5, 6 oma toodetes[10]

Üsna head seletused Automated storage tieringi kohta on toodud selles videos[11].



Näide

Infortrendi mitmetasemelise AST eelised on põhimõtteliselt ka teiste tootjate puhul samad: Saab peenhäälestada salvestamist erinevate kettatüüpide ja RAID-tasemete abil. Saab optimeerida salvestamise jõudlust. Efektiivne kasutamine parendab kasumit ja ka salvestusseadme eluiga. Paindlik mahtuvus, sest kasutatakse ka vahetasemeid. Väga efektiivne andmete migreerimine andmete kasutamise mustrite, mitmekihilise granulaarse andmete liigutamise, kasutuse alusel ajalise planeerimise ja SSD-l vajaliku mahu tagamise tõttu. Sobiva salvestuse kasutamine, mistõttu väheneb salvestuse jalajälg ja voolutarbimine. Lihtne haldamine, kus automatiseerimine vähendab IT töötajatel haldamisele kuluvat aega.[12]


AST-d toetavad järgmisi operatsioonisüsteeme, kuid võivad toetada ka muid vastavalt tootjale ja tootele: Windows Server 2003 / 2008 / 2008 R2 / 2012/ 2012R2 (ka Hyper-V), Windows 7 Enterprise SP1, MAC OS X,SUSE Linux Enterprise, Sun Solaris, IBM AIX, HP-UX, Debian, CentOS, VMware ja Citrix XenServer.[10]

Andmed jagatakse gruppidesse. Näiteks esimese taseme andmed on väga olulised ja sageli kasutatavad ning pannakse kõige kallimatele ketastele. Harvem kasutatavad andmed ja varundus on sageli teise taseme või vee madalamatel ketastel, mis on odavamad ja aeglasemad.[2] Näiteks OLTP andmebaasid, CRM, e-post ja virtuaalmasinad on 1. ja 2. taseme ketastel.[9] Väga harva kasutatavad pannakse 3. taseme või veel madalama taseme ketastele.[2]

Probleemid[9]
Jõudlus - soovitatakse teha pilvevarundamist ainult vähemtähtsatest ja harvem kasutatavatest andmetest ning olulisemad varundada kohapeal.
Turvalisus - kõiki andmeid ei tohi pilves salvestada.
Kasutusmustrid - oma andmete kasutussagedust ja mustreid teades on võimalik hoida kulud allalaadimisele minimaalsed.
Hind - pilves suure hulga andmete salvestamine ei pruugi olla majanduslikult mõistlik.

Kokkuvõte

Andmete salvestamine, haldamine ja kasutamine on IT üks aluseid ning selleks on vaja võimalikult ökonoomselt toimivaid seadmeid. Lihtsalt serverile või kõvakettale salvestamine pole tänapäev enam piisavalt efektiivne. Seetõttu ongi leitud lahendus automated storage tieringu (automatiseeritud mitmekihiline salvestus vmt) näol.

Autor

Annika Kask
AK21

Kasutatud materjalid