CAS: Difference between revisions

From ICO wiki
Jump to navigationJump to search
Dlohmus (talk | contribs)
Edmund (talk | contribs)
mNo edit summary
 
(45 intermediate revisions by one other user not shown)
Line 1: Line 1:


== Content-addressed storage – objektipõhiselt  adresseeritud varundamine ==
== Sissejuhatus ==
Objektipõhiselt adresseeritud varundamine (CAS)[http://searchstorage.techtarget.com/definition/content-addressed-storage] on meetod mille abil on võimalik tagada kiire juurdepääs fikseeritud andmetele, määrates nende alalise asukoha kettal. CAS teeb andmete üle kandmise lihtsaks, varundades neid sellisel viisil, et objekti ei saa dubleerida ega muuta, kui see on kord juba salvestatud. Seega on objekti asukoht üheselt mõistetav. Termin võeti kasutusele EMC Korporatsiooni poolt, kui nad avalikustasid Centera 2002. aastal.
Objektipõhiselt adresseeritud varundamine (Content Addressed Storage - CAS)[http://searchstorage.techtarget.com/definition/content-addressed-storage] on tehnoloogia, mis võimaldab sõltumata asukohast salvestada fikseeritud kujul objekte. CAS teeb andmete üle kandmise lihtsaks, varundades neid sellisel viisil, et objekti ei saa dubleerida ega muuta, kui see on kord juba salvestatud. Seega on objekti asukoht üheselt mõistetav. Termin võeti kasutusele EMC Korporatsiooni poolt, kui nad avalikustasid Centera 2002. aastal.


== Kuidas CAS toimib? ==
== Kirjeldus ==
Kui objekt on CAS-i salvestatud, saab ta unikaalse nime, mis näitab ka askohta kettal, kuhu ta on salvetatud. Seda tüüpi aadresse nimetatakse "objekti aadressiks" ("content address"). See tõttu puudub vajadus eraldi tsentraliseeritud indekseerimise järele. Kui objekt on jub kord salvestatud, ei saa seda kustutada enne, kui kindlaks määratud säilitamise aeg on möödas.
CAS puhul on kasutusel räsialgoritm, mis arvutab igale salvestatud objektile unikaalse idenfikaatori või digitaalse sõrmejälje. Seda tüüpi aadresse nimetatakse "objekti aadressiks" ("content address"). Selle aadressi järgi jagab ligipääsumehhanism serveritele võimalust andmeid näha.  Kui andmeobjekti muudetakse, saab ta uue unikaalse aadressi. Seetõttu puudub vajadus eraldi tsentraliseeritud indekseerimise järele ning andmete füüsiline asukoht kettal ei oma tähtsust. Kui objekt on kord juba salvestatud, ei saa seda kustutada enne, kui kindlaks määratud säilitamise aeg on möödas. CAS tehnoloogias kasutatakse pigem andmete salvestamist kettale, mitte lindile. See ühtlustab otsinguprotsessi salvestatud objektide seas.
 
== CAS arhitektuur ==
 
CAS arhitektuur (Joonis 1) on liiasmassiiv sõltumatutest ketastest [[File:Cas.png | frame | Joonis 1 - CAS arhitektuur[http://www.storagetutorials.com/content-addressed-storage-cas/]]] ''(Redundant Array of Independent Nodes- RAIN)''. CAS-is on privaatses kohtvõrgus (LAN- ''local area network'') rühmana ühendatud ''storage-node (front-end)'' ja ''access-node (back-end)''. Kliendid pääsevad CAS süsteemile ligi eraldi kohtvõrgu kaudu, mis ühendab omavahel CAS kliente ja rakendusserverid. Kettamassiivi loomiseks kasutatakse ATA HDD kettaid, mis on odavad ja suure mahutavusega. Nendel ketastel töötab opertsioonisüsteem koos spetsiaalse tarkvaraga mis on vajalik CAS süsteemi funktsionaalsuse tagamiseks.
<br/>
 
== CAS kasutamine ==
 
1.Klient sisestab andmed arhiveerimiseks süsteemi CAS liidese (API) kaudu<br/>
2.Andmetest eraldatakse metadata ja tegelikud andmed (BLOB) ning arvutatakse CA (content address)<br/>
3.Metadata + CA lisatakse eraldi C-Clip Descriptor faili (CDF). CDF saadetakse ja salvestatakse CAS-is<br/>
4.Pärast CDF-i ja BLOB-i edukat salvestamist saadetakse teade CAS API-le<br/>
5.Pärast andmete edukat salvestust luuakse C-Clip ID, mis edastatakse API-le ja kohalikule serverile, mille peal API käib<br/>
6.Esimeses punktis lisatud faile on võimalik lugeda lugeda selle sama C-Clip ID järgi<br/>
7.Lugemiseks pöördub kasutaja API poole ning C-Clip ID järgi leitakse andmed otse CAS-i pealt ning edastatakse läbi API kasutajale<br/>
[http://enos.itcollege.ee/~kloodus/storage/2015_paevaope/06_SAN_IPSAN_NAS_CAS_loeng_sygis2015.pdf]
 
== CAS plussid ja miinused ==
 
CAS süsteem on andmesalvestuses kasulik alljärgnevat põhjustel:
 
1. Selliste objektide (andmete) salvestamiseks, mille muutmine ei ole tõenäoline <br/>
2. Objektide sisu autentsus on tagatud <br/>
3. Objektide muutmise info õigsus on tagatud <br/>
4. Asukohast sõltumatu <br/>
5. Optimeeritud ja tsentraliseeritud andmete säilitamise lahendus <br/>
6. Andmete ja objektide kiire kättesaadavus.
 
CAS süsteemi suurimaks miinuseks on on see, et ta ei sobi kasutamiseks muutuva sisuga lahenduste jaoks.
 
== Kokkuvõte ==
 
CAS tehnoloogia on kindlasti kasulik andmete arhiveerimise juures. Kuna selle tehnoloogia puhul on objektide sisu autentsus tagatud ning ta on asukohast sõtlumatu, siis  Eesti kontekstis oleks CAS tehnoloogiat mõistlik kasutatada näiteks riigi- või kohaliku omavalitsuse asutustes. Seadus näeb ette erinevate andmete säilitamise pikaks ajaks (nt 7 aastat), siis arhiveeritud andmeid ei muudeta, kuid vajadusel on nad CAS tehnoloogiat kasutades alati kättesaadavad.
 
== Kasutatud materjalid ==
 
1. http://www.storagetutorials.com/content-addressed-storage-cas/ (10.05.2016) <br/>
2. http://searchstorage.techtarget.com/definition/content-addressed-storage (10.05.2016) <br/>
3. http://enos.itcollege.ee/~kloodus/storage/2015_paevaope/06_SAN_IPSAN_NAS_CAS_loeng_sygis2015.pdf (10.05.2016)<br/>
 
== Autor ==
Diana Lõhmus <br/>
Rühm AK21 2016 <br>
 
[[Category:Andmesalvestustehnoloogiad]]

Latest revision as of 02:09, 27 October 2016

Sissejuhatus

Objektipõhiselt adresseeritud varundamine (Content Addressed Storage - CAS)[2] on tehnoloogia, mis võimaldab sõltumata asukohast salvestada fikseeritud kujul objekte. CAS teeb andmete üle kandmise lihtsaks, varundades neid sellisel viisil, et objekti ei saa dubleerida ega muuta, kui see on kord juba salvestatud. Seega on objekti asukoht üheselt mõistetav. Termin võeti kasutusele EMC Korporatsiooni poolt, kui nad avalikustasid Centera 2002. aastal.

Kirjeldus

CAS puhul on kasutusel räsialgoritm, mis arvutab igale salvestatud objektile unikaalse idenfikaatori või digitaalse sõrmejälje. Seda tüüpi aadresse nimetatakse "objekti aadressiks" ("content address"). Selle aadressi järgi jagab ligipääsumehhanism serveritele võimalust andmeid näha. Kui andmeobjekti muudetakse, saab ta uue unikaalse aadressi. Seetõttu puudub vajadus eraldi tsentraliseeritud indekseerimise järele ning andmete füüsiline asukoht kettal ei oma tähtsust. Kui objekt on kord juba salvestatud, ei saa seda kustutada enne, kui kindlaks määratud säilitamise aeg on möödas. CAS tehnoloogias kasutatakse pigem andmete salvestamist kettale, mitte lindile. See ühtlustab otsinguprotsessi salvestatud objektide seas.

CAS arhitektuur

CAS arhitektuur (Joonis 1) on liiasmassiiv sõltumatutest ketastest

Joonis 1 - CAS arhitektuur[1]

(Redundant Array of Independent Nodes- RAIN). CAS-is on privaatses kohtvõrgus (LAN- local area network) rühmana ühendatud storage-node (front-end) ja access-node (back-end). Kliendid pääsevad CAS süsteemile ligi eraldi kohtvõrgu kaudu, mis ühendab omavahel CAS kliente ja rakendusserverid. Kettamassiivi loomiseks kasutatakse ATA HDD kettaid, mis on odavad ja suure mahutavusega. Nendel ketastel töötab opertsioonisüsteem koos spetsiaalse tarkvaraga mis on vajalik CAS süsteemi funktsionaalsuse tagamiseks.


CAS kasutamine

1.Klient sisestab andmed arhiveerimiseks süsteemi CAS liidese (API) kaudu
2.Andmetest eraldatakse metadata ja tegelikud andmed (BLOB) ning arvutatakse CA (content address)
3.Metadata + CA lisatakse eraldi C-Clip Descriptor faili (CDF). CDF saadetakse ja salvestatakse CAS-is
4.Pärast CDF-i ja BLOB-i edukat salvestamist saadetakse teade CAS API-le
5.Pärast andmete edukat salvestust luuakse C-Clip ID, mis edastatakse API-le ja kohalikule serverile, mille peal API käib
6.Esimeses punktis lisatud faile on võimalik lugeda lugeda selle sama C-Clip ID järgi
7.Lugemiseks pöördub kasutaja API poole ning C-Clip ID järgi leitakse andmed otse CAS-i pealt ning edastatakse läbi API kasutajale
[3]

CAS plussid ja miinused

CAS süsteem on andmesalvestuses kasulik alljärgnevat põhjustel:

1. Selliste objektide (andmete) salvestamiseks, mille muutmine ei ole tõenäoline
2. Objektide sisu autentsus on tagatud
3. Objektide muutmise info õigsus on tagatud
4. Asukohast sõltumatu
5. Optimeeritud ja tsentraliseeritud andmete säilitamise lahendus
6. Andmete ja objektide kiire kättesaadavus.

CAS süsteemi suurimaks miinuseks on on see, et ta ei sobi kasutamiseks muutuva sisuga lahenduste jaoks.

Kokkuvõte

CAS tehnoloogia on kindlasti kasulik andmete arhiveerimise juures. Kuna selle tehnoloogia puhul on objektide sisu autentsus tagatud ning ta on asukohast sõtlumatu, siis Eesti kontekstis oleks CAS tehnoloogiat mõistlik kasutatada näiteks riigi- või kohaliku omavalitsuse asutustes. Seadus näeb ette erinevate andmete säilitamise pikaks ajaks (nt 7 aastat), siis arhiveeritud andmeid ei muudeta, kuid vajadusel on nad CAS tehnoloogiat kasutades alati kättesaadavad.

Kasutatud materjalid

1. http://www.storagetutorials.com/content-addressed-storage-cas/ (10.05.2016)
2. http://searchstorage.techtarget.com/definition/content-addressed-storage (10.05.2016)
3. http://enos.itcollege.ee/~kloodus/storage/2015_paevaope/06_SAN_IPSAN_NAS_CAS_loeng_sygis2015.pdf (10.05.2016)

Autor

Diana Lõhmus
Rühm AK21 2016