Betekintés: Gajdos Sándor - Adatbázisok, oldal #3

Figyelem! Ez itt a doksi tartalma kivonata.
Kérlek kattints ide, ha a dokumentum olvasóban szeretnéd megnézni!

század utolsó
évtizedében az adatbázis-kezelés területén is tért hódítottak az új elvek, mint az objektumorientáltság vagy a
logikai programozás, a hálózatok elterjedésével az elosztott adatbázis-kezelők jelentősége is növekszik.
Emellett egyre nagyobb szerepet kapnak a strukturált adatkezeléstől eltérő felépítésű és funkciójú, szövegszerű kezelést megvalósító (szemistrukturált, ill. strukturálatlan adatokon dolgozó, ld. Függelék:
Szemistrukturált adatok) információs rendszerek is, mint ahogyan az adatok kezelése helyett egyre fontosabbá válik az „értelmezett adat” (információ), ill. a tudás (kontextusba helyzett információ) kezelése (ld.
tudásbázisok). A XXI. század elején pedig petabájtos adatmennyiségeket perzisztensen tárolni tudó, de csak
korlátozott lekérdezhetőséget támogató rendszerek hódítanak (ld. pl. Yahoo!, Twitter, Facebook). Természetesen ezek a korlátok csak átmenetiek, már készül (2013 őszére tervezett befejezéssel) az első yottabájt
(1024) méretű, a legkülönbözőbb forrásból származó és típusú adatokat (szöveg, szám, hang, kép, video)
egyaránt feldolgozni képes adatbázis az USA Nemzetbiztonsági Hivatala (NSA) számára1. Az adatok sok
terabájt méretű hányada már folyamatosan a memóriában található, ami ezekhez az adatokhoz való hozzáférést több nagyságrenddel gyorsítja meg ahhoz képest, mintha az adatokat mágnes- vagy optikai lemezen tárolnánk (ld. IMDB2, memóriarezidens adatbázisok).
Itt tartunk most...

1. Alapfogalmak
Adatbázisnak a valós világ egy részhalmazának leírásához használt adatok összefüggő, rendszerezett halmazát nevezzük. Ma ezek többé-kevésbé állandó formában egy számítógép háttértárolóján tárolódnak.
Azt a hardver-szoftver rendszert, amely egy vagy több személy számára magas szinten teszi lehetővé ezen
adatok olvasását vagy módosítását, adatbázis-kezelő rendszernek (Database Management System, DBMS)
nevezzük. Az adatbázis-kezelőt alapvetően jellemző tulajdonságok:
 nagy adatmennyiség,
 gazdag struktúra és
 hosszú életciklus.
Az adatbázis-kezelő rendszerek adatait (még) ma (2012.) is túlnyomórészt merevlemezes mágneses háttértárakon (hard drive, „winchester”) tárolják, kisebb részben mágnesszalagon, optikai lemezen, de rohamosan
1

Ennek a nagyságát segít elképzelni, ha tudjuk, hogy a teljes világháló forgalma 2010-ben “csak” mintegy 250 exabájt (250*1018
byte) volt.
2 In-Memory DataBases

2

Forrás: http://www.doksi.hu

növekvő hányadban szilárdtest memóriában is. Így jelen jegyzetben a mágneslemezes háttértárak alkalmazására, sajátosságaira koncentrálunk. Az adatbázis-kezelő gazdag struktúrája azt jelenti, hogy a tárolt rekordok
között változatos logikai kapcsolatok hozhatók létre, amelyek meghatározott adatbázis-műveleteket megkönnyíthetnek (értsd: meggyorsíthatnak). Egyes adatbázis-kezelők bizonyos logikai kapcsolatokat megengedhetnek az adatok között, másokat nem, így különböző adatmodelleken (ld. 4.1. szakasz) alapulhatnak.
Hosszú életciklusuk legjobban talán a népességi adatbázisok példájával szemléltethető, amelyeknek tetszőlegesen hosszú időt és igen sok technológiai váltást is túl kell élniük mindaddig, amíg népességi adatbázisokra egyáltalán szükség van.
Az adatok kezelésének magas szintje azt jelenti, hogy az adatbázis-kezelő úgy működik (működhet), hogy a
felhasználó anélkül tudja előírni a teendőket, hogy az adatbázis-kezelő algoritmusairól vagy az adatok (fizikai) tárolási elvéről ismeretei lennének.
A továbbiakban megvizsgáljuk, hogy melyek a különböző adatbázis-kezelők fontosabb közös vonásai.

1.1. A programozó és a felhasználó kapcsolata az adatbázis-kezelő rendszerrel
Az 1.1. ábra egy DBMS általános felépítését és környezetét mutatja be.
A „klasszikus” adatbázis-kezelő rendszerek használatának alapvetően két fázisa különül el. Először meg kell
határozni az adatok majdani tárolásának logikai rendjét: ez az adatbázis (fogalmi) vázának, vagy más szóval
sémájának vagy struktúrájának megteremtését jelenti (1. fázis). Ennek az adatai (mint ún. technikai
metaadatok) az adatbázisnak egy különösen védett részében kerülnek tárolásra, hiszen az elvesztésük/sérülésük a teljes adatbázis tartalmát hozzáférhetetlenné teszi. Csak ezután van lehetőség az adatbázist
adatok tárolására használatba venni, adatokkal feltölteni, majd az adatokat különböző szempontok szerint
visszakeresni (2. fázis). Ez utóbbi történhet úgy, hogy egy (ké

«« Előző oldal Következő oldal »»