Boštjan Resinovič
Dandanes temelji večina podatkovnih baz na relacijskem podatkovnem modelu, ki je še zmeraj de facto standard kljub vse močnejšemu uveljavljanju objektnih baz. Zgodovinsko gledano, lahko v skladu s potrebami in značilnostmi, ki se kažejo v različnih razvojnih fazah praktične uporabe relacijskih baz, določimo tri glavna zgodovinska obdobja v njihovi evoluciji od povojev do sedanjih razsežnosti.
Človeštvo si je od nekdaj prizadevalo ohraniti svoje znanje in je v ta namen razvilo različne načine hranjenja podatkov. S pojavom računalništva se je pokazal nov, izredno učinkovit način, ki pa ga je bilo potrebno šele primerno izkoristiti; z razvojem pomnilniških medijev, je postajal računalnik vse bolj idealno orodje in shramba za delo s podatki. Tako kot na drugih področjih dela z računalnikom so se zahteve tudi tu vse bolj povečevale, vedno več je bilo človeških faktorjev, ki jih je bilo za spodoben informacijski sistem potrebno upoštevati, spremenila so se odločitvena pravila pri načrtovanju povpraševanj po podatkovni bazi.
Zgodovinsko gledano, lahko določimo tri stopnje v dosedanjem razvoju relacijskih podatkovnih baz :
Obdobje paketne obdelave podatkov
Prvo obdobje sega v konec 70-ih in začetek 80-ih let. Obdelava podatkov je takrat potekala v oddelkih AOP in je imela naslednje karakteristike:
Prvi relacijski sistem za upravljanje podatkovnih baz (SUPB), System R, so razvili v letih 1974-79 v IBM-ovem raziskovalnem laboratoriju v San Joseju. Uporabniku so zagotovili dostop do podatkov z novim jezikom SQL (Structured Query Language).
Čeprav je omogočal tudi interaktivni način delovanja, je bilo v praksi daleč na prvem mestu paketno procesiranje. Zahteve po podatkih so zbrali v oddelku AOP in jih v paketu poslali v obdelavo računalniku. Tak pristop omogoča bolj učinkovito izrabo strojne opreme v smislu izbire časa za začetek procesiranja, kajti operaterji lahko izberejo časovni interval, v katerem je centralna procesna enota manj obremenjena in celoten paket se relativno hitro izvede. Dejstvo pa je, da je na tak interval pogosto potrebno čakati po več ur.
Dokler je bila edina zahteva le dostop do katerega koli podatka, ne pa tudi čim krajši čas od postavitve vprašanja do odgovora, je bil tak pristop povsem ustrezen, kajti cena strojne opreme in procesorskega časa je bila visoka in paketno procesiranje je predstavljalo optimalen način izrabe računalnika. Tudi končni uporabniki so bili zadovoljni, saj so do željenih podatkov prišli hitreje, kot bi prišli peš.
Človeški faktor je bil v tem obdobju zanemarljiv. Strukturo baze podatkov in vse poizvedbe je na podlagi direktiv uporabnikov zasnoval programer iz oddelka AOP, pravega sodelovanja uporabnikov in programerja pa od tu dalje ni bilo več. Kako je programer formuliral povpraševanja in v kakšni obliki so bili njihovi rezultati podani uporabnikom ni bilo pomembno.
Zato lahko takšna pravila povpraševanja označimo kot apriorna. Ker odzivni čas pri paketnem procesiranju ne igra prave vloge, je način, kako je poizvedba napisana manj pomemben. Izboljšava povpraševanj ni prišla v poštev, prva verzija je ostala tudi zadnja verzija.
Obdobje interaktivne, on line obdelave podatkov
Nemalo kje pa se je pokazalo, da rabijo uporabniki podatke zelo hitro, lahko celo rečemo, da je to osnovna zahteva modernih informacijskih sistemov. Zato cenejše paketno procesiranje ne zadostuje več, saj končni uporabnik nima časa čakati, da mu bodo v oddelku AOP izbrali trenutek, ko bo lahko zahteval izvršitev svoje transakcije. Na razpolago mora imeti svoj terminal ali osebni računalnik, ki mu omogoča, da jo izvede v trenutku, ko se pokaže potreba po podatkih; preiti je potrebno na interaktivno procesiranje.
Za to obdobje, ki traja še danes, veljajo drugačne značilnosti kot za obdobje paketnega procesiranja. Te značilnosti so :
Dodatna zahteva po dobrem odzivnem času je sprožila vrsto faktorjev vrednih upoštevanja. Večina rezultatov mora biti na ekranu čimprej, ni pa to nujno za vse - že uporabnik sam se namreč zaveda, da ne more do vseh odgovorov enako hitro, zato so daljši odzivni časi pri kompleksnih posegih v bazo podatkov do neke mere sprejemljivi. Večina povpraševanj naj bi izpisala rezultat v največ nekaj sekundah, pri daljših časih je uporabnika potrebno nekako pomiriti, mu dati vedeti, da računalnik pridno išče in da se program ni "zaciklal".
Očitno je torej, da je potrebno upoštevati človeške faktorje uporabnikov. Uporabniški vmesniki morajo biti prilagojeni njim in ne enostavnejšemu programiranju, informacijski sistem mora izponjevati vse zahteve, izpisi morajo biti pregledni, delo čim bolj enostavno.
Za izpolnitev vseh teh in še množice drugih zahtev mora v procesu snovanja potekati kakovostna komunikacija med razvijalci sistema in njegovimi koristniki. Od srede 80-ih let je v ta namen znan niz metod s skupnim imenom JAD (Joint Application Development). JAD je tehnika, ki sloni na sestankih končnih uporabnikov in specialistov, ki uporabnike anketirajo in intervjuvajo v zvezi z njihovim podjetjem; načinom dela v njem; zakonitostmi v poslovanju; podatki in procedurami, potrebnimi za nemoteno delo; zahtevami glede uporabniškega vmesnika in drugim kar je važno za dobro delovanje informacijskega sistema. Specialisti zbrane informacije dokumentirajo s pomočjo tehnik strukturnega in podatkovnega modeliranja in jih tako formalizirajo. Sestanki potekajo v vseh fazah življenskega cikla sistema. Njihov namen ni samo spoznati poslovanje podjetja, ampak tudi relevantne človeške faktorje uporabnikov, ki jih je koristno upoštevati.
OBDOBJE PAKETNE OBDOBJE OBDOBJE OBDELAVE PODATKOV INTER-AKTIVNE DISTRIBUIRANIH BAZ OBDELAVE PODATKOV PODATKOV IN ODPRTIH SISTEMOV važna edinole pojavi se dodatna pojavi se dodatna ZAHTEVE osnovna zahteva po zahteva, da mora zahteva po dostopu do biti odzivni čas razumljivosti in katerega koli čim krajsi primernosti podatka semantike podatkovnih baz človeski faktorji upoštevati je mešajo se človeski ČLOVESKI so zanemarljivi potrebno človeske faktorji končnih FAKTORJI faktorje končnih uporabnikov in uporabnikov dodatni vseh snovalcev apriorna aposteriorna adaptivna ODLOČITVENA optimizacija optimizacija PRAVILA povpraševanj povpraševanj in strukture distribuirane podatkovne baze
Še bolj detaljno se s slednjimi ukvarjajo nekatere druge tehnike, ki upoštevajo splošne psihološke značilnosti človeka in si v skladu z njimi in zbranimi informacijami prizadevajo doseči optimalno interakcijo človeka z računalnikom. Ker je to širok problem, ki presega domeno računalništva, morajo te tehnike slediti tudi dognanjem ved kot so : umetna inteligenca, filozofija, sociologija, antropologija, oblikovalstvo, ergonomija, kognitivna psihologija in druge.
Spremenila so se tudi odločitvena pravila pri pisanju povpraševalnih stavkov. Ekipa, ki razvija informacijski sistem, zbere od uporabnikov vse zahteve po podatkih in na njihovi podlagi pripravijo programerji poizvedbe. Do tu je podobnost načinu dela v obdobju paketnega procesiranja velika. Ker pa je pomembno doseči kar se da kratek odzivni čas, se morajo programerji potruditi, da napišejo dobre poizvedbe in prva varianta je le redko dovolj dobra, potrebne so variacije in spremembe. Konec je z apriornostjo, na podlagi ugotovljenih pomankljivosti je treba poizvedbe optimizirati, odločitvena pravila pri izbiri končne verzije poizvedb postanejo aposteriorna.
Obdobje distribuiranih baz podatkov in odprtih sistemov
Z novimi potrebami in hkratnimi novimi dosežki v računalniški tehnologiji so izolirani eno ali večuporabniški sistemi postali pretesni. Prihaja čas odprtih sistemov, distribuiranega hranjenja podatkov in procesiranja, čas client-server sistemov.
Čeprav sistemi, ki temelje na teh načelih niso več nobena redkost, še zmeraj ni realno trditi, da smo že popolnoma v novem obdobju uporabe relacijskih baz. Res pa je, da so tendence jasno izražene in nekatere značilnosti novega obdobja so že vidne :
Osnovna značilnost distribuiranih podatkovnih baz je hranjenje podatkov ene same baze na več računalnikih. Podatki, ki jih tipično uporabljajo le na enem računalniku so shranjeni tam ostali pa v centraliziranem delu podatkovne baze. Še zmeraj so lahko dostopni vsi, ne glede na to, kje se nahajajo in s katerega računalnika pride zahteva po njih. To je možno doseči s podvajanjem lokalnih podatkov tudi na centralnem računalniku ali pa z deklariranjem vsake lokalne baze kot oddaljene (remote) baze.
V fazi snovanja informacijskega sistema in same strukture podatkovne baze je nujno s formaliziranimi metodami doseči primernost in smiselnost porazdelitve. Poseben problem predstavlja pri tem semantika baze, v zvezi s katero kaže zagotoviti standardizacijo pri poimenovanju tabel in atributov oziroma poenotiti načela posameznih snovalcev ter tako odpraviti nekonsistentnosti in nejasnosti. V tem obdobju torej nastopi nov aspekt, ki ga je potrebno upoštevati. Poleg človeških faktorjev uporabnikov postanejo pomembni tudi tisti snovalcev. Prav poznavanje človeških faktorjev vseh snovalcev (in ne samo že prej opisanih faktorjev končnih uporabnikov), njihovo upoštevanje in usklajevanje, je najboljša pot do dobre distribuirane podatkovne baze.
Aposteriornost odločitvenih pravil za povpraševalne stavke se razširi na adaptivnost, ki je tokrat nujna ne le pri snovanju posegov v bazo ampak celo pri določanju njene strukture. Kot za aposteriorna odločitvena pravila je tudi za adaptivna značilna povratna informacija. Razlika je v tem, da na njeni podlagi formiramo celo množico alternativ, ki jih analiziramo hkrati. Kompleksnost takih problemov večkrat presega človeške sposobnosti, zato mora biti analiza računalniško podprta z orodji za podporo odločanju.
Brez dvoma so relacijske baze prehodile že dolgo pot od svojih začetnih stadijev. Danes so tako kompleksne, da zahtevajo pri načrtovanju računalniško podporo in celo ekipe strokovnjakov različnih strok, če naj nudijo uporabniku vse, česar so sposobne. Prav interdisciplinarnost pa je tisto k čemur se računalniška stroka, ne le na področju podatkov marveč tudi v svojih drugih območjih, vse bolj intenzivno nagiba in tako izgublja lažno, na aktualni stopnji razvoja nemogočo samozadostnost, in prehaja iz zgolj tehnične vede v drugačne sfere.
Nazaj na prejšnjo stran