Venslaðir gagnagrunnar

Ted Codd og vensla-algebra

Dr. E. F. Codd (f. 1923 d. 2003) var breskur stærðfræðingur sem vann að rannsóknum hjá IBM mest allan sinn starfsferil. Á sjöunda áratugnum hafði hann unnið allnokkuð við rannsóknir á gagna­grunnum og gagna­grunns notkun þess tíma. Um 1970 birti hann grein um venslaða gagnagrunna sem hefur gjörbylt allri hugsun varðandi gagnagrunns vinnslu síðan. Hann hafði komist að þeirri niðurstöðu að gagnagrunnar þess tíma og vinnsla með þau gögn sem þeir geymdu leiddi tíðum til skekkja (e. Errors) og umfremdar[1] (e. Redundancy). Árið 1953 flutti hann búferlum frá Bandaríkjunum til Kanada og bjó þar í um tíu ár, í mótmælum við baráttu McCarthy öldunga­deildar­þingmanns gegn Kommúnisma.


Ted Codd
birt með leyfi IBM

Greinina nefndi hann „A Relational Model of Data for Large Shared Data Banks“ (í. Venslað gagnalíkan fyrir stóra samnýtta gagnabanka). Þar kynnti hann til sögunar gagnalíkan og aðferðir til gagnageymslu sem átti að leysa öll þau helstu vandamál sem á þeim tíma tröllreið allri gagnagrunns vinnslu. Grein hans má finna á slóðinni http://www.acm.org/classics/nov95/toc.html.

Á þessum tíma var mikið um Hierarchical Databases og Networked Databases. Umfjöllun um þau gagnalíkön er utan bókarsviðsins en vert væri að benda á að fletta hugtökunum upp í http://www.hyperdictionary.com/dictionary/ eða í http://computing-dictionary.thefreedictionary.com/.

Árið 1974 hóf IBM þróun á kerfi sem nefndist System/R sem átti að sanna kenningu Codds um venslaða gagnagrunna. Þessi þróun leiddi til fyrstu útgáfu á fyrirspurnamáli sem notað var til að vinna með gögn í gagnagrunnunum sem System/R vann á. Fyrirspurna málið var nefnt SEQUEL sem er skammstöfun á „Structured English Query Language.“ Síðar var málið endurnefnt sem „Structured Query Language“ (skammstafað sem SQL) af lagalegum ástæðum og síðar var það gert að opinberum staðli á vegum American National Standards Institute (ANSI). Árið 1978 voru útgáfur af System/R í notkun hjá ýmsum viðskiptavinum IBM. Árið 1979 var verkefnið lagt niður með þeirri niðurstöðu að venslaðir gagnagrunnar væru vænleg nálgun á gagnagrunns vinnslu.

Það var ekki fyrr en 13 árum eftir að grein Codds kom fyrst út að IBM tók þá ákvörðun að framleiða gagnasafns-umsjónarkerfi sem byggði á kenningum hans og nefndi DB2. Þá hafði Lawrence „Larry“ J. Ellison þegar framleitt Oracle gagnasafns-umsjónarkerfi sitt frá 1977 og öðlast forskot sem hann heldur enn. Larry Ellison hafði í fyrstu ætlað sínu kerfi að vera samhæft System/R kerfinu en IBM leyfði fremur tak­markaðan aðgang að System/R sem leiddi til þess að Ellison þróaði sitt kerfi fullvaxið.

Gagnasafns-umsjónarkerfi á þessum árum þóttu aðeins eiga erindi í stærri tölvukerfum og vert er að hafa í huga að þegar IBM hóf þróun á „IBM PC“samhæfðu einkatölvunni 1979-80 var almennt talið að enginn myndi hagnast á slíku ævintýri. Í dag 25 árum síðar má finna gagnasafns-umsjónarkerfi í einhverri mynd á allflestum tölvum og í notkun alls staðar þar sem tölvur eru notaðar í einhverri mynd.

Þegar leitað er að efni á Vefnum með leitarvél er flett upp í gagnagrunni. Þegar debet korti er rennt í gegnum posavél er tengst við gagnagrunn. Þegar pantaður er flugmiði, bókað hótelherbergi eða vörur pantaðar eru höfð samskipti við gagnagrunna.


[1] Umfremd, á ensku „Redundancy,“ er þegar gögnum er ofaukið.

 

This entry was posted in MySQL bók and tagged . Bookmark the permalink.

Comments are closed.