User:Veikoberendsen/sandbox

Mõiste
Mõistel andmed ei ole olemas ühte ühtset määratlust. Mõiste on kasutusel eri valdkondades, kus termini tähendusväli on erinev. Sõna andmed on kasutusel tavakeeles, sageli sünonüümina terminile informatsioon.

Põhilised mõiste kasutusvaldkonnad lisaks tavakeelele on:
 * teadus üldiselt, sh matemaatika ja eri teadusharud sh eriti;
 * infotehnoloogia ning informaatika oma valdkondadega nagu bioinformaatika, geoinformaatika jt
 * statistika ja sotsiaalteadused; kujunemas on andmeteadus;
 * äri ja majandustegevus sh nii tootmine kui ka teenused;
 * avalik haldus ja õigus, milles peamisteks mõisteteks on isikuandmed ja andmekaitse.

Kõige ulatuslikumalt on kasutusel filosoof Luciano Floridi selgitus aastast 2008, mis seob ühelt poolt andmed ja informatsiooni ning teiselt poolt mõiste kasutuse sotsiaalteadustes (sh statistikas) ja infotehnoloogias esitades terminit kui filosoofilist kategooriat. L. Floridi seletuse kohaselt on terminil andmed lai kasutus nii tehnilise terminina kui tavakeeles, kuid eristada võib nelja põhiinterpretatsiooni. Need on:
 * 1) tunnetusteoreetiline ehk epistemioloogiline interpretatsioon, mis on suunatud teadmistele (knowledge-oriented), mille kohaselt on andmed faktid;
 * 2) informatsioonilise käsitluse kohaselt on andmed informatsioon;
 * 3) infotehnoloogiliselt (arvutiteaduses) on andmed binaarelemendid (bitid);
 * 4) diaphooriline s.o eristav määratlus. L. Floridi peab seda kõige selgitusjõulisemaks ning selle kohaselt on andmete määratlus rakendatav kolmel eristuval tasandil, mis on:
 * 5) diaphora de re - selle all peab Floridi silmas andmeid kui midagi, mis on reaalselt olemas, aga see võib olla ka tunnetuseelses seisundis;
 * 6) diaphora de signo - andmed, mis on kuidagi eristuvad mingi märgina (Floridi näide on nagu + ja - märk patareil)
 * 7) diaphora de dicto - eristuv tähistus (Floridi näide on nagu tähed A ja B tähestikus)

Mõistet andmed kasutatakse sageli terminoloogiliselt täpsustatuna. Näiteks:
 * isikuandmed õiguses, infotehnoloogias jm;
 * aadressiandmed geograafias ja halduses;
 * ilmumisandmed raamatukogunduses;
 * andmebaasid infotehnoloogias või andmekogud õiguses;
 * suurandmed infotehnoloogias ja majanduses
 * jne.

Etümoloogia
Termin andmed on eesti keeles kasutusel 20. saj algusest ja termin on neologism. Arvatavasti lõi termini Johan Voldemar Veski ning see on seotud üldise 19. saj lõpul 20. saj algul toimunud matemaatilise terminoloogia korrastamisega. Eestikeelne termin on loodud saksakeelse Angaben ja venekeelse данные eeskujul. Termini loomisel seost ingliskeelse või ladinakeelse terminiga data või datum ei ole. Termin andmed on tuletatud vana-kreeka keelsest geomeetria terminist dedomena (δεδομένα), mis tähendas "antud" ja mille võttis kasutusele Eukleides.

Etsüklopeediates
Eestikeelsetes entsüklopeediates on termin esmakordselt ENE 2-s (1985) ja seda kitsalt ühe eriala - küberneetika - tähenduses.
 * "andmed - küb edastamiseks ja töötlemiseks sobivalt (enamasti arvude ja tekstina) esitatud faktid. A-d salvestatakse mingile *a-mekandjale, a-te omavahelist seost väljendatakse *a-mestruktuuriga"

Sõnaraamatutes
Eesti keele Õigekeelsussõnaraamatus (1976 ja 1980) on järgmine kanne:
 * andja, andma, annan; andmed mitm.; andmeedastus, andmestik; andmik, -miku, -mikku maj. andmete leht (ведомость); andmine, -se.

Standardites
Andmed on määratletud mitmetes eesti ja rahvusvahelistes standardites.

Infotehnoloogia standardis EVS-ISO/IEC 2382-1:1993 "Infotehnoloogia. Sõnastik" on järgmine määratlus:


 * Informatsiooni (teabe) taastõlgendatav esitus formaliseeritud kujul, mis sobib edastuseks, tõlgenduseks või töötluseks.

Infoteaduse standardis EVS-ISO 5127:2004 "Informatsioon ja dokumentatsioon. Sõnastik" (lähtub standardi EVS-ISO 1087-2:2002 "Terminoloogiatöö. Sõnastik. Osa 1: Teooria ja rakendus" määratlusest) on järgmine määratlus:


 * informatsiooni esitus formaliseeritud kujul, mis sobib kommunikatsiooniks, tõlgenduseks ja töötluseks.

Tähendus
Mõiste andmed on infohalduses seotud mõistega informatsioon, teadmus ja tarkus. Sellist seost nimetatakse tarkuse püramiidiks ([|DIKW]). Selles on andmed nagu toormaterjal, millest tunnetuse ja kasutamise kaudu on võimalik teadmistepõhine, ratsionaalne, eesmärgipärane käitumine. Rangelt võttes ongi andmed iseenesest tähenduseta ning andmete tähendus ilmneb ainult nende tõlgendamisel informatsioonina (teabena).

Teisalt on oluline tähele panna, et andmeid ja informatsiooni kasutatakse eriti tavakeeles sünonüümidena. Ranget vahet ei tehta neil aga ka ei avalikus halduses, äris ega teaduses. Eesti ja Euroopa Liidu õigusaktides kasutatakse terminit andmed rangelt võttes tähenduses informatsioon, kuid praktiliselt võib õigusaktides (näiteks isikuandmete kaitse seadus või erinevad andmekogude põhimäärused) pidada andmeid ja informatsiooni sünonüümideks.

Mõiste all andmed mõeldakse kaasaajal üldiselt digitaalseid andmeid, mis on n-ö arvutites, kuid see on kitsendav. Andmeid "sisaldab" nii füüsiline kui bioloogiline aines (samuti energia). Varasemal ajal oli palju tehniliselt loodud andmeid salvestatud analoogkujule. Infotehnoloogiliste vahenditega on informatsioon kiiresti muudetav andmeteks ja vastupidi.

Andmeid koguvad ja edastavad kaasajal sageli masinad ja seadmed.

Ettevõtlus
Ettevõtluses on alati andmeid ja andmed on ettevõtte infovara. Olenevalt ettevõtte põhitegevusest hallatakse kõige enam vastava valdkonna andmeid. Tootmisettevõtetel on olulisel kohal tarneahela (sh klientide) ja tootmise andmed, millest osa käsitletakse kui põhiandmeid (master data). Andmemahukates ettevõtetes on äriliselt väga oluline kasutusel olevate andmete andmekvaliteet. Teenusettevõttel on põhiliseks kliendiandmed. Ettevõtted kasutavad andmeid turunduseks ning teevad andmete põhjal ärianalüüsi (Business intelligence) teenuste ja toodetega äri tegemiseks.

Tugifunktsioonide täitmiseks on ettevõtetel juhtimisandmed, personaliandmed, raamatupidamise andmed (finantsjuhtimise andmed), haldusandmed (inventuur, varahaldus) ning andmed dokumentatsiooni ja muude infovarade kohta, tavaliselt metaandmete kujul.

Ettevõtete andmehalduse jaoks kasutatakse mitmesuguseid äriinfosüsteeme. Paremaks äriinfo kasutamiseks loovad ettevõtted andmeladusid.

Teadus
Teaduses on sõltuvalt teadusharust väga erinevat laadi andmeid. Üldiselt saab eristada vaatlusandmeid, eksperimentide andmeid ja analüüsi andmeid. Enamus andmeid töödeldakse teaduses matemaatiliste (statistiliste) meetoditega.

Kaasajal toimub arutelu selle üle, kas teadusandmed, mis on loodud avalikke ressursse kasutades, peaks olema avaandmed (Open data) ja kõigile kättesaadavad või on nendele juurdepääsu piiramine põhjendatud. Eri huvirühmade nägemus sellest on erinev. Eriti meditsiiniuuringutes on andmeid, mida nimetatakse delikaatseteks isikuandmeteks ja millele juurdepääs piiratud.

Avalik haldus
Avalikus halduses asendavad kaasajal andmed paljudel juhtudel dokumente ja andmeid hallatakse andmebaasides, mida õiguslikult nimetatakse andmekogudeks. Eestis nimetatakse selliseid andmekogusid sageli riiklikeks registriteks.

Avalik haldus kogub, töötleb ja hoiab andmeid kõigis oma funktsioonides. Andmekogudest ülevaate saamiseks on loodud Riigi Infosüsteemi Haldussüsteem (RIHA). Avaliku sektori andmete avaliku kasutamise üle avaandmetena toimub samuti arutelu. Eestis on isikud kui andmesubjektid on nende isikustatud andmete avaliku kasutamise eest kaitsud ning avalikuks tehakse andmekogudena anonümiseeritud andmed. Avaliku sektori andmetel on väärtus ning nende elukäik (loomisest või saamisest hävitamise või avalikku arhiivi andmiseni) peab olema kontrolli all. Riigid ja mitmed avaliku sektori asutused (ülikoolid, meediaorganisatsioonid, haiglad) on loonud andmete pikaajaliseks säilitamiseks andmearhiivid.

Statistika
Statistikas on siin eraldi välja toodud kui oluline teaduse ja avaliku halduse andmetega tegelev valdkond. Valdkonnas on kasutusel mõiste statistilised andmed. Termin andmed on kasutusel Eesti vabariigi statistika algusest.

Traditsioniliselt eristatakse statistikas küsitlusandmeid, loendusandmeid ja sündmusstatistilisi andmeid. Statistikas tehakse vahet algandmete ja töödeldud andmete vahel. Töötluseks kasutatakse statistilise analüüsi eri meetodeid ning andmeid esitatakse tabelite, graafikute, indeksnäitajate jms kujul. Vahet tehakse samuti individuaalandmete ja agregeeritud andmete vahel.

Infotehnoloogia
Infotehnoloogias on andmetel põhiliselt kaks tähendust. Esiteks tehniline tähendus, kui andmed on binaar- või muul kujul nende edastamiseks, tõlgendamiseks või töötlemiseks ja seda teeb masin (arvuti, tehnosüsteem jms). Need andmed ei ole üldjuhul inimloetavad ja neid nimetatakse masinloetavateks andmeteks. Teiseks informaatika või informatsioonilises tähenduses, kus andmed on kujul tunnus-väärtus (attribute-value) või objekt-seos-subjekt ehk objekt-tunnus-väärus (object–attribute–value) ning siis on andmete semantika arusaadav ka inimesele.

Andmed on kas edastuses (näiteks telefonikõne) või andmekandjal. Andmekandjatel on andmed üldiselt salvestatud failisüsteemi failina. Üheks faili tüübiks on andmebaasi fail. Kõige levinumaks andmebaasi tüübiks on relatsiooniline andmebaas, kus andmed on tabelites, mille vahele on loodud seosed.

Andmebaasides olevaid andmeid nimetatakse struktureeritud andmeteks, mis tähendab seda, et nende andmete tähendus on küllalt hästi teada (tabeli veergude tunnused on kirjeldatud ja seetõttu ridade väärtuste tähendus teada). Selliseid struktureeritud andmeid on kõigist andmetest 10% ja 90% on mitte-struktureeritud andmed, mis on väga erinevat tüüpi failides teksti, jooniste, pitide, heli, video jne kujul).

Infotehnoloogia mõõdab andmemahtu. Andmemahtu mõõdetakse bittides ja baitides, mis on täpsemalt öeldes informatsiooni mõõtühikud. Andmemaht ja infohulk on selles tähenduses sünonüümid.

Infotehnoloogias on järjest enam kasutusel mõiste suurandmed (Big data), milleks nimetatakse suurt hulka andmeid, mille tüübid on verieeruvad, mis on muutuses ning mille tunnused ja kvaliteet on mitmekesine, aga mida soovitakse analüüsida, et saada soovitud teavet.

Andmete kohta on infotehnoloogias mitmeid seotud termineid ja mõisteid nagu näiteks:
 * andmekogu
 * andmestruktuur
 * andmebaas
 * andmemudel
 * andmehulk
 * andmeväli
 * andmetüüp

Infohalduses
Infohalduse vaates on põhiliseks tegelemine metaandmetega. Metaandmed on andmed andmete kohta. Eristada võib inforessursi kirjeldamise, leidmise, haldamise ja tehnilisi metaandmeid. Osadel valdkondadel on välja kujunenud metaandmestandardid, millega selles valdkonnas inforessursse kirjeldatakse. Metaandmed on olulised andmete semantika mõistmisel.

Raamatukogud, muuseumid, arhiivid jt mäluasutuses haldavad oma kogusid metaandmetega. Samuti hallatakse metaandmetega dokumente asutustes ja ettevõtetes.

Meedia ja kommunikatsioon
Meedia tooted ja teenused ning kommunikatsiooni sõnumid on digitaaltehnoloogiale ülemineku järel tehniliselt andmete kujul. Nendele andmetele kui loomingule ja meediatoodetele (teostele) rakenduvad autoriõigused. (Autoriõigused võivad rakenduda ka muudele andmetele.)

Isiklik info, sotsiaalmeedia ja massikommunikatsioon ning nendes olevad andmed on järjest enam läbipõimunud. Isikuandmete kasutamist ja kaitset nii meedias kui äris ning meedias ja äris reguleeritakse seadusega.

Olulisel kohal on selles valdkonnas kõsimus, kes on andmete omanik (isik või sotsiaalmeediat omav ettevõte) ning millised on meediaettevõtete andmete teisesed kasutusõigused.

Ajakirjanduses on kujunenud eraldi suund andmeajakirjandus.

Geograafia ja ruumiandmed
Geograafiliste andmetena mõistetakse tavaliselt andmeid, mis on seotud mingi konkreetse geograafilise ruumi osaga. Andmete sidumist ruumiga nimetatakse geokodeerimiseks. Need andmed võivad olla nii eluslooduse kui eluta looduse kohta kui ka inim- ja majandusgeograafia andmed. Sellised on ka haldusüksuste ja aadressiandmed.

Georgaafilisi sh ruumiandmeid töötlevaid infosüsteeme nimetatakse geoinfosüsteemideks (GIS).

Keskkonnaandmed
Keskkonnaandmed on mitmesugused georgaafia, bioloogia, ökoloogia, geoloogia jms seire- ja vaatlusandmed ning nende alusel tehtud analüüsiandmed. Selle rühma alla kuuluvad ka meteroloogia, klimatoloogia, jäätmete, kiirguse, looduskaitselised, maa kasutuse ja keskkonnakorralduslikud andmed.

Bioloogia andmed
Lisaks keskkonnaalastele bioloogilistele andmetele on järjest olulisemad biokeemilised ja geneeetilised andmed nagu DNA.

Välja on kujunenud eraldi teadusvaldkond bioinformaatika.

Meditsiiniandmed
Meditsiiniandmed on üks suuremaid andmete valdkondi ning nende andmete kasutus on piiratud ja neid tuleb nende väärtuse tõttu säilitada pikka aega. Traditsiooniliselt koguti meditsiiniandmed haiguslugudesse, mis olid väikesed raamatukesed. Kaasajal on haiglatel ja arstidel kasutusel infosüsteemid, milles on nii haiguslugu, epikriisid, kui ka uuringute tulemused (sh pildid) digitaalsel kujul.

Meditsiiniandmed on samuti andmed ravimite kohta ja digiretepti andmed, mis on üheks näiteks, kuidas paberdokumentidelt on mindud üle andmepõhisele dokumenteerimisele.

Tehnilised seadmed
Tänapäevased tehnojuhtimissüsteemid (hajusjuhtimissüsteemid - DCS, superviisorsüsteemid - SCADA, protsessijuhtimissüsteemid) loovad, edastavad ja haldavad andmeid, mis on olulised nii äris kui ka avalike teenustena sh eluliste teenustena masinates, seadmetes ja tehnovõrkudes.

Tehniliste seadmete ühendamist võrku ja selle kaudu andmete töötlemist nimetataske asjade internetiks ehk võrkvärk.

Andmete tüübid
Andmetüübid matemaatilis-statistilises vaates on:
 * Mittenumbrilised (kvalitatiivsed) andmed
 * Mittekategoriseeritud
 * Kategoriseeritud (nominaalsed)
 * Numbrilised (kvantitatiivsed) andmed
 * Ordinaalsed
 * Kardinaalsed
 * Intervall
 * Suhe

Vaata lisaks

 * Avaandmed
 * Linkandmed
 * Andmekaitse
 * Värkvõrk
 * Andmekogu
 * Andmehaldus
 * Tabelarvutus
 * Tabel
 * Fail
 * Failisüsteem
 * Andmeanalüüs
 * DNA
 * Põhianmded