4. semantiline koostoime ja andmed

Semantiline koostoime on oskus vahetada andmeid selliselt, et erinevad osapooled mõistavad vahetatud informatsiooni tähendust ühtemoodi ning oskavad seda korrektselt taaskasutada. Semantiline koostoime on seega üheks olulisemaks riigiülest andmete leitavust ja taaskasutatavust tagavaks põhimõtteks. 

4.1 Andmehalduse juhised

Semantilise koostoime aluseks on asutuste andmehalduse strateegiate ja tegevuste ühtlustamine. Eestis on koostatud juhised kolme peamise tegevuse ühtlustamiseks:

  • andmehalduse korraldamine (andmehalduse raamistik), 
  • andmekvaliteedi haldamine (andmekvaliteedi juhis) ning 
  • andmekirjelduste (metaandmete) koostamine, haldamine ja avalikustamine (andmekirjelduse juhis).

Viide juhistele: https://www.kratid.ee/andmehalduse-juhised

4.1.2 Andmehalduse raamistik

Andmehalduse raamistik annab ülevaate asutuse andmehalduse rollidest ja tegevustest. Raamistikku on soovitatav kasutada juhisena asutuse andmehalduse korralduse loomisel, samuti regulaarselt andmehalduse küpsuse hindamisel ning järgmiste andmehalduse korraldamist parendavate tegevuste planeerimisel. 

4.1.3 Andmekirjelduse juhis

Andmekirjelduse juhis selgitab andmete leitavust toetava kirjeldamise põhimõtteid ning andmete kirjeldamisega kaasnevate rollide ja tegevuste sisu. 

4.1.4 Andmekvaliteedi juhis

Andmekvaliteedi juhis kirjeldab andmekvaliteedi haldamise põhimõtteid ja kriteeriume ning annab soovitusi andmekvaliteedi reeglite seadmise ja andmekvaliteedi mõõtmise kohta.

Riigi infosüsteemi kuuluvate andmekogude vastutavad töötlejad peavad juhistes esitatud nõuded juurutama hiljemalt 31.12.2023 (TKTA, § 161 lg 1 ja § 18 lg 91). 

Juhised on täitmiseks soovituslikud (TKTA määruse muudatuse seletuskiri). Kehtivad nõuded andmekirjeldusele asuvad RIHA määruses.” ja “Protsess on andmekogu vastava töötleja valida ja kujundada. Eelnõu seletuskirjast: "Asutustele on teadlikult jäetud vabad käed vastavate protsesside valiku osas."

Millega tuleks arvestada?

4.1.5. Andmekirjelduse standard

Andmete ühese mõistetavuse ja taaskasutatavuse tagavad kvaliteetsed metaandmed ehk andmekirjeldused. Eestis on andmekirjelduste ühtsuse tagamiseks välja töötatud andmekirjelduse standard (https://www.kratid.ee/andmehalduse-juhised), mis omakorda põhineb olulises osas DCAT Euroopa rakendusprofiilil (DCAT-AP, https://joinup.ec.europa.eu/collection/semantic-interoperability-community-semic/solution/dcat-application-profile-data-portals-europe).  

Andmekirjelduse standard esitab andmekirjelduse elementide täpse loetelu ja semantika. Andmekirjelduse standardi järgimine on kohustuslik andmekirjelduste edastamiseks andmete teabeväravasse [viide alla], samas on selleks võimalik kasutada ka riigi poolt keskselt pakutavat RIHAKEse rakendust, mis järgib standardit täies mahus. 

Millega tuleks arvestada?

https://www.kratid.ee/andmehalduse-juhised

https://www.kratid.ee/andmehalduse-juhised

4.2. Semantilise koostoime platvormid ja töövahendid

Semantilise koostoime tagamine tähendab praktikas riigi andmete ülevaatust, kirjeldamist ja avaldamist. Selle toetamiseks on mitmeid töövahendeid ja platvorme, mille kasutusele võtmine aitab ka 4.1 punktis välja toodud ootustele vastata.

4.2.1. Andmete teabevärav

Märkus: 2022. aastal on riigis kasutusel osaliselt dubleerivad infosüsteemid RIHA (www.riha.ee) ja avaandmete teabevärav (avaandmed.eesti.ee). Selline killustatud vaade riigis käesolevatest andmetest takistab andmemajanduse hoogustumist ja andmete taaskasutust ning toob kaasa märkimisväärse halduskoormuse. Kasutajate ootus on saada terviklik ülevaade olemasolevatest andmetest. 2023. aastaks on ootus viia www.riha.ee ja avaandmed.eesti.ee kokku ühtseks andmete teabeväravaks andmed.eesti.ee. 

Andmete ja nende kirjelduste avalikustamine võimaldab avalikul ja erasektoril, teadusasutustel, tudengitel, vabaühendustel, kodanikel ja teistel huvilistel leida ja kasutada olemasolevaid andmeid ilma, et nad peaksid neid andmeid ise koguma. See omakorda loob uusi võimalusi andmete rakendamiseks näiteks olemasolevate teenuste täiendamiseks või uute andmepõhiste teenuste loomiseks. Kui andmete taaskasutus suureneb, kasvab ka nendest loodav väärtus.

Eestis toimub riigi andmete ja andmekirjelduste avalikustamine Andmete teabeväravas.  Teabevärava eesmärgiks on anda igaühele terviklik ülevaade riigi käes olevatest andmetest ja võimalustest nende tarbimiseks. Lisaks võimaldab andmete teabevärav visualiseerida avaandmeid, toetades andmete väärindamist. 

Vastavalt avaliku teabe seadusele peavad masinloetaval kujul avaandmed olema juurdepääsetavad teabevärava kaudu. Lisaks on kava muuta Riigi infosüsteemi haldussüsteemi määrust ja avaliku teabe seadust ja sätestada kohustus andmete teabeväravas avalikustada riigi infosüsteemi kuuluvate andmekogude kirjeldused ja viisid andmete tarbimiseks. 

Vaata lisa: andmed.eesti.ee (tulevikus)

Millega tuleks arvestada?

4.2.2. EKILEX

Täna on Eesti keele sõnastikud ja terminibaasid teenustena killustatud, lõppkasutaja jaoks on paljudest baasidest otsingute tegemine aeganõudev ja tülikas. Kasutajad tahavad ühte keskset sõnastikuteenust, aga veebisõnastikud (ca 100 tk) on teenusena killustatud, sh EKI sõnastikes (ca 40 tk) tehakse aastas ca 6,5 miljonit päringut. Erialakeele küsimustele vastamise protsess ja ka terminikomisjonide töö käib meilitsi, telefonitsi, paberil, tabelites ja tekstidokumentides ning on ebaefektiivne. 

Ekilex on sõnastikusüsteem, mille andmemudelis esimesena maailmas on ühendatud sõnapõhised (üldkeele sõnastikud) ja mõistepõhised (oskussõnastikud), mis parandab erineva struktuuriga andmestike kooskõla ja loob edaspidi võimalused keskse sõnakogu loomiseks, mis annab infot kõigi eesti keele üld- ja oskussõnade kohta. See omakorda võimaldab kuvada kasutajale leksikaalseid andmeid mugavalt ja kompaktselt ühe teenuse kaudu ühes brauseriaknas. Igal riigiasutusel on võimalik oma valdkonna terminid mugavalt Ekilexi lisada ning seeläbi need avalikkusele nähtavaks teha. Tulevikus saab Ekilexi lisatud termineid mugavalt kasutada ka Tõlkevärava kaudu tekste tõlkides, mis parandab tõlgete arusaadavust ja terminoloogilist ühtsust.

EKILEXi eesmärk on seega muuta sõnastikud masin- ja inimmõistevalt ja keskselt veebiteenusena kasutatavaks ning parandada seeläbi nende kasutamist. Ekilex on avatud lähtekoodiga, tal on olemas API nii andmete lugemiseks kui ka kirjutamiseks. Lisaks võimaldab EKILEX erialakeele küsimustele vastamist ja terminikomisjonide tööd muuta operatiivsemaks ja mugavamaks.

Vaata lisa: https://ekilex.ee/

Millega tuleks arvestada?

4.2.3. Klassifikaatorite süsteem

Riigiüleselt kokkulepitud klassifikaatorite (ka nomenklatuur, koodiloend) kasutamine aitab oluliselt kaasa nii andmete kvaliteedile, ühesele mõistetavusele kui ka taaskasutusele. Ühtseid klassifikaatoreid rakendavate andmehulkade analüüs on oluliselt lihtsam, oluliselt väheneb andmete puhastamisele ja töötlemisele kuluv aeg ning ressursivajadus.

Klassifikaatorite süsteem on klassifikaatorite haldamise ja kasutamise ühtsete põhimõtete kogum, mis koosneb klassifikaatoritele esitatavatest nõuetest, klassifikaatoritest,  klassifikaatorite haldajatest, klassifikaatorite kasutajatest ja klassifikaatorite haldamise infosüsteemidest. Klassifikaatorite haldamise peamised nõuded on toodud klassifikaatorite süsteemi määruses.

Semantilise koostoime tagamiseks on andmestike eest vastutajatel kohustus kasutada andmetes võimalikult suures mahus riigiüleselt kokku lepitud, selge semantikaga termineid sisaldavaid ning terminite koodidega varustatud klassifikaatoreid. Kehtiva Vabariigi Valitsuse määruse järgi on klassifikaatorite kasutamise kohustus on seotud RIHAs registreeritud klassifikaatoritega  Eesti kontekstis olulisemaid klassifikaatoreid haldab Statistikaamet klassifikaatorite portaalis

Millega tuleks arvestada?

4.2.4. Aadressandmete süsteem ADS

Aadress kirjeldab ja määrab objekti asukoha geograafilises ruumis. ADS-i ülesanne on tagada aadresside ühetaoline määramine ja kasutamine. Oluline on aadresside kvaliteet - aadressid peavad vastama ühtsetele reeglitele. Korrektsed aadressid aitavad näiteks operatiivteenistustel abivajajad kiiresti üles leida ning postiteenistustel saadetised kohale toimetada.

Kõiki aadressiandmeid hallatakse aadressiandmete süsteemis (ADS). Aadressiandmete süsteem on andmekogude pidamist kindlustav süsteem, mille asutamise ja pidamise aluseks on ruumiandmete seadus ja ADS-i määrus. ADS-is kogutakse ja töödeldakse aadressiandmeid. Lisaks ametlikele aadressiandmetele on ADS-is ka posti sihtnumbrid (määrab Omniva) ja mitteametlikud aadresside ning aadressiobektidega seotud andmed, sh mitteametlikud asumid, linnaosad ja kvartalid ning üldkasutatavad hoonete nimetused (näiteks Ülemiste keskus, Linnahall jne).

Kõik riigi infosüsteemid peavad kasutama samadele reeglitele vastavaid aadressandmeid ning selle tagamiseks on võimalik kasutada üle X-tee kätte saadavaid ADSi infosüsteemi pakutavaid aadressiteenuseid. Lisaks X-tee teenusele pakutakse lihtsalt integreeritavat moodulit in-ADS.

Vaata lisa: https://maaamet.ee/ruumiandmed-ja-kaardid/aadressid-ja-kohanimed/aadressiandmete-kasiraamat

Millega tuleks arvestada?

4.2.5. Andmekirjelduse koostamise ja haldamise töövahend RIHAKE

RIHAKE on asutusse paigaldatav andmehalduse komponent, mis võimaldab andmekirjelduse standardi kohaselt kirjeldada asutuse andmestikke, kirjeldada andmestikes kasutatavaid klassifikaatoreid ja loendeid, koostada andme- ja ärisõnastikke, edastada andmekirjeldusi andmete teabeväravasse. Seega RIHAKE toetab andmete haldamist asutuses ja võimaldab seeläbi parandada andmete taaskasutust ja leitavust.

Asutus loob RIHAKEses andmestiku standardikohase üldise kirjelduse, skaneerib relatsioonilise andmebaasina hallatava andmestiku füüsilist mudelit, seeläbi tuvastatakse tabelite ja veergude (andmeväljade) olemasolevad metaandmed ning rikastakse neid sisulise tähendusega ehk seotakse asutuses kasutatavate mõistetega.
 

Millega tuleks arvestada?