2006-07-20

Alapelvek

A téradat infrastruktúra létrehozásához és működtetéséhez szükség van bizonyos alapelvek lefektetésére. Az első, s talán legfontosabb elv, hogy a téradat infrastruktúra valamennyi érdekelt fél együttműködésén alapul. Gondolom, ezt az egyszerű kijelentést felesleges tovább magyarázni. Mindenestre két következtetés azért ide kívánkozik.

  • A téradat infrastruktúrához nem kapcsolódhatnak szerzői jogok. Ez különösen fontos az infrastruktúra létrehozásához és működetéséhez szükséges szabályok és specifikációk kapcsán.
  • Az infrastruktúra működtetéséhez szükséges szervezési feladatok ellátása nem jelenthet előjogokat

(Együttműködés hiányában a jelenlegi helyzet konzerválódik, vagyis nem lesz infrastrutúra. Ebben az esetben minden további diszkurzus - így ez a fórum is - felesleges. Mivel a társszerkesztő feltételezi, hogy ezutóbbi állapot nem következik be, ezért lássuk a többi feltételt is.)

Egy adatkészletet egyszer célszerű összegyűjteni, s többször felhasználni.
Gazdasági szempontból a kijelentés logikája kétségtelen.Szervezési szempontból a munka ott végzendő el ahol szakmai kompetencia, területi áttekintés/hozzáférés és a folyamatos karbantartás szempontjából leghatékonyabban oldható meg a feladat.
Metaadat vetület: pontos dokumentáció nemcsak a specifikációs szempontok szerint, hanem a felhasználhatóság oldaláról is!
Adatspecifikációs oldal: mérlegelni kell a domének (szakadatok) közötti átfedést, esetleg az adatok formális leírását (ontológia). Mindenképpen figyelembe kell venni a többszörös ábrázolás (multiple-representation) és a generalizálás lehetőségeit azonos adatkörön belül. (Ezeket a szakmai kérdéseket feltétlenül meggbeszéljük majd később.)

Az adatokat a gazdaságilag megengedhető legnagyobb felbontásban (méretarány) kell gyűjteni. Az adatok felújítása is nagy felbontásban történik, míg a kis felbontású termékeket le kell vezetni, illetve a változásokat étvezetni. (update propagation)

Robusztus de jure és de facto nemzeti és nemzetközi szabványok használata.
Ez szerencsére nem maradt ki az NTIS viraanyagból. A hazai helyzetet át fogjuk tekinteni később.

Az alapelvek tisztázása igen fontos az adatspecifikációs munka során. Például jó ha van egyezség a szükséges felbontásról / méretarányról. Ennek függvényében határozhatjuk meg az adatmodellek agregációs szintjét.

Kíváncsi vagyok a véleményekre, mennyyire elfogadhatóak a felvázolt alapelvek. Az számomra ismert téradat infrastruktúra kezdeményezéseknél (INSPIRE, DNF, NSDI) is találunk hasonló kitéteket.

2006-07-18

Vágjunk bele! Hogy kerül a csizma (adatspecifikáció) az aztalra (NTIS)?

Mint mindenütt, a téradat infrastruktúra felfogásában is vannak szélsőségek. Az egyik véglet szerint az egész alfája és omegája az adat. Van benne igazság... Adatok nélkül nem fogunk egyetlen térbeli elemzést, helyhez kötött szolgáltatást sem megoldani. De hiába vannak adatok, ha azok az adatgazda polcán (pardon, szerverén és adathordozóin) porosodnak, s a kutya sem tud róluk, vagy ha igen, akkor meg nem fér hozzá mert lehetetlen felhasználói jogok (inkább megkötések), illetve megfizethetetlen díjak párosulnak hozzá.
Minden infrastruktúra sok összetevőből áll. Gondoljunk bele: megnyitjuk a vízcsapot és folyik a víz. Valaki előállította a javakat (ivóvíz) meghatározott előírások (szabványok) alapján (megengedett lebegő anyag tartalom, baktériumok...), megépítette a vezetékeket, s gondoskodik a díj beszedéséről, amelyet világos feltételek alapján szab ki.

És most vonatkoztassunk el! Ugorjunk a megfoghatótól (ivóvíz) az immateriális javak világába! (Elnézést a szóhasználatért, de a mi tudományunknak is van gazdasági oldala...). Próbáljunk talán egy definíciót adni, mi is az a téradat infrastruktúra? Megmondom őszintén, nekem nagyon hiányzott egy definíció az NTIS vitaanyagból. Így aztán átrágtam pár európai példát, s az alábbi dolgot szűrtem le:

Téradat infrastruktúra olyan elvek, egyezmények és műszaki megoldások összessége, amelyek lehetővé teszik a helyhez köthető információhozvaló hozzáférést, azok összekapcsolását és komplex elemzését egy állandó, karbantartott, széles körben (el)ismert és hozzáférhető térbeli alap biztosításával.

Lehet ezen vitatkozni, finomítani, s biztatom a kedves olvasót tegye is meg!

Ha a fenti definíciót alapnak vesszük, adódik is a téradat infrastruktúra lehetséges 4 fő eleme:

  1. Metaadatok
  2. Hálózati szolgáltatások
  3. Adatharmonizáció
  4. Adatok megosztása

Aki ismeri az INSPIRE Direktíva tervezetet annak ez a négy pont biztosan ismerős.

S hogy válaszoljak a címben feltett kérdésre, nos, az adatharmonizáció referenciaként szolgáló specifikációk alapján oldható meg. Mielőtt azonban elkezdenénk magát az adatspecifikációt megvitatni, tisztázni kell a keretfeltételeket is. De ezt inkább az elkövetkező alkalommal tegyük meg .