Pötty lesz a Szépművészetiből

WEB

A Szépművészeti Múzeum hamarosan közzéteszi adatai a szemantikus weben, azaz a LOD cloud diagram függvényében is vizsgálhatjuk.

Horváth Ádám 2015-02-26 12:44
Cikk küldése e-mail:

A Szépművészeti Múzeum célul tűzte ki, hogy a múzeumi gyűjteménye leíró adatait közzéteszi a szemantikus weben. Ez azt jelenti, hogy az alábbi ábrán, amely a LOD cloud diagram (LOD = Linked Open Data – a szemantikus web „másik” neve) címet viseli, hamarosan megjelenik a Szépművészeti Múzeum is egy kis pötty formájában. Egy-egy pötty egy-egy adathalmazt (dataset) jelent, a vonalak pedig azt jelképezik, hogy mely adathalmaz mely másik adathalmazzal van összekötve.

 

 

De mi is az a szemantikus web és miért is jó megjelenni rajta?

A szemantikus web mibenlétét a legjobban a hagyományos webbel összehasonlítva érthetjük meg. A hagyományos web olyan, mint egy dokumentum, azaz szöveget tartalmaz, melyet emberi ésszel kell és lehet értelmezni. A szemantikus web ezzel szemben olyan, mint egy adatbázis, azaz adatokat tartalmaz, melyeket akár géppel is értelmezhetünk. Hogy ezt jobban megértsük, nézzünk egy példát: egy mű leírását a Yale Centre for British Art online katalógusából (http://collections.britishart.yale.edu/vufind/Record/3646000):

 

 

 

A leírásból kiolvasható a mű mérete: „4 × 5 7/8 inches (10.2 x 14.9cm)”. Ezeket az adatokat kizárólag az emberi értelem képes értelmezi. Mi, emberek például tudjuk, hogy noha nincs jelezve, a „10.2” karaktersorozat valószínűleg centimétert jelent, a „4” pedig inchet. De még emberi értelemmel sem lehet felfejteni, hogy a „10.2” karaktersorozat a mű magasságára vagy a szélességére utaló érték-e?

Ezzel szemben a szemantikus weben mindez jól definiált. A Yale Centre for British Art közétette a leírást szemantikus formában is. Íme, a méretadatok ebben a formában (http://collection.britishart.yale.edu/id/page/object/8052/measurement/1/height):

 

Property

Value

?:P2_has_type

is ?:P40_observed_dimension of

is ?:P43_has_dimension of

?:P90_has_value

  • 10.2 ()

?:P91_has_unit

?:type

 

Ez a leírás nem emberek számára, hanem gépek számára készült, de még emberi szemmel is kiolvasható, hogy megadja a 8052-es azonosítójú objektum méretadatát, azon belül a magasságot, mely „10.2” és centiméterben kell érteni.

És miért jó, hogy a gépek (programok) is értik ezeket az adatokat? Mert akkor – többek között – válaszolni tudnak arra a kérdésre, hogy mi egy-egy festmény magassága. De van ennél fontosabb következmény is. A gépek az adatokból kiindulva akár következtetéseket is le tudnak vonni. Tegyük fel, hogy a szemantikus weben valaki azt állítja, hogy Van Gogh posztimpresszionista festő. Tegyük fel, hogy valaki más meg azt állítja, hogy a Napraforgókat Van Gogh festette. Egy olyan kérdésre, hogy melyek a posztimpresszionista festmények, a Napraforgók is találat lesz a szemantikus weben, mert a gépek ki tudják következtetni, hogy ha Van Gogh posztimpresszionista festő, akkor a műve posztimpresszionista festmény.

A hagyományos webhez hasonlóan, melynek nyelve a HTML – bárki, aki publikál a weben, ezt a nyelvet használja –, a szemantikus web is saját nyelvvel rendelkezik. A szemantikus web nyelve az RDF (Resource Description Framework), amely szintén szektorsemleges nyelv. Bárki, aki publikál a szemantikus weben, RDF nyelven teszi. Ez azt jelenti, hogy az RDF nyelv ismeretében bármilyen adatot: múzeumit, könyvtárit, önkormányzatit, adattárit, sportot, hogy csak néhány, a szemantikus weben jól reprezentált terültet említsek, egyként fel lehet dolgozni.

RDF nyelven alanyt, állítmányt és tárgyat tartalmazó állításokat publikálunk a szemantikus weben. Például ilyeneket: a 8052-es azonosítóval rendelkező mű magassága 10.2. A 10.2 mértékegysége centiméter. És így tovább. Az állítmányok bizonyos szótárakból származnak. Ilyen jól ismert, általánosan használt szótár a Dublin Core (DC), melynek segítségével meg lehet fogalmazni, hogy ki egy mű szerzője, mi a mű címe, mikor adták ki stb.

Nagyon sok RDF-szótár van, ezek a való világ dolgainak más és más szeletét írják le. Mondanivalónk kifejtéséhez, azaz például egy múzeumi tárgy leírásához több szótárt is fel lehet használni. Közgyűjteményi vonatkozásban kiemelt szerepe van az FRBRoo (Functional Requirements for Bibliographic Records, Object Oriented Model) szótárnak. Ez a szótár a múzeumi és a könyvtári szabványosítás közös gyermeke, mely a múzeumi CIDOC-CRM (International Committee on Documentation – Conceptual Reference Model) és a könyvtári FRBRer (Functional Requirements for Bibliographic Records, Entity Relationship Model) szabványok harmonizációjával jött létre, így mind múzeumi, mind könyvtári tárgyak leírásához tartalmaz megfelelő szavakat. Azonban, mivel még ez a szótár sem tartalmazza minden aspektusát egy leírandó objektumnak, szükség van más szótárak bevonására is. Ilyen szótár például a wgs84, mellyel egy-egy tárgy koordinátáit, vagy az skos, mellyel tárgyszavakat tudunk megadni.

Most, hogy már átvettük, mi is az a szemantikus web, ideje arról is szólni, hogyan is épül a szemantikus web és mit is jelent az adatok publikálása.

A szemantikus web építésében a múzeumoknak, könyvtáraknak és levéltáraknak az a feladatuk, hogy az adataikat átkonvertálják RDF állítások sorozatává, állításaikat összekössék mások által közölt állításokkal és elérhetővé tegyék bárki számára. Emellett fontos, hogy tudassák a világgal, hogy az adataik hozzáférhetőek a szemantikus weben.

Az egyik legnehezebb kérdés a konverzió, amit eddig mindenki, aki publikált a szemantikus weben, maga oldott meg valahogy, direkt erre a célra készített, saját fejlesztésű (vagy rendelt) speciális és egyedi szoftverek segítségével. A Szépművészeti Múzeum az adatai konvertálására az ALIADA ingyenes szoftvert fogja használni. Az ALIADA a szemantikus weben való megjelenés minden mozzanatát automatizálja. Inputként LIDO (múzeumi csereformátum), MARC (könyvtári csereformátum) és DC (általános csereformátum) rekordokat fogad. Az inputot FRBRoo (és más, például wgs84, skos, stb.) állításokká konvertálja és elhelyezi egy mindenki által hozzáférhető adatbázisban, az úgynevezett „SPARQL endpointon” keresztül. A SPARQL endpointtal rendelkező adatbázisba való betöltés jelenti azt, hogy a múzeum adatai megjelentek a szemantikus weben. A folyamat befejező mozzanata, hogy az ALIADA szoftver automatikusan regisztrálja az így létrejött adathalmazt az Open Knowledge Foundation által létrehozott Datahub (http://datahub.io) adatbázisban. (A cikk elején említett „LOD cloud” diagram ebből az adatbázisból készül.) A folyamat fontos része, hogy a keletkezett állításokat az ALIADA szoftver – szintén automatikusan – összeköti más állításokkal: például a DBpedia (a Wikipedia szemantikus webes párja) és a VIAF (Virtual International Authority File) állításaival, ezáltal beleszőve a Szépművészeti Múzeum adatait a világméretű szemantikus adathálóba.

Az ALIADA nem csak egy szoftver, hanem egy, az Európai Unió által finanszírozott projekt neve is. A projekt célja, hogy létrehozza az ALIADA nyílt forráskódú szoftvert, mellyel a múzeumok és a könyvtárak automatikusan publikálhatják adataikat a szemantikus weben. A Szépművészeti Múzeumnak, mint projektpartnernek, lehetősége nyílik arra, hogy befolyást gyakoroljon a fejlesztőkre, hogy a szoftver minél inkább megfeleljen a múzeum céljainak. A Szépművészeti Múzeum mellett egy spanyol múzeum, az Artium (http://www.artium.org/) vesz még részt a projektben, mint adatgazda és tesztelő. A fejlesztést egy olasz cég, az @Cult (http://www.atcult.it) és két spanyol cég, a Technalia (http://www.tecnalia.com) és a Scanbit (http://www.scanbit.net) végzi. Az @Cult és a Scanbit könyvtári integrált rendszereket fejlesztő cégek, míg a Technalia Európa egyik legnagyobb kutatás-fejlesztési cége. A projekt által fejlesztett ALIADA „végső” verziója 2015 végére készül el, viszont az első tesztelhető prototípus már elérhető és telepíthető innen: https://github.com/ALIADA/aliada-tool/.

A múzeumok számára a konverziós rész már teljes egészében elkészült. Érdemes letölteni és használatba venni, hiszen a fejlesztés ideje alatt nagyobb az esély, hogy a saját igényeinket, kifogásainkat a fejlesztők még figyelembe vegyék. Az ALIADA segítségével bárki, aki képes LIDO, MARC vagy DC metaadatokat előállítani az általa használt rendszerből, megjelenítheti az adatait a szemantikus weben. Ez azt jelenti, hogy gyakorlatilag minden könyvtár (hiszen a könyvtári rendszerek mindegyike tud MARC formátumot előállítani) és többek között a HUNTÉKA-t, The Museum Systemet, vagy Museumplust használó múzeumok gond nélkül tudják alkalmazni az ALIADA-t.

Mi előnye származik mindebből a Szépművészeti Múzeumnak? Nem elhanyagolható szempont, hogy részt vehet valami újnak, a Tim Berners Lee által megálmodott szemantikus webnek, a létrehozásában. (Tim Berners Lee álmodta meg a hagyományos webet is.) Valami újnak a létrehozása kockázatos, de nagyon szép tevékenység: lehetőség nyílik annak a dolognak a mély és beható megismerésére, adott esetben az alakítására is.

A szemantikus web révén a Szépművészeti Múzeum adataihoz még szélesebb körben lehet majd hozzáférni, mint eddig, ráadásul egzakt módon, úgy hogy minden adat kellően definiálva lesz. Ezzel a lépéssel a Szépművészeti Múzeum jelentősen hozzájárul a közvagyon gyarapításához.

Az ALIADA szoftver segítségével a múzeum könyvtárának adatait is publikálni lehet, és mivel mindkét adattípus FRBRoo formátumra konvertálódik, megteremtődik annak a lehetősége is, hogy a két gyűjtemény anyagában együtt lehessen majd keresni.

További lehetőség, hogy az online katalógusban a felhasználók számára extra információkat lehet majd nyújtani, az ALIADA szoftver azon funkciója révén, hogy a publikált adatokat összeköti más adathalmazok adataival (például a már említett DBpedia adataival). Ezeket az adatokat felhasználva arra is lehetőség nyílik például, hogy a hagyományos weben megjelenő katalógusban a művész nevétől egyetlen kattintással el lehet jutni a művész életrajzáig vagy meg lehet mutatni a mű keletkezési helyét és egyéb földrajzi vonatkozásait egy térképen.

Végül, de nem utolsó sorban a Szépművészeti Múzeum neve hamarosan felkerülhet a szemantikus webet építő olyan úttörők mellé, mint a Getty, a Smithsonian, a British Museum vagy a Yale Center for British Art. Hazai vonatkozásban pedig az Országos Széchényi Könyvtár után, a Szépművészeti Múzeum lehet a második közintézmény és az első múzeum, mely az anyagát publikálja a szemantikus weben.

Akadálymentes-e a web?

SZEMTELENÜL

Biztosan mindenki hallotta már azt a frázist, hogy „a világháló mindenkié”. De belegondolt-e már abba, hogy ez valóban igaz-e?

2014. szeptember 09. Árpádházy-Godó Csaba

A mindent átölelő digitalizáció

MUZEUM@DIGIT

A MUZEUM@DIGIT konferencia: milyen folyamatok érzékelhetők itthon és a nagyvilágban a digitalizáció területén?

2013. június 06. Molnár Dániel

Múzeumok Dániában

BESZÁMOLÓ

Az NKA támogatásával májusban múzeumokat látogathattam meg Dániában, és találkozhattam a Dániai Múzeumok Szövetségének igazgatójával, Nils M. Jensen úrral, aki átfogó képet adott a múzeumok jelenlegi...

2013. december 12. Kiss Imre
 
Az Erimtan Múzeum Ankarában
 
Baselitz. Újrajátszott múlt
    Muzeumok.hu Rss betöltése...