Hungaricana bemutató a Kisplenáris ülésen
A könyvtáros vándorgyűlések visszatérő szokása, hogy a 2. nap reggelén kisplenáris ülésre kerül sor. Így volt ez Szolnokon is. Dr. Redl Károly az MKE alelnökének moderálása mellett került sor a Hungaricana Közgyűjteményi Portál bemutatására. A bemutatót Markója Szilárd, az Országgyűlési Könyvtár igazgatója, Dr. Kenyeres István, a Budapest Főváros Levéltár Főigazgatója és Biszak Sándor, az Arcanum Adatbázis Kiadó ügyvezető igazgatója tartották.
Az első előadó Markója Szilárd volt, aki általában beszélt a portálról. A Hungaricana portál három közgyűjteményi terület, a könyvtárak, a levéltárak és a múzeumok együttműködésével jött létre. Mindig gondolkodtak azon, hogy a közgyűjteményi tartalmakat közös felületen kell elhelyezni és erre egy közös keresőt építeni. Mindhárom szakma metaadat struktúrája más, financiális gondjaik vannak, nem szívesen osztják meg az adataikat. Kenyeres Istvánnal beszélgetve arra jutottak, hogy az utóbbi években a Nemzeti Kulturális Alap pályázati pénzeinek felhasználásával (kb. 100 millió Ft.) digitalizált közgyűjteményi tartalmakat kellene egy közös felületen elhelyezni. Az NKA Közgyűjteményi Kollégiuma a közös felület létrehozására pályázatot írt ki, amely pályázatot 2014-ben az Országgyűlési Könyvtár nyerte meg és az Arcanum Kft. lett a technikai végrehajtó. Erről az adatbázisról lesz most szó.
A portálnál a legegyszerűbb felépítést választották. Három funkciója van: közös keresés, egységesen felépített adatbázisok, hírek, beszámolók. Lehetséges az intézmények saját adataira keresni és összintézményi keresést is lehet választani. Jelenleg 150 intézmény összes elektronikus tartalma megtalálható a portálon. A Hungaricana elődjének tekinthető Magyar Levéltári Portálon 5 millió oldalt, 4-5 millió képet és 5-6 millió bibliográfiai adatot helyeztek el. Az oldal- és a képszám ezen az új felületen megduplázódott. Az összes tartalom 40 Terabájtot tesz ki. Többféle dokumentumtípust (XML, PDF, metaadatok) tud egyszerre kezelni a portál. A RMK összes kötete megtalálható a portálon. A működtetés során fontos a minőségbiztosítás. Az Országgyűlési Könyvtár a könyvtári, a BFL a levéltári tartalmaknál lát el aggregátori szerepet. A múzeumoknál most keresik azt az intézményt, amelyik majd ellátja ezt a feladatot. Ezzel ki fog teljesedni a szerkesztőség, akik meghatározzák a további fejlesztéseket és döntenek a bekerülő tartalmakról. A Hungaricana Facebook oldallal és hírlevéllel is rendelkezik. Folyamatos a bővülés, már NKA pályázattal digitalizált tartalmakon kívüli adatok is felkerülnek. A portálnak köszönhetően naprakészebb, életszerűbb lett a közgyűjteményi területek együttműködése. Végül az előadó több adatbázist (Budapesti lakcímjegyzék, képeslapgyűjtemények, országgyűlési dokumentumok, Kitaibel Pál herbáriuma) emelt ki, hogy felvillantsa azt a tartalmi gazdagságot, amely a Hungaricánán található.
Kenyeres István a Hungaricana levéltári tartalmairól beszélt. Miért a Fővárosi Levéltár lett az aggregátor ebben a projektben? Néhány éve a kulturális tárca a BFL-t bízta meg azzal, hogy hozza létre a Magyar Levéltári Portált, így már kicsiben eljátszották azt a szerepet, amit most nagyban játszanak. A MLP 2007-ben indult. 27 levéltár vett benne részt. 1,5 millió eredeti levéltári irat, 3,17 millió levéltári rekord és 2,8 millió oldalnyi digitális kép került fel arra a portálra.
A Hungaricana egyik nagy adatbázisa a kétrétegű Pdf dokumentumokat mutatja be. Ilyen dokumentumok a levéltári kiadványok (560 ezer oldal), a Magyar Levéltári Portálon is megtalálható MDP/MSZMP iratok (540 ezer oldal) és Budapest Székesfőváros Közgyűlésének iratai is.
A rendszerben önálló alkalmazás, a levéltári iratgyűjtemény alkalmazás. Ilyen a MLP-n is volt, onnan vették át. Az iratgyűjtemények ugyanolyan típusú dokumentumokat mutatnak be. A BFL-ből közjegyzői, árvaszéki és peres iratok kerültek fel. Vármegyei jegyzőkönyvek, Buda Városi Tanács jegyzőkönyvei, Pest Városi Tanács jegyzőkönyvei, tervtárak és a teljes Ybl hagyaték megtalálható itt. A Bécsi Levéltári Kirendeltség segédletei is ide kerültek.
Nagyon fontosak a térképek. Ez önálló részben lett elhelyezve. Különféle közgyűjteményekből kerültek ide térképek. Ahogy Kenyeres István fogalmazott, a kutatót nem érdekli, hogy hol van a térkép, az érdekli, van-e térkép és az mit ábrázol. A különféle projektek eredményeit egy portálon tudták elhelyezni. Georeferált térképek is vannak itt. Az Arcanum kezdeményezte a MAPIRE projektet, amely projekt a projektben. Ez a Habsburg Birodalom történeti térképeit mutatja be. Az Osztrák Állami Levéltár, a Magyar Nemzeti Levéltár, Budapest Főváros Levéltára, a HM Hadtörténeti Intézet és Múzeum, a Horvát Nemzeti Levéltár, a Kárpátaljai Területi Levéltár és az Arcanum Kft. vett ebben részt. A tudományos hátteret az ELTE Geofizikai és Űrtudományi Tanszéke biztosította. Az Osztrák Nemzeti Levéltár tette fel ide a Habsburg Birodalom 3 katonai felmérését. A Kárpátaljai kataszteri térképek digitalizálása a beregszászi levéltárban található XIX. századi térképek állapota miatt volt fontos.
Végül a közös keresésről esett szó. Minden adatbázisban egyszerre történik a keresés. Nagyon gyors a kereső. Lehet szűkíteni. Az egyszerű és összetett keresés is működik. Vannak logikai operátorok is.
A Hungaricana Közgyűjteményi Portál technológiai hátteréről Biszak Péter beszélt. A Hungaricánán háromféle adattípus található. Metaadatok MARC, EAD, XML, Access formátumban, teljes szövegű adatbázisok kétrétegű Pdf formátumban és georeferált térképek. A georeferálás azt jelenti, hogy minden térképpixelt GPS koordinátával látnak el. A GPS koordináták alapján a térképeket Google vagy egyéb mai térképpel össze lehet hasonlítani. Az adatbáziskezelő az, amit 25 éve fejlesztenek és az Arcanum CD-i, DVD-i ezzel működnek. A kereső az interneten is nagy sebességgel működik. Képmegjelenítő program is található itt. Akár több száz négyzetméteres térkép is kezelhető jó minőségű (nem kontrasztos, jól olvasható, gyorsan nagyítható) képként.
A kétrétegű Pdf-nél kérdés volt, hogy mekkora legyen a Pdf mérete. Ha túl nagy, akkor lassú a letöltés. Adott Pdf-ben is végezhető keresés. A Hungaricánából 25 oldal tölthető le egyszerre. Ezután a kétrétegű digitalizálásról ejtett néhány szót. Példaként a most digitalizált Népszavát mutatta be. A Népszava összes számát 5 könyvtárból gyűjtötték össze. 150 lapszám már sehol nem volt megtalálható. A teljes Népszava mintegy 450 ezer oldalból áll. A felhasználó teljes szövegben szeretne keresni, ami automatikus szövegfelismeréssel lehetséges. A felismerés minősége a szöveg nyomtatásminőségétől függ. A napilapoknál a szövegfelismerés aránya 98-99 %-os. Ez azt jelenti, hogy egy oldalon 150 karakterhiba található. Erről ne feledkezzünk meg. A két réteg a következőképpen néz ki. Felül a kép, alatta tizedmilliméter pontossággal a szöveg található. Ez teszi lehetővé, hogy a szövegben mindenre lehessen keresni.
A MAPIRE-ről is beszélt az előadó. A katonai felmérések házszintű térképezést jelentettek. 1:28800 méretarányú térképekről van szó. A Googlenak sincs ilyen régi, részletes térképe. Az Arcanumnak szerencséje volt, a HM Hadtörténeti Levéltár beprotezsálta őket az Osztrák Levéltárba. A budapesti térképek (32 db.) tervszinten mutatják a város különböző állapotait 1750-től 1940-ig. Fontos, hogy az adatokat térképre lehet helyezni.
A digitalizálási munkák során egyre inkább a teljességre lehet törekedni. Már vannak helyek ahol mindent digitalizáltak. Ilyen pl. a Szabadalmi Hivatal. De az 1526 előtti oklevelek is mind digitalizálva vannak.
Horváth Tamás,
Országos Mezőgazdasági Könyvtár és Dokumentációs Központ,
az MKE Mezőgazdasági Szekciójának elnöke