digitalizálás;Biszak Sándor;Arcanum Adatbázis;sajtótörténet;

- Közkincsmentés gyűjtőszenvedélyből – Interjú Biszak Sándorral, az Arcanum ügyvezetőjével

Az idősebb nemzedék jól emlékszik, mennyit bámulta ifjúkorában az újságosbódék kínálatát. Az iskolában az úttörőmozgalom a Pajtás újságot kínálta neki, de inkább a Képes Sportot, a Labdarúgást, a Film Színház Muzsikát vagy éppen az Ez a Divatot kedvelte. Reggel akár négy napilap is ott hevert az asztalon. Az Arcanum digitális adatbázisának weboldalán ma már szinte az összes, Magyarországon valamikor kiadott lap, folyóirat megtekinthető, olvasható és kereshető. Lehet fejest ugrani a múltba, fellapozni egy ősi képregényt, karikatúrát, sporteseményt, esszét, tanulmányt. A szédítő, továbbra is egyre bővülő gyűjtemény létrehozásához nem kellett túlzottan sok idő, sem állami támogatás. De akkor hogyan lehetett elérni egy ilyen impozáns eredményt? Erről is kérdeztük Biszak Sándort, az Arcanum ügyvezető igazgatóját.

– Bevallom, mindig az volt a meggyőződésem, hogy az Arcanum egy állami projekt. Hiszen például akkora digi­talizált sajtótára van, amely nemzeti könyvtárakat idéz. Ki gondolná, hogy ezt egy magánvállalkozás hozta össze?

– Amely ráadásul egy családi cég. Az Arcanum még 1989-90 táján alakult. Előtte egy szabadalmi adatbázissal kezdődött az egész. Még flopilemezen adtuk ki az első termékeinket. Utána adatbázis-CD-ket csináltunk, majd úgy 15 év után kiderült, az embereknek minden kell. Nem érik be egy adatbázisos verstárral vagy összehasonlítható Biblia-fordításokkal. Ekkor találtunk rá a folyóiratokra. Először a tudományos lapokat dolgoztuk fel. A Századok volt a legelső. Aztán jött a Vasárnapi Újság. De az igazi áttörést az jelentette, amikor a Népszava archívumát sikerült megszerezni egy afféle lomtalanítás során.

– Ezek szerint távlati koncepció nélkül vágtak bele az egészbe?

– Én vegyészként végeztem az ELTE-n 1983-ban, de kiderült, hogy ezen a területen nem igazán jók a képességeim. A Kőbányai Gyógyszergyár könyvtárába kerültem, ahol egészen fantasztikus világ tárult elém. Egy kezdetleges számítógépes rendszerrel rengeteg hellyel léptem kapcsolatba, kaptam az információkat a tudományos élet megannyi területéről. Így segítettem kutatásokat. A nyolcvanas évek közepén elcsábítottak egy kisszövetkezetbe. Adatbázisokkal foglalkoztam, az elsőt, a már említett szabadalmi adatbázist épp a gyógyszergyárral közösen csináltuk meg. Aztán a 90-es évek elején megjelent a CD-ROM, 640 megabyte, hihetetlen volt, kitárult a világ. Jöhetett az 5 megabyte-os Biblia-kiadvány.

– De ez már nem csupán adatbázis. A digitalizált eredeti anyagot meg is kell jeleníteni.

– Igen, a Biblia már ilyen volt. Akkor még magunk elé tettük, legépeltük, korrektúráztuk az átiratot. Még nem tudtunk eredeti formában megjeleníteni szöveget. De volt már egy remek programunk teljes szövegkeresésre. Meg lehetett például tudni, egy motívum hányszor, hol fordul elő. És össze tudtuk vele hasonlítani a magyar Biblia-fordításokat is. Öt flopin fért el az anyag, majd fölkerült CD-re.

– Valamelyik egyháztól érkezett a megbízás?

– Nem. Egyszerűen keresgéltük, mire lehet igény. A Biblia feldolgozása egyértelműnek tűnt, nagy siker is lett. A Jehova Tanúi felekezet támogatta úgy 50 ezer forinttal, de az egyházakat nem nagyon érdekelte a dolog. Utána megcsináltuk a Verstárat, először 25, majd 50 költő életművével. Majd az évek során elkészült vagy 300 CD, köztük Mikszáth-, Jókai-összes, a Pallas nagy lexikona és más enciklopédiák. Ezzel párhuzamosan pedig különféle megbízásokat teljesítünk, volt közös projektünk az Országos Széchényi Könyvtárral, múzeumokkal, a Magyar Nemzeti Levéltárral, a Hungaricana rendszerben okleveleket, a Királyi Könyveket, iratgyűjteményeket, kép­anyagokat digitalizáltunk. Ezek is megtalálhatók ma a weboldalunkon.

– Hogyan jutottak el újra az újságokig, folyóiratokig?

– Egyre kevesebb volt a megbízásos munka, másrészt pedig látszott, a CD-formátum nem megy tovább, új technológiát és profilt kell keresni. Akkoriban, úgy a 2000-es évek végén indult a Google Books, az a technológia, hogy kétrétegű pdf-et csinálunk, felül van a kép, alul a program által felismert szöveg. Így óriási mennyiségű anyagot lehet digitalizálni.

A Google szkenneléseit látva, úgy gondoltam, ez a magasság megugorható. Tudományos folyóiratokkal kezdtünk, de amikor a Politikatörténeti Intézetnek köszönhetően teljes duplumhoz jutottunk a Népszavából, a kísérletezések során kiderült, ha oldalakra bontjuk az újságot, lapadagoló szkennerrel elképesztő teljesítményt lehet elérni. 

És ráálltunk az újságokra. Nem volt kétséges, hogy erre a gyűjteményre óriási lesz az igény, hiszen az újságokhoz, hetilapokhoz az emberek élete, családjuk története kapcsolódik. Egy jazzkutató meg például szövegkeresés után találhat forrást arról, hogy mondjuk egy nyíregyházi tűzoltóbálon, 1938-ban milyen ragtime-zenekar játszott.

Amennyiben az Orbán-kormány egy közepes tehetségű, de nagy dumás bankrabló (az), aki a sűrű, sötét fél­ázsiai (és egészen balkáni) éjszakában kirámolta a széfet, és ez annyira simán ment, hogy a végén már kokaint szívott a túszok hátáról, akkor ez most a hajnali kijózanodás ideje.